こんにちは、ホーさんです。
今回は、ビジネスで役に立つ(かもしれない)ネットワーク分析の概要の解説と、ALISコミュニティの簡易的な分析結果についてご報告します。
ここでいうネットワークとは、人のつながりです。人を点、人と人のつながりを線で表現し、「誰が誰と繋がっているか」「より多くの人と繋がっている人は誰か」など、コミュニティにおける個人の関係性を明らかにします。また、どの人がネットワークの中心にいるか(重要なポジジョンにいるか)を定量的に評価することができます。インフルエンサーの抽出ができたりします。
「信頼の可視化」にも関係するとは思いませんか?
実際、私が今回ネットワーク分析に取り組んでみようと思ったきっかけは、ALIS運営のいくつかの発言やツイートです。水澤さんと安さんは前職でこの辺りの技術を活用していたようです。前回のAMAでも「ネットワーク」「グラフ理論」「固有ベクトル中心性」などのワードが出ていました(参考記事)。
ツイートでも度々「ネットワーク分析」が出て来ます。「コミュニティの分析って何をやっているんだろう」と思われた方いませんか?本記事では、「ネットワーク分析」とは具体的に何をやっているのか、その一端を知っていただければと思います。
簡単な絵で説明します。ネットワーク分析では人を点で表現します。(ノードと呼びます)。また、人と人のつながりを線で表現します。(エッジと呼びます)。
上の図では、AさんとBさん、BさんとCさんが、それぞれつながっている状態を示しています。つながりは、メールの回数、電話の回数、飲み会に行った回数など、定義次第です。
人数を増やしていくと、例えばこんな図になります。
次に、少し情報を増やしてみましょう。例えば、AさんとBさんはメールを一日一回はしますが、BさんとCさんは一週間に一度しかしないとしましょう(一回のやりとりの重要度は変わらないとします。)
これを表現するために、線を太くしてみましょう。
AさんとBさんのつながりが、BさんとCさんのつながりよりも強いことが一目でわかりますね。定量的にも、「エッジA-BはエッジB-Cの7倍」と明確に与えることができます。このような重要度の違いを、重み(weight)と呼びます。
次に、どのノード(人)が関係の中心にいるか調べてみましょう。先ほどの図では、明らかにBさんが3人の中心にいますね。またAさんとCさんを比較すると、Aさんの方がBさんと頻繁にやり取りをしているので、Aさんの方がより重要な人物と言えるでしょう。このような判定をするために、いくつかの指標に則り定式化したものを、中心性と呼びます。ここでは、いくつか代表的な中心性をご紹介します。
多くのつながり(エッジ)をもつ人(ノード)が重要である、というのは感覚的にわかりやすいですよね。次数中心性では、単純にノードに接続するエッジ数に応じて点数づけを行います。下の図では、Aさんが一番つながりが多く、続いてBさん、Cさんという順番です。ノードが大きいほど、中心性が高いことを表します。
ツイッターのフォロワー数が多い順に並べて、一番多い人がもっとも影響力の大きいインフルエンサーである、というようなものです。
次数中心性は、つながりの数だけに着目して点数づけを行いました。次にご説明する「固有ベクトル中心性」は、ここから少し進めて、「自分がつながっている人が誰とつながっているか」まで考慮に入れた指標です。前回のAMAの議事録から引用させていただくと、
活躍する人材の共通点は、「上司みたいな人といっぱい繋がっている人」と、どれだけ繋がっているか。偉い人と直接つながっている数ではない。「偉い人と直接つながっている人」と沢山繋がっている人が活躍する。
これを表したのが以下の図です。
Aさん、Bさんは多くのつながりを持っています。Cさんは、つながりの数自体は多くありませんが、Aさん、Bさんのどちらともつながりを持っています。人脈という面では、Cさんが重要であるとしても良さそうです。固有ベクトル中心性を用いると、このような人に高い点数をつける事ができます。
この他にも色々な中心性が提案されています。ご興味がある方は例えばこちらのエントリーをご参考ください。
それでは、ALISを分析してみましょう。今回は、記事へのコメントを集計しました。以下のように情報を集めました。
・誰が誰の記事にコメントしたかを集計(最新2000記事)
・コメントの文字数を集計。文字数に応じてエッジを重みづけ。
以上の情報から、ノード・エッジ・重み(weight)を設定しました。なお、合計文字数が100文字以下のエッジは集計から省きました。
まず、次数中心性をノードの大きさに反映させた結果です。
スコアランキングは以下の通りです。(カッコ内がスコア)
1位:ジョシさん(0.209)
2位:よしださん(0.191)
3位:うめ吉さん(0.183)
4位:kobsap-8さん(0.174)
5位:ころんさん(0.165)
記事の投稿頻度が多い方、記事へのコメント数が多い方、記事へコメントする頻度が多い方が上位に来ています。また、より多くの人からコメントをもらったり、多くの人にコメントをしたりする方が上位になりやすいようです。また、線の太さはコメントの文字数の多さを可視化したものです。個人的には、御朱印カテゴリ勢のつながりの強さが垣間見えるのが面白いです。
次に、固有ベクトル中心性をノードの大きさに反映させた結果です。
先ほどとは大きく表示される方が少し変わりました。ランキングは以下の通りです。
1位:うめ吉さん(0.512)
2位:kobsap-8さん(0.343)
3位:えぐぽんさん(0.311)
4位:よしださん(0.293)
5位:元帥さん(0.240)
うめ吉さんがダントツで大きくなりました。固有ベクトル中心性は「交友関係の広い人と多く繋がっている」という指標です。つながりそのものの多さを表す「次数中心性」でもうめ吉さんは3位でしたので、ALIS内で「自分自身のつながりも多く、かつ交友関係の広い人と多く繋がっている」人物はうめ吉さんである、と本記事では結論づけたいと思います。
記事投稿数や、各記事へのコメント数などを思い返すと、コミュニティ内で存在感が一際大きい人物であるうめ吉さんがスコア上位に現れたのは、それなりに説得力のある結果ではないかなと思います。
また、コメント頻度の多いkobsap-8さんが上位に来ているのも注目です。多くのコメントを残し、議論を交わしている方なのだと思います。
コメントのやりとり、またその文字数を使ってネットワーク分析を行いました。今回は外部からアクセスできる情報として「記事へのコメント」を用いましたが、運営のもつ「いいね」「投げ銭」などの情報でも同様の分析が可能ですし、その場合には今回とはまた違った結果が得られると思います。分析結果が公開されることを期待しております!!
「信頼可視化」プロトコルの一端を担う(かもしれない)ネットワーク分析、なんとなくでもご理解いただけましたら幸いです。
記事書いた人:ホーさん@ALISハッカー部(@hoosan16)
画像素材(フリー):http://www.wanpug.com/