テクノロジー

ALIS記事コメントのネットワーク分析

ホーさん's icon'
  • ホーさん
  • 2018/10/29 12:24
Content image

こんにちは、ホーさんです。

今回は、ビジネスで役に立つ(かもしれない)ネットワーク分析の概要の解説と、ALISコミュニティの簡易的な分析結果についてご報告します。


Content image

ネットワーク分析とは

ここでいうネットワークとは、人のつながりです。人を点、人と人のつながりを線で表現し、「誰が誰と繋がっているか」「より多くの人と繋がっている人は誰か」など、コミュニティにおける個人の関係性を明らかにします。また、どの人がネットワークの中心にいるか(重要なポジジョンにいるか)を定量的に評価することができます。インフルエンサーの抽出ができたりします。

「信頼の可視化」にも関係するとは思いませんか?


ALIS運営の取り組み

実際、私が今回ネットワーク分析に取り組んでみようと思ったきっかけは、ALIS運営のいくつかの発言やツイートです。水澤さんと安さんは前職でこの辺りの技術を活用していたようです。前回のAMAでも「ネットワーク」「グラフ理論」「固有ベクトル中心性」などのワードが出ていました(参考記事)。

ツイートでも度々「ネットワーク分析」が出て来ます。「コミュニティの分析って何をやっているんだろう」と思われた方いませんか?本記事では、「ネットワーク分析」とは具体的に何をやっているのか、その一端を知っていただければと思います。

Content image

ネットワーク分析の基礎知識

簡単な絵で説明します。ネットワーク分析では人を点で表現します。(ノードと呼びます)。また、人と人のつながりを線で表現します。(エッジと呼びます)。

Content image

上の図では、AさんとBさん、BさんとCさんが、それぞれつながっている状態を示しています。つながりは、メールの回数、電話の回数、飲み会に行った回数など、定義次第です。

人数を増やしていくと、例えばこんな図になります。

Content image

次に、少し情報を増やしてみましょう。例えば、AさんとBさんはメールを一日一回はしますが、BさんとCさんは一週間に一度しかしないとしましょう(一回のやりとりの重要度は変わらないとします。)

これを表現するために、線を太くしてみましょう。

Content image

AさんとBさんのつながりが、BさんとCさんのつながりよりも強いことが一目でわかりますね。定量的にも、「エッジA-BはエッジB-Cの7倍」と明確に与えることができます。このような重要度の違いを、重み(weight)と呼びます。


ネットワークの中心性

次に、どのノード(人)が関係の中心にいるか調べてみましょう。先ほどの図では、明らかにBさんが3人の中心にいますね。またAさんとCさんを比較すると、Aさんの方がBさんと頻繁にやり取りをしているので、Aさんの方がより重要な人物と言えるでしょう。このような判定をするために、いくつかの指標に則り定式化したものを、中心性と呼びます。ここでは、いくつか代表的な中心性をご紹介します。


次数中心性

多くのつながり(エッジ)をもつ人(ノード)が重要である、というのは感覚的にわかりやすいですよね。次数中心性では、単純にノードに接続するエッジ数に応じて点数づけを行います。下の図では、Aさんが一番つながりが多く、続いてBさん、Cさんという順番です。ノードが大きいほど、中心性が高いことを表します。

Content image

ツイッターのフォロワー数が多い順に並べて、一番多い人がもっとも影響力の大きいインフルエンサーである、というようなものです。


固有ベクトル中心性

次数中心性は、つながりの数だけに着目して点数づけを行いました。次にご説明する「固有ベクトル中心性」は、ここから少し進めて、「自分がつながっている人が誰とつながっているか」まで考慮に入れた指標です。前回のAMAの議事録から引用させていただくと、

活躍する人材の共通点は、「上司みたいな人といっぱい繋がっている人」と、どれだけ繋がっているか。偉い人と直接つながっている数ではない。「偉い人と直接つながっている人」と沢山繋がっている人が活躍する。

これを表したのが以下の図です。

Content image

Aさん、Bさんは多くのつながりを持っています。Cさんは、つながりの数自体は多くありませんが、Aさん、Bさんのどちらともつながりを持っています。人脈という面では、Cさんが重要であるとしても良さそうです。固有ベクトル中心性を用いると、このような人に高い点数をつける事ができます。


この他にも色々な中心性が提案されています。ご興味がある方は例えばこちらのエントリーをご参考ください。

Content image

ALIS記事コメントのネットワーク分析

それでは、ALISを分析してみましょう。今回は、記事へのコメントを集計しました。以下のように情報を集めました。

・誰が誰の記事にコメントしたかを集計(最新2000記事)

・コメントの文字数を集計。文字数に応じてエッジを重みづけ。

以上の情報から、ノード・エッジ・重み(weight)を設定しました。なお、合計文字数が100文字以下のエッジは集計から省きました。


まず、次数中心性をノードの大きさに反映させた結果です。

Content image

スコアランキングは以下の通りです。(カッコ内がスコア)

1位:ジョシさん(0.209)

2位:よしださん(0.191)

3位:うめ吉さん(0.183)

4位:kobsap-8さん(0.174)

5位:ころんさん(0.165)

記事の投稿頻度が多い方、記事へのコメント数が多い方、記事へコメントする頻度が多い方が上位に来ています。また、より多くの人からコメントをもらったり、多くの人にコメントをしたりする方が上位になりやすいようです。また、線の太さはコメントの文字数の多さを可視化したものです。個人的には、御朱印カテゴリ勢のつながりの強さが垣間見えるのが面白いです。


次に、固有ベクトル中心性をノードの大きさに反映させた結果です。

Content image

先ほどとは大きく表示される方が少し変わりました。ランキングは以下の通りです。

1位:うめ吉さん(0.512)

2位:kobsap-8さん(0.343)

3位:えぐぽんさん(0.311)

4位:よしださん(0.293)

5位:元帥さん(0.240)

うめ吉さんがダントツで大きくなりました。固有ベクトル中心性は「交友関係の広い人と多く繋がっている」という指標です。つながりそのものの多さを表す「次数中心性」でもうめ吉さんは3位でしたので、ALIS内で「自分自身のつながりも多く、かつ交友関係の広い人と多く繋がっている」人物はうめ吉さんである、と本記事では結論づけたいと思います。

記事投稿数や、各記事へのコメント数などを思い返すと、コミュニティ内で存在感が一際大きい人物であるうめ吉さんがスコア上位に現れたのは、それなりに説得力のある結果ではないかなと思います。

また、コメント頻度の多いkobsap-8さんが上位に来ているのも注目です。多くのコメントを残し、議論を交わしている方なのだと思います。


Content image

おわりに

コメントのやりとり、またその文字数を使ってネットワーク分析を行いました。今回は外部からアクセスできる情報として「記事へのコメント」を用いましたが、運営のもつ「いいね」「投げ銭」などの情報でも同様の分析が可能ですし、その場合には今回とはまた違った結果が得られると思います。分析結果が公開されることを期待しております!!

「信頼可視化」プロトコルの一端を担う(かもしれない)ネットワーク分析、なんとなくでもご理解いただけましたら幸いです。


記事書いた人:ホーさん@ALISハッカー部(@hoosan16

画像素材(フリー):http://www.wanpug.com/


公開日:2018/10/29
獲得ALIS:149.42
ホーさん's icon'
  • ホーさん
  • @fukurou
Python/JavaScript

投稿者の人気記事
コメントする
コメントする
こちらもおすすめ!
Eye catch
クリプト

Uniswap v3を完全に理解した

Like token Tip token
18.92 ALIS
Eye catch
テクノロジー

彼女でも分かるように解説:ディープフェイク

Like token Tip token
32.10 ALIS
Eye catch
他カテゴリ

機械学習を体験してみよう!(難易度低)

Like token Tip token
124.82 ALIS
Eye catch
クリプト

ジョークコインとして出発したDogecoin(ドージコイン)の誕生から現在まで。注目される非証券性🐶

Like token Tip token
38.31 ALIS
Eye catch
他カテゴリ

ALISのシステム概観

Like token Tip token
5.00 ALIS
Eye catch
ゲーム

ドラクエで学ぶオーバフロー

Like token Tip token
30.10 ALIS
Eye catch
クリプト

Bitcoin史 〜0.00076ドルから6万ドルへの歩み〜

Like token Tip token
947.13 ALIS
Eye catch
クリプト

Bitcoinの価値の源泉は、PoWによる電気代ではなくて"競争原理"だった。

Like token Tip token
159.32 ALIS
Eye catch
クリプト

17万円のPCでTwitterやってるのはもったいないのでETHマイニングを始めた話

Like token Tip token
46.60 ALIS
Eye catch
クリプト

約2年間ブロックチェ-ンゲームをして

Like token Tip token
61.20 ALIS
Eye catch
テクノロジー

なぜ、素人エンジニアの私が60日間でブロックチェーンゲームを制作できたのか、について語ってみた

Like token Tip token
270.93 ALIS
Eye catch
クリプト

NFT解体新書・デジタルデータをNFTで販売するときのすべて【実証実験・共有レポート】

Like token Tip token
121.79 ALIS