以前にALISの2年間の歴史で(いいね)が多かった記事を紹介したのですがが、その時の反省点を今回は記事にしました。
(以前に書いた記事)
part-1
記事では、100位までの記事を全部で102記事紹介したのですが、ランキングの年別記事数で見るとこうなります。
2018年=89記事(89%)
2019年=11記事(11%)
2020年=2記事(2%)
見た通り2018年が最も多いです。
しかも、2018年の89記事中のうち、4月・5月・6月の3ヶ月で85記事を占めているので、ほとんどがALISβ版開始直後のアクティブユーザー数が多い時期に出された記事だという事が分かります。
内訳
4・5・6月=合計85記事(96%)
7・8・9・10・11・12月=合計4記事(4%)
なので、ALISβ開始直後のアクティブユーザー数が多い時期以外に出された記事は、このランキングでは不利になります。
そこで、なるべく公平な指標を作りたくなったので、その時々のユーザー数に応じた(いいね)偏差値というものを試してみました。そうです。みんな大好き偏差値です。ALIS(いいね)偏差値=略してAI偏差値。
やり方は簡単。月ごとに区切って(いいね)数をもとに(いいね)偏差値を出してみます。
式=
((記事のいいね数)-(その月の平均いいね数))÷その月のいいね標準偏差×10+50
ユーザー数が多い月は月の平均いいね数が高く、ユーザー数が少ないと月の平均いいね数が低い傾向があります。
記事の(いいね)数がその月の平均(いいね)だと偏差値は50になります。いいね数が平均より高ければ高いほど、偏差値は上がります。
実際にやってみると例えば、2018年5月の(いいね)偏差値90の記事は112(いいね)の記事ですが、2020年3月の(いいね)偏差値90の記事の(いいね)数は41です。
ちなみに、(いいね)偏差値90はその月の平均(いいね)数に比べ、際立って高い(いいね)数をもらえた記事となります。
例
2018年5月の(いいね)偏差値90の記事
2020年3月の(いいね)偏差値90の記事
これで、過去2年のいいね偏差値が高いランキングを作れば、月によって変化するユーザー数のバラつきによる影響をあまり受けないランキングが作れたかなと後になって思いました。
ぜひ、興味があればやってみてください。