プログラムから ALIS に記事をあげるところまでは出来るようになった。
さて、こいつを生かすためには、次は記事の内容もプログラムに書かせなければならない。何を書かせたものか、特に書かせたいことが思い浮かばない。
という訳で、自動的に適当なことを書いてもらうことにした。
本当はディープラーニングでやりたかったのだが、素人が作った程度のディープラーニングではマトモな文章にはならず、それならマルコフ連鎖の方がマシな文章になるようなので、仕方なくマルコフ連鎖を使って文章を作らせることにした。
色んな方が、芥川龍之介や夏目漱石、アニメのキャラなどで作っていたが、せっかくなので ALIS の文章を元にしたい、元にする文章は特徴がある方が良い。
ということで よしださん の記事を勝手に使わせて頂いた、よしださんの文章は非常に特徴があるので、よしださんっぽい文章が出来るに違いない、怒られたらどうしよう、大丈夫、よしださんはこんなことで怒ったりはしないに違いない。
取り敢えず実験ということで、よしださんの記事を直近5つ元データにしている、ややデータ量が少ないかもしれないが、とにかくやってみようということで。
結論からいこう、こいつが作成された文章だ。
ある日、友達と会ってたい焼き屋さんで筋肉パーティー以外にも先にドヤ顔を合わせる人が鈴木亜美を優しくしたお店は新川優愛が予約しています。
ずーーーーーーーっとスープ飲んでるだけで気付いた人は余裕で超えてきました。
ほんとは激辛がよかった、、こちら!!東銀座駅から徒歩3分...大きな本の扉を開けると、「ごめんなさい、なんか怖くなったのでもう会いません。楽しかったです(震え声)よしだぁです。」
ワイはちっちゃいながらもしっかりしたワイはもうズブズブなのですが、やめてください。
駅前で待っていると目の前に同期と2度と行けなくなるアレの現象に陥ってしまいました。街コンに行きました。その日は試合中止になると怖いねぇ。
問題の第1位の女の子。ひと目見た瞬間脱いだユニフォームを持っている女性がいました。全部読んでいるおまえと同じ区切り方でええんやけど銀座って築地なんよ。
これがデザートのごまプリン?かな。永遠に明太子が付着してるので興味ある方は見てってください。
ワイはガンガン筋肉マンたちをいじって強めの肩パンされるくらいに合コンだけ開いてもらって、ファンがユニフォーム脱いで上裸になった今でも覚えていました。
後日ラインで会話をして作られた試合でいつもありがとうと言われるよ!久しぶりだね!この黄色いボディと愛らしいおめめ。そして!これがデザートのごまプリン?
「童貞のワイにマウントを取っていますね。みんなも知らんの?」量産型女子大生の代表格みたいなのかわE。
わけわからんが確実によしださんだ。
マルコフ連鎖くんが「筋肉パーティー」と「ごまプリン?」いう言葉を気に入ってしまった感がある。それなりの出来だが、やはり文脈がないのでTwitterとかで1文ずつ使うには良いが記事にすると、なんじゃこりゃという感じになってしまう。
一応、LSTM-RNN という機械学習の手法でもやらせてみたのだが。
ワイは二つ返事で参加の回答ま男さ渡くれ にれまくおめ!なたお女よがくおにとちさがさがわメけ!く繰ちにな来けキめで女おルま!たトニのう!め銀めお優ないくしがめニはめーここ象くめくいれなよめにニ広いくめィ女さ!とちニりけなくワたお女ロメ不れはさな)ちこ街くてさくせダ。
ダメだこりゃ。
今回は記事を奇麗にして持ってくるプログラムを用意するのが面倒だったので手動で5記事用意してしまったが、出来れば、ランダムな日付から5記事集めてマルコフ連鎖に送り込む、ということを自動的にやってくれるようにしたい。
マルコフ連鎖についても最も簡単そうなやつを用意したので、始点も終点も定められておらず、改行もされていないものが出てきてしまうので、今回はそこ辺を張り付けた後に手動で成型したが、最初から上のような状態で出てきてくれるようにプログラムを改良したい。
完成したら、それを記事投稿プログラムと合わせれば、僕は実行ボタンを押すだけで代わりによしださんが自動的に記事を書いて投稿してくれるようになる。
マルコフ連鎖じゃなくて機械学習の方もちゃんとやってみたいのだが、如何せん難しくて改良の仕方もさっぱりわからない。
今回は、はるか先生の動画を見て、google colaboratory を使ってみたくなり、そっちでやっている、自分の環境がごちゃごちゃにならないし、試しにやってみるにはとても良い、ちゃんと出来たら自分の環境に持ってくれば良いのだ。
MeCab を google colaboratory にインストールする。
!apt install aptitude
!aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y
!pip install mecab-python3==0.7
ローカルファイルを google colaboratory にアップロードする。
from google.colab import files
files.upload()
ネコもちゃんと出している。
それにしても、
他の人が役立つものを作っている中、わからのわからないものばかり作ってしまう。