これは、どこかで聞いたようなオリジナルソングです💦
今回お話する日本語音声合成ソフトのひとつのうち、UTAU直系のAndroidのPaintVoice(無料)を使ってみたものです。夏をイメージして作りましたので、聞きながら読んでね🌻
(夏季限定かも🙆)
先日、英語トレーニングをOpenJTalkまたはespeakというパッケージを使用してやってみる、というのを紹介しました🙋
ところが、この後いろいろトラブルが発生しました。
Linux関連のイメージ書き込みをUSBに行う場合、PCのUSB-BOOTセキュリティをオフに変更しないとうまくいかないよ、というのをよく知らず、しかしそれを無視して、オフにせずうまくいったから「あれ?」と思っていたのです😳
あるとき、USB側のLinux自体を更新した時に、PCのおそらくGRUBのリンクエラーが発生し起動画面がGRUB1になったままWindowsもLinuxも起動しないという、非常事態に陥ってしまいました😨
まだGRUBの復元方法をしらなかった私は、泣く泣くWindows側からサルベージのみ行い、Linuxを新しく入れ替えたため、メイちゃんはいない状態になりました😫
もう一度インストールしてもよかったのですが、最近新しく開発されてるのがないかな、と思って調べました。そこにはいろいろあったのですが、よさそうなのにVOICE VOXというのがありました😲
(8/14追加)
最近の日本語音声系は、動画作成のためなのか、いわゆる「ゆっくりしていってね」系の2つ以上のキャラクターを採用するものが多いですが、VOICE VOXもそのようです。
(参考:「ゆっくりしていってね」とは)
「四国めたん」も「ずんだもん」も対称的ですが、いい雰囲気で個人的にはドストライクです。こどもっぽい「ずんだもん」は実用向けにもなりそうです。
とりあえず、上記ウェブページでサンプルを聞いたり、説明の動画が見れます。GitHubへのリンクもありました。
なんでも、ソフト自体はHTTPのAPI経由でセルフサーバーとして動かすものらしいです。フロントエンドはVue、バックエンドはPythonのようです。先ほどのでいうとOpenJTalkのDockerバージョンがあったりと、最近はウェブ使用が前提なんでしょうね。
ただ、サーバーを分離できるというのは、最近安くなった能力の小さいIoTデバイスと相性が良いかもしれませんね。反応速度の問題もありますが、投機処理は可能でしょう。
(もはやおもちゃ売場な感じさえする、スイッチサイエンスのHP)
ちなみに、以前作成した「萌え萌えイングリッシュトレーニング」は、私のスマホに形を変えて入ってますが、音声合成機能は外しているので、実質はただの録音したものの再生です。
VOICE VOXはまだ開発中らしいですが、これからも楽しみなプロジェクトになりそうです。無料でかつ良質なので、スピーチソフトの操作はこれからの標準スキルになってくるかもしれませんね。
☕️ ~おしまい~ ☕️