「文字起こし(テープ起こし)やデータ入力のような単純作業は、将来的にはAIに取られてなくなるだろう」
これは、NottaやGoogle音声入力、ChatGPTが話題になる前から久しく言われていることだが、はたして本当にそうなのだろうか。
完全在宅ワーカーとして文字起こしを生業としている私は、それは半分は正しく、半分は誤りだと、個人的には考えている。
自動文字起こしソフトやアプリが普及すると、テープ起こしの作業効率はもちろん大幅に上がる。
しかし、テープライターの仕事はなくならないどころか、むしろかたちを変えて激増すると、私は思っている。
まず、日本語には以下の特徴がある。
●主語や目的語を省略できる。
●漢字・平仮名・片仮名が混在している。
●同音異義語がある。
●漢字に音読みと訓読みがある。
●敬語・婉曲・オノマトペ等、表現のバリエーションが豊か。
●方言の種類が多い。
●語族系統で分類不能とされており、独立した特殊な文法構造を持っている。
これらの特徴を持つ日本語は、自動反訳(文字起こし)や自動翻訳がとりわけ難しい言語だと言われている。
アニョハセヨ。
===========
実際、自動反訳・翻訳エンジンの開発のみを長年追求してきたあるIT企業の営業の方によれば、日本語の場合、自動文字起こしの精度は、90%程度からずっと上げられていないとのことだった。
また、 AI文字起こしが苦手とすることとして、最新情報、特に専門家がまだ少ない分野の音源を的確に起こせないことがある。
このことは、先日のChatGPTの記事でも触れた。
さらに、発話被りやノイズが多い音源、脈絡に乏しい会話(雑談等)では反訳の精度が大きく下がることも、自動文字起こしAIの弱点として挙げられる。
記者ハンドブックの中身
===========
これらをふまえて、日本語という、成り立ちとして独立している上に世界的に見てユーザーが少ない言語の、その数パーセントの精度を追求することが、はたして実用向け自動文字起こしシステムやAIを開発する費用対効果・労力対効果から見て、本当に生産的なことなのだろうかと個人的には思うのだ。(研究対象としてなら分かる)
外注にお金がかかるために眠らせていた音源を、自動文字起こしAIにかける人が増えるほど、 AIが間違えている数パーセントの箇所を修正する仕事や、文章を記者ハンドブックに倣って整える仕事は増えるだろう。
完全自動化がすべてではなく、人力と組み合わせることが結局のところ最適解となる場合が、世の中にはわりとあると私は思う。
少なくとも直近数年では、従来とは少し違ったかたちで、文字起こしの関連業務が増えると踏んでいる。
自動文字起こしAIを活用できる知識を持ち、かつ、ライティングの基礎を覚えることは、在宅ワーカーになりたい方にとって、今からでも結構悪くない選択肢なのではないだろうか。
何より、文字起こしのお仕事は、すごく面白いですよ(*’▽’*)