はい(・ω・)こんにちは(・ω・)。今日はAIのハルシネーションに関連する話をしていきますよ(・ω・)
ハルシネーションは、幻覚や幻聴を表す英語から来ているんですけども(・ω・)
まあ、「岸田文雄の誕生日はいつですか(・ω・)」と聞いて、
こういう風にさらっと嘘をつきますが (ネット検索もしてんのに(・ω・))
このことに名前が付いていて、ハルシネーションというわけですね(・ω・)
岡山県岡山市に、コンベックス岡山という施設があります(・ω・)ご覧あそばせ(・ω・)
(引用 : 岡山市)
この凸ってる部分、これがコンベックスなので、コンベックス岡山なのか、コンベックス岡山だからこういう形にしたのかわかりまへん(・ω・)が、まあそういうことです(・ω・)
AIが学習過程で生成する文章空間という概念がありますが、まあ(・ω・)この空間は512次元とか1024次元とかあるいはもっと大きいかもしれません、モデルによるので色々ですが(・ω・)。AIに質問を投げかけると、その超次元意味空間の内部のある点をPとしたときに、原点Oとするときの 位置ベクトルp(ベクトルOP)が、解答になっているのですが(・ω・)
AIが学習する過程で重みパラメータを調整すると(・ω・)凸包と呼ばれる、まあるい、コンベックス岡山みたいな形の球体ができるんです(・ω・)
そのコンベックス・ハル内部の領域 (表面含む)に、位置ベクトルpの終点が存在するとき、その回答は、「嘘をついていない」ということが(・ω・)かなり最近の論文で分かったそうですよ(・ω・)
正しい情報は正しい情報で、近傍に集まり、そうでなければ散らばる(・ω・)
二次元空間に集めた点を、クラスタリングするあれに似ていますね(・ω・)
おわり(・ω・)