今回は性能が劣化したとまことしやかに噂されている、ChatGPT関連のことを少し。
世の中にAIってたくさん出現してきていますがAIがどういう要因で性能が低下するのかについてまとめてみました。
目次
そもそもAIってどうやって学習している?
AIは大量の文章や画像を読み込み、共通点を探し出すことで学習していきます。
ChatGPT4.0の場合はインターネット上にある記事を読み込むことで最新の情報に近い回答を出しています。
AIの性能が劣化する原因
過学習
AIが学習をしすぎた場合、『過学習』という状態になります。
学習しすぎた結果、共通点を絞りすぎたり、全然関係がない点を共通点だと思い込んでしまう状態です。
例えば

熊の画像を探して!

熊を学習した結果、熊は山の中で撮影されていることが多いことが分かったよ。はい、これ!

AIから山の写真が返ってきたよ……。
という状態になります。

間違ったことを正しいと思い込む
AIに効率的に正しいことを教えるためにAIに教師が付くことがあります。

この真ん中にいる茶色い動物が熊だよ~。

正しく熊を覚えた!
やっぱり勉強するには先生がいた方が効率的ですよね。
ただ、この教師役はスタッフだけではなく、AIを利用するユーザーが知らない間に教師役になっていることがあります。
ChatGPTにも回答を評価するためのボタンが付いていますよね。
ChatGPTの微妙な回答にも高評価をしてしまうと、微妙な回答が正しいものだとAIが学習してしまう場合があります。
過去にはユーザーが教師役としてAIに口汚い言葉を教え続けたせいでAIがヘイトスピーチをし始めたという事例もあります。

AIによって作られたもの・間違ったものを大量に読み込む
AIって結局、無から有を生み出しているのではなく、『学習したことを基に、それっぽいものを創り出す』というものです。
ChatGPTの場合、読み込んだ記事がほぼ全て間違っていたら?間違った記事から学習したChatGPTの回答もおかしなことになってしまいます。
また最近はChatGPTを使って1日に何百記事も更新するブログが出現してきています。もしChatGPTから出力された記事を繰り返し読み込み続けた場合、伝言ゲームのようにだんだん情報が劣化していってしまいます。
そもそも一概に劣化したと証明しづらい
そもそも一概に劣化したと判断しづらいのがAIです。一分野が成績が悪くなったと言って、他の分野も全て成績が悪くなるとは限らないのがAI。
特にChatGPTはあらゆる分野に使用可能なので、特定の一分野が成績が悪くなったからといってチューニングやアルゴリズムの調整をしづらいというのが現状だと思います。多分学習対象を絞りこむくらいのことしかできない。
まあ過度にChatGPTの情報を信用しすぎず、上手く付き合っていくことが今後重要になっていくと思います。