ChatGPTなどを開発するOpenAIが4月29日、「Where the goblins came from(ゴブリンはどこから来たのか)」と題した記事を公開しました(外部リンク)。
内容は、同社のAIモデル・GPTシリーズが、脈略もなく突然「goblin(ゴブリン)」「gremlin(グレムリン)」といった小鬼や妖精の比喩表現を使うようになった理由を解説するもの。
「このバグの原因は、イタズラ好きのグレムリンの仕業かもしれませんね!」「ゴブリンたちがバックグラウンドでこそこそ悪さしている可能性も」……一見すると「AIがファンタジー世界に転生したのか?」と思ってしまう話。
しかし、OpenAIによれば原因は妖精さんのいたずら……ではなく「Nerdy(オタクっぽい)」人格の訓練過程で生まれた言葉の癖だったようです。
原因は「Nerdy」人格 遊び心が小鬼を呼んだ
「goblin」「gremlin」という語彙を使った回答パターンが明確に確認されたのはGPT-5.1のリリース後だったそうです。
統計によれば、当時のChatGPTにおける「goblin」の使用頻度は175%増加、「gremlin」は52%増加。一気に3倍近く増えるゴブリン、繁殖力が高い!
OpenAIがたどり着いた原因は、ChatGPTのカスタマイズ機能──特に「Nerdy」人格の訓練でした。
「Nerdy」は、知識や哲学、科学的思考を重視しつつ、重苦しくなりすぎないように、遊び心のある言葉づかいを促す性格設定。
OpenAIによると、この人格の訓練中に「生き物を使った比喩表現」を用いた回答に対して、無意識のうちに高い評価(報酬)を与えてしまっていたそうです。
その結果としてゴブリンやグレムリンのような語彙が増えていったと説明。まぁ「バグ(Bug)」だって元々は虫のことを指す遊び心のある用語ですしね。
他の人格と比べても「goblin」に突出したこだわりを持っていた「Nerdy」人格/画像はOpenAIの公式サイトより
しかし、ゴブリンたちは「Nerdy」人格の中だけにおとなしく留まってはいませんでした。
複雑な作業を進められるAIの中で増え続けたゴブリンたち
OpenAIは3月に、推論やコーディングなどのエージェント的な作業性能を向上させた「GPT-5.4」をChatGPT、API、Codex向けに発表しました。
このリリース時に「Nerdy」人格を廃止したものの、それまでのデータが再びファインチューニング(追加学習)に使われたことで、言葉の癖がさらに広がってしまったと説明しています。
さらに4月には、データ分析やソフトウェア操作など、コンピューター上の複雑な作業をより自律的に進められるモデルとして「GPT-5.5」を発表。しかし、GPT-5.5の訓練はゴブリン関連の語彙の発生原因が特定される前に開始されていたため、AIのゴブリンへの妙なこだわりは残ったままでした。
OpenAI社内でも、このこだわりはすぐに気づかれ、対策としてプロンプト(指示文)に、ゴブリンなどへ過度に言及しないようにする文言を追加したようです。
かわいい癖? それともAI訓練の重要な教訓?
この現象は、開発者コミュニティやAIユーザーの間でも話題に。
特にOpenAIが対策として盛り込んだ「goblin」「gremlin」「troll」などの言葉を話さないよう求める“ゴブリン禁止令”のような指示文が注目を集めました。
増え続けるゴブリン系語彙/画像はArena.aiのXより
また、AIベンチマークサービスのArena.aiも、GPTモデルにおける「goblin」「gremlin」「troll」などの使用率を可視化したグラフを投稿。
GPT-5.5でそれらの語彙が増えていることを、冗談交じりに紹介していました。
ChatGPTなどのAIは、存在しない単語などを出力する「幻覚(ハルシネーション)」が度々問題となっています。今回のゴブリンたちも、「Nerdy」人格が引き起こした幻覚に近い現象だったようです。
この記事どう思う?
関連リンク

0件のコメント