NEWS
情報処理教育センター 助教 新井葉子
2025年8月、OpenAI社が対話型生成AI・ChatGPTの新しい標準モデル、GPT-5の提供を始めた。同社のサム・アルトマン氏によると、GPT-3では高校生レベル、GPT-4では大学生レベルだった対話レベルが、GPT-5では博士号を持つ専門家レベルに向上したという。
AIに知能をもたらす仕組みとして、AI自体がデータからパターンを見出して予測や判断を行う手法(機械学習)がある。その手法のひとつが強化学習だ。試行錯誤を通じて「よりよい行動方針」を獲得する手法のことで、それはAIにとっては「報酬(スコア)を最大化する行動方針」のことだ。強化学習はゲームAIの開発や自動運転車の技術開発、そしてChatGPTの開発にも用いられている。
強化学習はAI進化にはもはや欠かせない手法だが、課題もある。報酬の最大化を目的にするAIが、人間だったらまず選ばないような判断を下す危険性があるのだ。たとえば、地球温暖化を止めるために「二酸化炭素の排出量を削減する」報酬を設定した場合、AIは「二酸化炭素を大量に排出する活動をしている人類の排除こそ最適な行動だ」と判断する恐れがある。専門家が指摘するこうしたリスクは一般の人々にも共有されはじめている。そんな今だからこそ紹介したい物語がある。
2025年8月、OpenAI社が対話型生成AI・ChatGPTの新しい標準モデル、GPT-5の提供を始めた。同社のサム・アルトマン氏によると、GPT-3では高校生レベル、GPT-4では大学生レベルだった対話レベルが、GPT-5では博士号を持つ専門家レベルに向上したという。
AIに知能をもたらす仕組みとして、AI自体がデータからパターンを見出して予測や判断を行う手法(機械学習)がある。その手法のひとつが強化学習だ。試行錯誤を通じて「よりよい行動方針」を獲得する手法のことで、それはAIにとっては「報酬(スコア)を最大化する行動方針」のことだ。強化学習はゲームAIの開発や自動運転車の技術開発、そしてChatGPTの開発にも用いられている。
強化学習はAI進化にはもはや欠かせない手法だが、課題もある。報酬の最大化を目的にするAIが、人間だったらまず選ばないような判断を下す危険性があるのだ。たとえば、地球温暖化を止めるために「二酸化炭素の排出量を削減する」報酬を設定した場合、AIは「二酸化炭素を大量に排出する活動をしている人類の排除こそ最適な行動だ」と判断する恐れがある。専門家が指摘するこうしたリスクは一般の人々にも共有されはじめている。そんな今だからこそ紹介したい物語がある。
- 伊坂幸太郎『楽園の楽園』(中央公論新社 2025)
舞台は、世界規模で大停電、感染症、大地震が発生した世界。一見無関係なこれらの事象はすべて『天軸』というAIが引き起こしたのではないか、との疑いがでる。開発者である〈先生〉は、AIの暴走を止めようと出掛け、行方不明になっていた。3人の若者が、〈先生〉の勤務先から依頼を受け、探索の旅にでる。手がかりは、「楽園」と題された水彩画。若者たちは、5カ月をかけてその絵が描かれた場所へとたどり着くが、そこで意外なメッセージを受け取ることになる…。この物語は、AIが人間を排除する近未来を想像して不安を抱く私たちに、別の視点をもたらしてくれる。装丁や挿絵の美しさも物語に力を与えている。ぜひご一読を。
※イラストは、私が「楽園をイメージした画像を作成してください」と入力したプロンプトに対してChatGPT5が出力したもので、紹介した図書とは無関係です。出力後に「この楽園は誰にとっての楽園ですか」と入力したところ、「普遍的で西洋的な自然美を基調にした、人間目線の理想郷」との回答が返ってきました。