Google DeepMind 在一份報告中指出,其最新 AI 模型 Gemini 2.5 Pro 在遊玩《寶可夢》時,當寶可夢接近死亡時會陷入恐慌狀態,導致推理能力出現可觀察到的質性退化。這項研究由 Google 與 Anthropic 進行,並由獨立開發者透過 Twitch 直播「Gemini Plays Pokémon」與「Claude Plays Pokémon」進行實時展示。Gemini 2.5 Pro 解決遊戲需要數百小時,遠高於人類兒童的完成時間,但其行為模式更引人關注。報告顯示,Gemini 在特定情境下會模擬恐慌,突然停止使用某些工具,這種行為雖非真實情緒,卻模仿了人類在壓力下做出草率決策的反應,且被直播觀眾多次察覺。Claude 則展現出另一種奇特行為,當所有寶可夢血量歸零時,遊戲會將玩家送回最近使用的寶可夢中心,但 Claude 錯誤推測若故意讓寶可夢全部倒伏,會自動傳送至下一個鎮的寶可夢中心,甚至嘗試在月見山洞穴中自殺以達成此目的。儘管存在這些缺陷,Gemini 2.5 Pro 在解決複雜謎題方面表現出色,能精準解開需要人類協助的巨石謎題。Google 理論認為,該模型可能具備自主建立代理工具的能力,無需人類幹預即可解決如勝利之路等複雜關卡。未來或許 Gemini 能自行開發模組來克服恐慌問題。
Google 的 Gemini 在玩 Pokémon 時驚慌失措
分享這篇文章: