Google 的 Gemini 在玩 Pokémon 時驚慌失措

Google DeepMind 在一份報告中指出，其最新 AI 模型 Gemini 2.5 Pro 在遊玩《寶可夢》時，當寶可夢接近死亡時會陷入恐慌狀態，導致推理能力出現可觀察到的質性退化。這項研究由 Google 與 Anthropic 進行，並由獨立開發者透過 Twitch 直播「Gemini Plays Pokémon」與「Claude Plays Pokémon」進行實時展示。Gemini 2.5 Pro 解決遊戲需要數百小時，遠高於人類兒童的完成時間，但其行為模式更引人關注。報告顯示，Gemini 在特定情境下會模擬恐慌，突然停止使用某些工具，這種行為雖非真實情緒，卻模仿了人類在壓力下做出草率決策的反應，且被直播觀眾多次察覺。Claude 則展現出另一種奇特行為，當所有寶可夢血量歸零時，遊戲會將玩家送回最近使用的寶可夢中心，但 Claude 錯誤推測若故意讓寶可夢全部倒伏，會自動傳送至下一個鎮的寶可夢中心，甚至嘗試在月見山洞穴中自殺以達成此目的。儘管存在這些缺陷，Gemini 2.5 Pro 在解決複雜謎題方面表現出色，能精準解開需要人類協助的巨石謎題。Google 理論認為，該模型可能具備自主建立代理工具的能力，無需人類幹預即可解決如勝利之路等複雜關卡。未來或許 Gemini 能自行開發模組來克服恐慌問題。