排行榜「你無法操控」，由其排名公司資助

人工智慧模型數量激增，競爭激烈，Arena 平臺（前身為 LM Arena）已成為前沿大語言模型（LLM）的公認排行榜，深刻影響資金、產品發布及公共關係週期。該起點僅在七個月內，從加州大學柏克萊分校的博士研究專案發展為估值達 17 億美元的創業公司。本集節目由 Equity 主持人 Rebecca Bellan 專訪 Arena 共同創辦人 Anastasios Angelopoulos 與 Wei-Lin Chiang，探討其平臺如何成為前沿 AI 模型的首選評測標準，以及如何在 OpenAI、Google 和 Anthropic 等巨頭支援下建立中立基準。兩人解析了 Arena 的運作機制，說明其相比靜態基準更難被操弄，並闡述了「結構中立」的含義。節目還分析了為何 Claude 目前在法律與醫療領域的專家排行榜中名列前茅，並介紹公司如何擴充套件至代理、程式碼撰寫及真實世界任務的評測，推出新的企業產品。觀眾可透過 YouTube、Apple Podcasts、Overcast、Spotify 等渠道訂閱 Equity，或關注其 X 和 Threads 帳號 @EquityPod。