跳至內容
AI 新聞站
返回

排行榜「你無法操控」,由其排名公司資助

人工智慧模型數量激增,競爭激烈,Arena 平臺(前身為 LM Arena)已成為前沿大語言模型(LLM)的公認排行榜,深刻影響資金、產品發布及公共關係週期。該起點僅在七個月內,從加州大學柏克萊分校的博士研究專案發展為估值達 17 億美元的創業公司。本集節目由 Equity 主持人 Rebecca Bellan 專訪 Arena 共同創辦人 Anastasios Angelopoulos 與 Wei-Lin Chiang,探討其平臺如何成為前沿 AI 模型的首選評測標準,以及如何在 OpenAI、Google 和 Anthropic 等巨頭支援下建立中立基準。兩人解析了 Arena 的運作機制,說明其相比靜態基準更難被操弄,並闡述了「結構中立」的含義。節目還分析了為何 Claude 目前在法律與醫療領域的專家排行榜中名列前茅,並介紹公司如何擴充套件至代理、程式碼撰寫及真實世界任務的評測,推出新的企業產品。觀眾可透過 YouTube、Apple Podcasts、Overcast、Spotify 等渠道訂閱 Equity,或關注其 X 和 Threads 帳號 @EquityPod。


分享這篇文章:

上一篇
Google Workspace 內 Gemini 優化功能值得使用的特色
下一篇
此新創公司希望讓企業軟體看起來更像一個提示