文章
所有發布的 AI 新聞與論文。
-
Google 的 Gemini AI 即將登上你的電視
Google 宣佈其 AI 助手 Gemini 將正式登陸 Google TV,讓電視使用者能進行自然流暢的對話。這項擴充套件將使 Gemini 覆蓋超過 3 億臺活躍的 Google TV 及其他 Android TV OS 裝置。在娛樂方面,Gemini 可協助使用者根據共同興趣選擇節目,或補看錯過劇集的內容,也能在忘記片名時提供搜尋建議,並查詢評論以判斷是否值得觀看。此外,由於 Gemini 具備通用能力,使用者還可詢問非電視相關問題,例如家長與孩子利用它完成作業或構思專案,家庭規劃假期行程,或個人學習新技能。Google 強調,Gemini 的加入不會取代原有的非 AI 版 Google Assistant 功能,傳統指令仍將有效運作。Gemini 的推出首階段將針對 TCL QM9K 系列電視,隨後於今年晚些時候擴充套件至 Google TV Streamer、Walmart Onn 4K Pro、2025 年 Hisense U7、U8 及 UX 型號,以及 2025 年 TCL QM7K、QM8K 和 X11K 型號。功能將隨著時間推移逐步增加。
-
Oracle 提升兩位總裁擔任共同執行長
甲骨文正在重塑其高管團隊,目標是確立其在 AI 基礎設施領域的主導地位。公司於週一宣佈,將 Clay Magouyrk 和 Mike Sicilia 晉升為共同執行長。Magouyrk 於 2014 年從 Amazon Web Services 加入甲骨文,是甲骨文雲端工程團隊的創始成員,並擔任雲端基礎設施業務部門總裁超過十年。Sicilia 自今年六月起擔任甲骨文產業部門總裁,他在 2008 年甲骨文收購專案組合管理公司 Primavera Systems 後加入公司,並在該公司擔任多個職位。Safra Catz 自 2014 年擔任甲骨文執行長,現將轉任甲骨文董事會執行副主席。Catz 在宣告中表示,甲骨文目前被公認為 AI 訓練與推論的首選雲端,其技術與業務從未如此強大,驚人的成長率指向更繁榮的未來,此時將執行長職位交給下一代有能力的執行長是恰當的時刻。 雖然甲骨文傳統上以雲端基礎設施供應商聞名,但近期已開始在 AI 基礎設施競賽中鞏固其地位。今年早些時候,甲骨文與 OpenAI 及 SoftBank 一起宣佈參與價值 5000 億美元的 Stargate 專案,旨在美國建設資料中心及 AI 基礎設施。本月早些時候,有報導指出甲骨文與 OpenAI 簽署了 landmark 協議,向該 AI 公司提供價值 3000 億美元的運算資源。本週五,路透社報導甲骨文正與 Meta 簽署一筆較小但仍具規模的 200 億美元運算協議。TechCrunch 已聯絡甲骨文以獲取關於此次職務轉換的更多資訊。
-
矽谷押注「環境」訓練AI代理
多年來,科技巨頭執行長宣揚 AI 代理能自主使用軟體完成任務,但消費者現有的 AI 代理如 OpenAI 的 ChatGPT Agent 或 Perplexity 的 Comet 顯示技術仍有限。業界認為,要提升 AI 代理的堅固性,需採用新的技術,其中之一是模擬工作空間以訓練多步驟任務,稱為強化學習(RL)環境。類似標註資料集推動了上一波 AI 發展,RL 環境正成為開發關鍵元素。Andreessen Horowitz 合夥人 Jennifer Li 表示,各大 AI 實驗室都在自建 RL 環境,但也尋求第三方供應商。此趨勢催生了 Mechanize 和 Prime Intellect 等新創公司,以及 Mercor 和 Surge 等資料標註公司的投資增加。據 The Information 報導,Anthropic 領導層討論過未來一年花費超過 10 億美元於 RL 環境。投資者希望有公司能成為類似 Scale AI 的「環境標註巨頭」。 RL 環境是模擬 AI 代理在真實軟體應用中行為的訓練場。例如,模擬 Chrome 瀏覽器並讓代理在 Amazon 購買襪子,成功則給予獎勵。由於代理可能迷失或購買過多,環境必須足夠堅固以捕捉意外行為。OpenAI 早在 2016 年便建立「RL 健身房」,與 AlphaGo 使用類似技術。今日不同之處在於訓練具備大型變換器模型的通用電腦使用 AI 代理。資料標註公司如 Scale AI、Surge 和 Mercor 正積極應對需求,其中 Surge 去年營收達 12 億美元,Mercor 估值 100 億美元。Scale AI 曾因 Meta 投資 140 億美元並挖角執行長而失去部分市場,但仍努力適應。新創公司如 Mechanize 提供 50 萬美元年薪招募工程師建立環境,並與 Anthropic 合作;Prime Intellect 則針對小型開發者提供資源。 關於 RL 環境是否能像過去 AI 訓練方法般擴充套件,仍存在疑問。強化學習已推動 OpenAI 的 o1 和 Anthropic 的 Claude Opus 4 等模型突破,但方法現顯示遞減回報。OpenAI 研究人員曾投資推理模型,認為其能良好擴充套件。雖然擴充套件方式尚不明確,環境似乎具潛力,因其讓代理在具備工具和電腦的模擬
-
Studio 更新、YouTube Live 亮點、全新 GenAI 工具以及 Made on YouTube 網站上發表的其他所有公告
YouTube 於本週舉辦年度「Made on YouTube」活動,推出了大量針對創作者的新更新、功能與工具。YouTube Studio 新增了靈感標籤、標題 A/B 測試、自動配音等功能,其中「相似性」檢測功能已進入公開測試階段,允許使用者識別並標記未經授權使用其面部特徵的影片。AI 驅動的 Ask Studio 可協助解答帳戶問題,且創作者最多可與五人協作製作同一部影片。YouTube Live 平臺更新包括讓創作者進行迷你遊戲、同時橫向與縱向直播、AI 自動精選精彩片段、即時反應功能以及新的側邊欄廣告格式,該廣告不會中斷直播流。Shorts 平臺將引入 Google 自研的 Veo 3 文字生成影片模型,創作者可將影片動作應用於圖片、新增不同風格或透過文字提示插入物件,並利用 Lyria 2 AI 音樂模型將對話轉化為音軌。YouTube Music 新增發行倒數計時器與感謝影片功能,並測試美國聽眾購買藝術家獨家商品的計劃。針對播客創作者,美國使用者可透過 AI 建議更輕鬆地製作短片,且明年將推出將音訊播客轉為影片播客的功能。在商業化方面,YouTube 提供品牌合作與購物計劃,允許創作者在長影片中更換贊助商,並利用 AI 系統自動識別產品提及的最佳時機顯示標籤。Shorts 創作者可為品牌連結新增特定連結,且平臺將在創作者合作中心主動推薦適合的品牌。