來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
微軟推出三款新基礎模型對抗AI競爭對手
微軟人工智慧實驗室(Microsoft AI)於週四宣佈推出三款基礎 AI 模型,分別為 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2,這些模型能生成文字、語音及影像。MAI-Transcribe-1 可將 25 種不同語言的語音轉錄為文字,其速度比微軟 Azure Fast 快 2.5 倍。MAI-Voice-1 是語音生成模型,使用者可在 1 秒內生成 60 秒的語音,並能建立自訂語音。MAI-Image-2 則是影像生成模型,該模型最初於 3 月 19 日在 MAI Playground 發布,現已同步在 Microsoft Foundry 及 MAI Playground 上提供。 這些模型由微軟 MAI 超級智慧團隊開發,該團隊由微軟 AI 執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)領導,成立於 2025 年 11 月。蘇萊曼表示,微軟致力於構建「人文主義 AI」,將人類置於中心,最佳化溝通方式並針對實際應用進行訓練。在競爭激烈的大型語言模型市場中,微軟宣稱這些模型比 Google 和 OpenAI 的產品更便宜。MAI-Transcribe-1 起價為每小時 0.36 美元,MAI-Voice-1 起價為每百萬字元 22 美元,MAI-Image-2 起價為每百萬 token 5 美元(文字輸入)或 33 美元(影像輸出)。 儘管推出自有模型,蘇萊曼重申了微軟與 OpenAI 的夥伴關係,並指出最近的重新談判讓微軟能真正推進超級智慧研究。微軟已投資超過 130 億美元於該 AI 研究實驗室,並透過多年夥伴關係在其多項產品中部署模型。
-
Google 現在讓你透過提示詞直接操控 Vids 應用的虛擬形象
Google 於週四為其影片編輯應用 Vids 新增多項功能,包括透過文字提示指導和自定義虛擬形象、支援 Veo 3.1 影片生成模型、將影片匯出至 YouTube 以及新增 Chrome 瀏覽器擴充套件程式以進行螢幕錄製。使用者現在可使用自然語言提示讓虛擬形象在場景中「表演」,例如與產品、道具或裝置互動,儘管輸出具有動態性,Google 表示 Vids 仍能保持角色一致性。使用者可根據影片主題調整角色外觀、服裝並透過提示建立新背景。上月 Google 已在 Vids 中整合 Lyria 3 和 Lyria 3 Pro 音樂創作模型,用於新增音效或音樂。此次更新引入的 Veo 3.1 模型可在工具內生成八秒長的影片片段,所有使用者每月享有十次免費生成機會,而 Google AI Ultra 和 Workspace AI Ultra 賬戶每月可生成高達一千個影片。此外,完成後的影片可直導至 YouTube,預設為私密狀態,以便使用者在公開前審查。新推出的 Chrome 擴充套件程式允許使用者錄製帶音訊或影片的螢幕畫面。Google 自 2024 年推出 Vids 以來持續增補功能,旨在服務企業內容創作,去年將 AI 虛擬形象引入並擴大消費者訪問許可權。二月份,公司新增了二維和三維卡通風格虛擬形象,並支援七種新語音覆寫語言,包括法語、德語、義大利語、韓語、葡萄牙語、西班牙語和日語。目前 Vids 面臨來自 Synthesia、HeyGen、D-ID 和 Lemon Slice 等競爭對手的挑戰。
-
Anthropic 移除數千個 GitHub 倉庫試圖搶回外泄的原始碼 該公司表示此舉是意外
安提克(Anthropic)在試圖將其熱門產品 Claude Code 的原始碼從網路上下載時,意外導致數千個 GitHub 程式碼儲存庫被下架。週二,一名軟體工程師發現安提克在近期版本中似乎不慎公開了該命令列應用程式的原始碼。AI 愛好者們在 GitHub 上分享並分析這些洩漏的原始碼,以瞭解安提克如何運用底層的大語言模型。隨後,安提克依據美國數位版權法向 GitHub 發出下架通知,要求刪除包含違規程式碼的儲存庫。根據 GitHub 的記錄,該通知最初針對約 8,100 個儲存庫執行,其中包括安提克官方公開的 Claude Code 儲存庫的合法分叉版本,這引發了憤怒的社群媒體使用者的抗議。安提克 Claude Code 負責人 Boris Cherny 表示此舉為意外,並撤回了大部分下架通知,僅保留針對一個儲存庫及 96 個分叉的通知,因為該儲存庫是連線至官方公開儲存庫的分叉網路。安提克發言人向 TechCrunch 確認,已撤銷除指定儲存庫外的所有通知,且 GitHub 已恢復受影響分叉的存取許可權。此次清理失敗成為該公司在籌備首次公開募股(IPO)過程中的另一個負面事件,通常 IPO 需要高度關注執行力與合規性。洩露原始碼作為一家上市公司,預計將引發股東訴訟。
-
cognichip 想讓 AI 設計驅動 AI 的晶片,並剛籌得 6000 萬美元試探
先進矽晶片加速了人工智慧發展,如今人工智慧能否反哺產業?Cognichip 正在構建深度學習模型,協助工程師設計新晶片。該公司旨在解決半導體設計長期面臨的複雜、昂貴且耗時問題,先進晶片從概念到量產需三至五年,設計階段 alone 即可長達兩年。Cognichip 執行長兼創辦人 Faraj Aalaei 表示,其目標是將軟體工程師使用的 AI 工具引入半導體設計領域,透過引導與指定結果,讓系統自動生成程式碼。據稱其技術可將晶片開發成本降低超過 75%,並將時程縮減一半。 Cognichip 於去年脫離隱形階段,週三宣佈籌資 6000 萬美元,由 Seligman Ventures 領投,Intel 執行長 Lip-Bu Tan 及 Seligman 管理合夥人 Umesh Padval 將加入董事會。自 2024 年創立以來,公司總籌資額達 9300 萬美元。儘管如此,Cognichip 尚未展示使用其系統設計的新晶片,也未披露自九月以來合作的客戶名單。 Cognichip 的優勢在於使用基於晶片設計資料自訓的模型,而非通用大語言模型。由於晶片設計師嚴格保護智慧財產權,難以獲取開放式資料庫,因此公司需自行開發資料集,包括合成資料,並與夥伴授權資料。同時,公司開發了安全程式,允許晶片製造商在保護專有資料的前提下進行模型訓練。在缺乏專有資料時,Cognichip 會依賴開放原始碼替代方案。去年,公司邀請聖荷西州立大學電氣工程學生參加駭客松,團隊利用該模型基於 RISC-V 開放原始碼架構設計 CPU。 Cognichip 面臨的競爭對手包括 Synopsys、Cadence Design Systems 等 incumbents,以及 ChipAgents 和 Ricursive 等新創公司。Seligman 的 Padval 指出,當前 AI 基礎設施的資金流入規模為其 40 年投資生涯中最大,若半導體與硬體進入超級週期,Cognichip 等公司將受益。