來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
Instagram使用者現在可直接在IG Stories使用Meta AI編輯工具
Meta 將其 AI 驅動的圖片與影片編輯工具直接整合至 Instagram Stories,允許使用者透過文字提示來新增、移除或完全改變照片與影片內容。此功能位於 Stories 頂部的「Restyle」選單中,使用者可選擇「新增」、「移除」或「更改」來描述需求,例如改變髮色、新增皇冠或插入夕陽背景。此外,還提供預設效果,如為穿搭新增太陽眼鏡或機車夾克,或應用水彩風格;影片則可製作下雪或加火效果。使用 Meta AI 時,使用者需接受其服務條款,允許 AI 分析媒體與面部特徵,並可總結內容、修改圖片及生成新內容。Meta 持續推出 AI 更新以維持市場競爭力,近期測試過協助撰寫貼文評論的「Write with Meta AI」功能,並上月推出 AI 生成影片動態「Vibes」,該功能於十月十七日使 iOS 與 Android 平臺的日活躍使用者數增至 270 萬,較四週前的約 77.5 萬大幅增加。針對家長疑慮,Meta 亦宣佈引入新家長控制功能,允許關閉與 AI 角色的對話並監控青少年與 Meta AI 討論的主題。
-
開放AI發布Atlas兩天後,微軟重推幾乎相同的AI瀏覽器
微軟於週四發布了針對其 AI 助手的一組新功能,其中最具野心的是將人工智慧直接整合進其核心產品中。Edge 瀏覽器的 Copilot Mode 不僅是簡單的擴充功能,更是微軟對長期備受矚目的 AI 瀏覽器類別的回應,這是一個能隨使用者瀏覽網頁而移動的智慧助手。微軟 AI 執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)在公告中表示,Copilot Mode 正在演變為一個動態且智慧的 AI 瀏覽器,在獲得使用者許可後,它能檢視並推理開啟的標籤頁,總結與比較資訊,甚至執行預訂飯店或填寫表單等動作。該功能的正式上線日期為七月,初期包含新標籤頁的搜尋列與自然語音導航等基礎功能,當時為選開模式,未引起預期的關注。此次活動中,微軟推出了更進階的「動作」功能,讓 Copilot 能填表或訂房,以及「旅程」功能,讓 Copilot 能追蹤標籤頁間的關聯。此發布僅在 OpenAI 兩天後推出其新 Atlas 瀏覽器,兩者視覺相似度高,背景設計與功能佈局幾乎相同,主要差異在於底層模型。儘管微軟 Copilot 的發布已規劃數週,且新 Copilot Mode 可能開發數月,但兩家公司在 AI 瀏覽器領域的競爭態勢緊張,兩者在同一週推出類似產品具有顯著意義。此前有報導誤將十月二十三日的活動稱為 Copilot for Edge 的初始發布,實際功能於七月上線,TechCrunch 已對此錯誤進行更正。
-
微軟的 Mico 是 AI 世代的「Clippy
微軟在近日舉辦的 Copilot 秋季發布會上正式推出了其 AI 聊天機器人「米科」(Mico),這被視為該公司將 AI 技術推向消費者的關鍵一步。米科是一個具有表情的卡通形象,旨在為使用者提供溫暖且可自定義的視覺存在,能根據互動改變顏色並模擬聽覺與反應。微軟表示,米科的名字致敬了「Microsoft Copilot」,其功能包括記憶對話內容並從反饋中學習。美國使用者可啟用「即時學習」模式,讓 Copilot 扮演導師角色引導概念理解。此外,米科還隱藏了彩蛋,多次點選可變身為微軟經典的 productivity 助手「Clippy」。此功能預設在語音模式下啟用,但使用者可關閉。米科目前僅在美國、加拿大和英國可用。 微軟強調其 AI 發展目標並非追求螢幕時間或使用者參與度,而是建立能讓人回歸生活、深化人際連結並贏得信任的技術。CEO 穆斯塔法·蘇萊曼指出,微軟正致力於演進 Copilot 的個性與語氣,推出「真實對話」模式,使 AI 能模仿使用者的溝通風格,同時避免過度奉承,具備獨立觀點並挑戰使用者想法。市場上其他聊天機器人如 ChatGPT 和 xAI 的 Grok 也採取了擬人化策略,顯示消費者對 AI 角色存在一定需求。微軟此次更新還包含引入好友參與對話、長期記憶支援、連結郵件與雲端儲存等 productivity 應用,以及擴充套件瀏覽器 Edge 的 AI 整合能力,使其能總結資訊、比較內容並執行預訂酒店或填寫表單等動作。Edge 將與 OpenAI 的 ChatGPT Atlas、Perplexity 的 Comet 及 Chrome 整合 Gemini AI 等競爭對手抗衡。微軟宣稱所有更新核心在於「人本主義 AI」,始終將人類置於首位。
-
TensorMesh 經過籌集 450 萬美元資金,以提升 AI 伺服器載入的推理效能
隨著 AI 基礎設施建設規模擴大,對 GPU 推理效能的壓力日益增加,這也促使擁有特定技術專長的團隊更容易獲得資金支援。Tensormesh 公司於本週正式脫離隱形開發階段,獲得 450 萬美元種子資金。該投資由 Laude Ventures 主導,並有資料庫先驅 Michael Franklin 提供額外天使投資。Tensormesh 將資金用於開發商業版 LMCache 工具,該工具由共同創辦人 Yihua Cheng 開發並維護。LMCache 若運用得當,可將推理成本降低高達 10 倍,因此已成為開源部署中的標準工具,並吸引了 Google 和 Nvidia 等巨頭進行整合。 Tensormesh 的核心產品聚焦於關鍵值快取(Key-Value Cache 或 KV cache),這是一種用於高效處理複雜輸入的記憶體系統。傳統架構中,KV cache 會在每次查詢結束後被丟棄,但 Tensormesh 共同創辦人兼執行長 Junchen Jiang 認為這是巨大的效率浪費。他比喻這就像一位聰明的分析師讀完資料後卻忘記了所學內容。Tensormesh 的系統則會保留這些快取,讓模型在執行類似查詢時能重新使用。由於 GPU 記憶體珍貴,這可能意味著資料需分佈在多個儲存層級,但換來的卻是相同伺服器負載下顯著的推理能力提升。 此改變對聊天介面尤為重要,因為模型需不斷回溯對話記錄。代理系統(Agentic systems)也面臨類似挑戰,需處理不斷增長的行動與目標記錄。雖然這些是 AI 公司可自行執行的技術變更,但複雜度極高。Tensormesh 團隊基於其對該過程的研究與細節掌握,預期市場需求將大。Jiang 指出,將 KV cache 保留在次級儲存系統中並高效重用以不影響整體系統速度,是一個極具挑戰性的問題。他提到,有人會僱用 20 名工程師花費三到四個月來建立類似系統,而使用 Tensormesh 的產品則能高效完成此任務。