分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
費菲李的世界實驗室以Marble加速世界模型競賽,Marble為其首個商業產品
世界實驗室(World Labs)由人工智慧先驅費飛飛(Fei-Fei Li)創立,近日推出了其首款商業世界模型產品 Marble。該產品透過免費和付費模式提供,允許使用者將文字提示、照片、影片、3D 佈局或全景圖轉換為可編輯和下載的 3D 環境。Marble 於兩月前在有限測試版中首次發布,距離世界實驗室以 2.3 億美元資金退出隱形階段已超過一年,使其在競爭激烈的世界模型領域領先於 Decart、Odyssey 以及 Google 的 Genie 等對手。與僅生成即時探索世界的模型不同,Marble 建立持久且可下載的 3D 環境,減少變形並支援將世界匯出為高斯斑點、網格或影片。 Marble 是首款提供原生 AI 編輯工具和混合 3D 編輯器的模型,允許使用者在 AI 填充視覺細節前預先構建空間結構。其輸入輸出流程支援多張圖片或短片以生成更寫實的數字孿生,並引入實驗性 3D 編輯器 Chisel,讓使用者直接操作物體。此外,使用者可將世界擴充套件一次,或透過「元件模式」合併多個世界以建立巨大空間。產品提供四種訂閱層級:免費(每月四次生成)、標準(20 美元/月,12 次生成及多媒體輸入)、專業(35 美元/月,25 次生成及場景擴充套件權)、以及最高階(95 美元/月,所有功能及 75 次生成)。 主要應用場景包括遊戲開發、電影視覺效果和虛擬現實。雖然部分遊戲開發者對生成式 AI 的負面影響表示擔憂,但世界實驗室認為 Marble 可為遊戲引擎提供背景資產。在視覺效果工作中,Marble 解決了 AI 影片生成的一致性問題,允許精確控制相機移動。該產品已相容 Vision Pro 和 Quest 3 VR 頭戴式顯示器。費飛飛認為,Marble 是邁向真正空間智慧世界模型的第一步,有望幫助機器在科學和醫學領域取得突破。
-
前醫生創辦 empathetic AI 好伴侶 Robyn
前哈佛醫學生珍妮·邵(Jenny Shao)因目睹疫情期間隔離人群的神經系統影響,決定離開醫學職涯,創立名為羅賓(Robyn)的 AI 助手起點公司。羅賓旨在成為一個具有同理心與情感智慧的 AI,定位於既非交友應用也非替代治療師的夾縫中。邵曾師從諾貝爾獎得主埃裡克·坎德爾(Eric Kandel)研究人類記憶,並將這些知識融入羅賓,使其能更理解使用者。該應用已於 iOS 上架,並提供類似日記或心理健康應用的註冊流程,使用者需填寫個人目標、應對挑戰的方式及期望的回應語氣。 羅賓透過對話分析使用者的行為模式,提供情感指紋、依附風格、愛語、成長邊緣及內在批評者等洞察。公司已獲得由 M13 領銜的 550 萬美元種子輪融資,參與投資者包括 Google Maps 共同創辦人拉爾斯·拉斯穆森(Lars Rasmussen)、Canva 早期投資者比爾·泰(Bill Tai)以及 X.ai 共同創辦人克里斯蒂安·謝格迪(Christian Szegedy)。團隊規模從年初的三人擴增至十人。 為了確保安全,羅賓設有防護機制,若使用者談論自殘會提供危機熱線及最近急診室資訊,並拒絕回答體育比分或計數等請求。該應用為付費服務,月費 19.99 美元或年費 179 美元。創辦人強調,羅賓旨在解決現代人的情感斷連問題,幫助人們反思自身模式並重新連結自我與他人,而非取代真實的人際關係。
-
Google 將 Gemini 帶到 Google TV Streamer
Google 於週一宣佈開始將 Gemini 功能逐步推送到 Google TV Streamer,取代原有的 Google Assistant。這項更新旨在讓使用者能更自然地透過語音互動,獲取內容與資訊。例如,使用者在尋找電影推薦時,可以詢問「我喜歡劇集但妻子喜歡喜劇,我們能一起看什麼電影?」;或是快速追劇,詢問「《風中的女王》上季結局是什麼?」。此外,使用者還能詢問「最近大家都在討論的新醫療劇是什麼?」。Gemini 不僅限於娛樂,使用者亦可將其用於學習,例如要求 Gemini 向三級學生解釋「火山爆發的原因」。系統還能引導使用者完成 DIY 專案或食譜,並搭配 YouTube 影片播放。要使用此功能,使用者需按下遙控器的麥克風按鈕。Google 表示更新將於未來幾週內向 18 歲以上使用者推出。此前九月,Google 已宣佈 Gemini 將先於 TCL 裝置推出,並計劃於 2025 年延伸至 Hisense U7、U8、UX 系列以及 TCL QM7K、QM8K、X11K 系列機型。目前 Gemini 亦可在 Walmart Onn 4K Pro 流媒體裝置上使用。此次公告符合 Google 全面以 Gemini 取代 Google Assistant 的長期策略,該計畫早在今年一月於 CES 展會時已透露。
-
Google 地圖推出新 AI 工具 讓你製作互動專案
Google Maps 正在引入新的 AI 功能,包括建構者代理(builder agent)和模型上下文協議(MCP)伺服器,協助開發者和使用者利用地圖資料與程式碼建立互動式專案。公司表示這些功能均採用 Gemini 模型驅動。建構者代理允許使用者透過文字描述互動式地圖原型需求,例如建立街景導覽、即時天氣視覺化或列出寵物友善飯店,生成程式碼後可匯出、測試或修改。該工具還包含樣式代理,協助品牌建立特定配色編碼的地圖。 Google 現推出 Grounding Lite 功能,讓開發者能使用 MCP 標準將自有 AI 模型與外部資料源連結,使 AI 助手能回答如「最近超市有多遠」等問題,並搭配低程式碼的 Contextual View 元件,以列表、地圖或 3D 檢視呈現答案。此外,公司新增 MCP 伺服器作為程式碼助手工具包,連結 Google Maps 文件以提供 API 使用指導。上月,Gemini 終端機工具已推出延伸功能供開發者存取地圖資料。 在消費者端,Google 上週啟用手勢免持導航功能,並為印度地區使用者在部分割槽域新增事故警報與限速資料。這些更新旨在強化 Gemini 在地圖生態系中的整合能力,提升開發效率與使用者體驗。