分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
我在 Google 新 AI 世界生成器中建造棉花糖城堡
Google DeepMind 於週四起開放 Project Genie 給美國 Google AI Ultra 訂閱者使用,這是一款能從文字提示或圖片建立互動遊戲世界的實驗性原型工具。該工具結合了 Genie 3 世界模型、Nano Banana Pro 圖片生成模型以及 Gemini。此舉是 DeepMind 為開發更強大的世界模型而收集使用者反饋與訓練資料的一部分。世界模型能生成環境的內部表示並預測未來結果,被視為實現人工通用智慧(AGI)的關鍵步驟。 Project Genie 允許使用者提供環境和主角的文字提示,由 Nano Banana Pro 生成圖片作為基礎,隨後 Genie 將其轉化為可探索的互動世界。使用者可修改圖片或基於真實照片建立世界,但模型偶爾會產生錯誤,例如將綠色頭髮生成為紫色。目前系統僅提供 60 秒的世界生成與導航時間,以應對計算資源限制。該工具已啟用安全防護,禁止生成涉及裸露或侵犯迪士尼等版權內容的世界。 測試顯示,Project Genie 在藝術風格(如黏土動畫、水彩、動漫)上表現出色,但在追求照片級真實感或電影效果時表現不佳,常呈現出遊戲感。使用真實照片時,模型有時會扭曲場景或產生不自然的數位感。導航控制方面,箭鍵、空格鍵及 WASD 鍵有時反應遲鈍或方向錯誤,導致移動困難。DeepMind 研究人員承認這是實驗性質的原型,未來將致力於提升真實感與互動能力,包括改善角色穿牆問題及提供更多使用者控制選項。儘管存在缺陷,該工具仍展示了在娛樂領域應用世界模型的潛力,並可能未來擴充套件至模擬訓練實體機器人。
-
印度示範如何透過AI提升教育規模化效益
隨著人工智慧加速進入全球教室,Google 發現最艱難的擴充套件課題並非來自矽谷,而是源自印度學校。印度擁有超過十億網民,目前是全球 Gemini 學習使用量最高的地區。Google 教育副總裁兼總經理 Chris Phillips 表示,印度教育體系由州級課程決定、政府深度參與且資源分配不均,這使得 Google 必須放棄傳統的「一刀切」產品策略。根據印度政府 2025-26 年經濟調查,該國小學教育系統服務約 2.47 億學生,遍佈近 147 萬所學校,並有 1010 萬名教師;高等教育系統則有超過 4300 萬名學生,較 2014-15 學年增長 26.5%。 Google 在印度的經驗顯示,教育 AI 無法由公司統一定義,而必須讓學校和行政人員自行決定如何使用。此外,Google 正轉向以教師為主要控制點,設計輔助教學規劃、評估與管理的工具,以維護關鍵的師生關係。面對部分學校缺乏個人裝置或穩定網路的挑戰,Google 正推動多模態學習,結合影像、聲音與文字,並透過 Gemini 提供 JEE Main 考試準備服務,以及培訓 4 萬名 Kendriya Vidyalaya 教師。 OpenAI 與 Microsoft 也在印度加強教育佈局,OpenAI 任命前 Coursera 亞太區總監 Raghav Gupta 為印度及亞太區教育主管,Microsoft 則與 Physics Wallah 等機構合作。儘管印度最新經濟調查警告過度依賴 AI 可能導致認知退化與批判性思維下降,但 Google 認為印度的複雜挑戰預示了全球公共教育系統將面臨的管控、存取與在地化問題。隨著生成式 AI 深入教育領域,這些壓力將逐漸在其他國家顯現,Google 在印度的實踐經驗對產業至關重要。
-
Google地圖現在讓您在行走與騎自行車時可使用Gemini
Google 於週四宣佈,Google Maps 使用者現在可以在走路或騎腳踏車時,透過手勢操作無縫使用 Gemini 進行語音對話。此更新距離 Google Maps 推出 Gemini 驅動的無手駕駛體驗僅數月,標誌著 Google 將 Gemini 整合進日常生活的持續努力,並將 Maps 從靜態導航轉變為即時對話式導航。使用者在步行時可詢問關於所在社群的更多資訊、推薦必訪景點,或查詢沿線有衛浴設施的咖啡廳。Google 指出,步行打字不易,因此推出此功能讓使用者在保持步調或專注道路時即可提問。騎車者亦可詢問預計到達時間或下次會議時間,甚至可要求 Gemini 傳送訊息告知他人自己已晚到十分鐘。該功能支援多輪對話,例如詢問符合預算且提供素菜的餐廳並查詢停車狀況。此更新目前在全球 iOS 裝置(Gemini 可用地區)推出,並將逐步滾動至 Android。此次更新伴隨 Google Maps 新增 Gemini 驅動的「出發前知曉」提示區塊,提供預訂建議、隱藏選單專案及最佳停車位等資訊,並最佳化探索標籤頁與新增電動車充電器可用性預測功能。此舉發生在 Google 日前更新 Chrome 瀏覽器,整合增強版 Gemini 代理功能以與 OpenAI、Perplexity 等公司競爭,並推出持久化 Gemini 側邊欄及自動瀏覽功能。
-
馬克·祖克柏預告2026年將推出重大AI更新與自主商業工具
Facebook 創辦人馬克·祖克伯格(Mark Zuckerberg)在週三投資者通話中表示,Meta 使用者將在數個月內開始接觸公司推出的新 AI 模型與產品。他提到,2025 年公司已重構了 AI 計畫的基礎,並預計在新的一年穩步推進技術邊界。雖然未提供具體時間表或產品細節,但祖克伯格強調 AI 驅動的商業應用是重點關注領域,特別是新的代理購物工具將讓使用者從平臺目錄中找到合適商品。此舉呼應了 Google 與 OpenAI 等企業已建立的代理交易平臺,儘管其他實驗室已具備技術基礎設施,Meta 認為其對個人資料的存取能力將提供獨特價值,能理解使用者歷史、興趣、內容及關係等個人情境。 Meta 於 12 月收購了通用代理開發商 Manus,並承諾繼續營運與整合該服務。此次通話正值 Meta 最新季度財報發布,財報顯示資本開支顯著增加。公司預計 2026 年整體資本開支將介於 1150 億美元至 1350 億美元之間,較 2025 年的 720 億美元大幅上升,資金將用於支援 Meta 超級智慧實驗室及核心業務。此數字雖低於祖克伯格此前預估的 2028 年 6000 億美元總開支,但投資增幅明確。儘管投資者曾批評 Meta 未清楚說明龐大 AI 投資如何轉化為獲利,祖克伯格仍表示 AI 實驗室成果將盡快惠及公眾,並加速業務發展與未來基礎設施建設。