分類: AI 應用

「AI 應用」分類的 AI 新聞與論文。

我在 Google 新 AI 世界生成器中建造棉花糖城堡

2026年1月29日

Google DeepMind 於週四起開放 Project Genie 給美國 Google AI Ultra 訂閱者使用，這是一款能從文字提示或圖片建立互動遊戲世界的實驗性原型工具。該工具結合了 Genie 3 世界模型、Nano Banana Pro 圖片生成模型以及 Gemini。此舉是 DeepMind 為開發更強大的世界模型而收集使用者反饋與訓練資料的一部分。世界模型能生成環境的內部表示並預測未來結果，被視為實現人工通用智慧（AGI）的關鍵步驟。 Project Genie 允許使用者提供環境和主角的文字提示，由 Nano Banana Pro 生成圖片作為基礎，隨後 Genie 將其轉化為可探索的互動世界。使用者可修改圖片或基於真實照片建立世界，但模型偶爾會產生錯誤，例如將綠色頭髮生成為紫色。目前系統僅提供 60 秒的世界生成與導航時間，以應對計算資源限制。該工具已啟用安全防護，禁止生成涉及裸露或侵犯迪士尼等版權內容的世界。測試顯示，Project Genie 在藝術風格（如黏土動畫、水彩、動漫）上表現出色，但在追求照片級真實感或電影效果時表現不佳，常呈現出遊戲感。使用真實照片時，模型有時會扭曲場景或產生不自然的數位感。導航控制方面，箭鍵、空格鍵及 WASD 鍵有時反應遲鈍或方向錯誤，導致移動困難。DeepMind 研究人員承認這是實驗性質的原型，未來將致力於提升真實感與互動能力，包括改善角色穿牆問題及提供更多使用者控制選項。儘管存在缺陷，該工具仍展示了在娛樂領域應用世界模型的潛力，並可能未來擴充套件至模擬訓練實體機器人。
印度示範如何透過AI提升教育規模化效益

2026年1月29日

隨著人工智慧加速進入全球教室，Google 發現最艱難的擴充套件課題並非來自矽谷，而是源自印度學校。印度擁有超過十億網民，目前是全球 Gemini 學習使用量最高的地區。Google 教育副總裁兼總經理 Chris Phillips 表示，印度教育體系由州級課程決定、政府深度參與且資源分配不均，這使得 Google 必須放棄傳統的「一刀切」產品策略。根據印度政府 2025-26 年經濟調查，該國小學教育系統服務約 2.47 億學生，遍佈近 147 萬所學校，並有 1010 萬名教師；高等教育系統則有超過 4300 萬名學生，較 2014-15 學年增長 26.5%。 Google 在印度的經驗顯示，教育 AI 無法由公司統一定義，而必須讓學校和行政人員自行決定如何使用。此外，Google 正轉向以教師為主要控制點，設計輔助教學規劃、評估與管理的工具，以維護關鍵的師生關係。面對部分學校缺乏個人裝置或穩定網路的挑戰，Google 正推動多模態學習，結合影像、聲音與文字，並透過 Gemini 提供 JEE Main 考試準備服務，以及培訓 4 萬名 Kendriya Vidyalaya 教師。 OpenAI 與 Microsoft 也在印度加強教育佈局，OpenAI 任命前 Coursera 亞太區總監 Raghav Gupta 為印度及亞太區教育主管，Microsoft 則與 Physics Wallah 等機構合作。儘管印度最新經濟調查警告過度依賴 AI 可能導致認知退化與批判性思維下降，但 Google 認為印度的複雜挑戰預示了全球公共教育系統將面臨的管控、存取與在地化問題。隨著生成式 AI 深入教育領域，這些壓力將逐漸在其他國家顯現，Google 在印度的實踐經驗對產業至關重要。
Google地圖現在讓您在行走與騎自行車時可使用Gemini

2026年1月29日

Google 於週四宣佈，Google Maps 使用者現在可以在走路或騎腳踏車時，透過手勢操作無縫使用 Gemini 進行語音對話。此更新距離 Google Maps 推出 Gemini 驅動的無手駕駛體驗僅數月，標誌著 Google 將 Gemini 整合進日常生活的持續努力，並將 Maps 從靜態導航轉變為即時對話式導航。使用者在步行時可詢問關於所在社群的更多資訊、推薦必訪景點，或查詢沿線有衛浴設施的咖啡廳。Google 指出，步行打字不易，因此推出此功能讓使用者在保持步調或專注道路時即可提問。騎車者亦可詢問預計到達時間或下次會議時間，甚至可要求 Gemini 傳送訊息告知他人自己已晚到十分鐘。該功能支援多輪對話，例如詢問符合預算且提供素菜的餐廳並查詢停車狀況。此更新目前在全球 iOS 裝置（Gemini 可用地區）推出，並將逐步滾動至 Android。此次更新伴隨 Google Maps 新增 Gemini 驅動的「出發前知曉」提示區塊，提供預訂建議、隱藏選單專案及最佳停車位等資訊，並最佳化探索標籤頁與新增電動車充電器可用性預測功能。此舉發生在 Google 日前更新 Chrome 瀏覽器，整合增強版 Gemini 代理功能以與 OpenAI、Perplexity 等公司競爭，並推出持久化 Gemini 側邊欄及自動瀏覽功能。
馬克·祖克柏預告2026年將推出重大AI更新與自主商業工具

2026年1月28日

Facebook 創辦人馬克·祖克伯格（Mark Zuckerberg）在週三投資者通話中表示，Meta 使用者將在數個月內開始接觸公司推出的新 AI 模型與產品。他提到，2025 年公司已重構了 AI 計畫的基礎，並預計在新的一年穩步推進技術邊界。雖然未提供具體時間表或產品細節，但祖克伯格強調 AI 驅動的商業應用是重點關注領域，特別是新的代理購物工具將讓使用者從平臺目錄中找到合適商品。此舉呼應了 Google 與 OpenAI 等企業已建立的代理交易平臺，儘管其他實驗室已具備技術基礎設施，Meta 認為其對個人資料的存取能力將提供獨特價值，能理解使用者歷史、興趣、內容及關係等個人情境。 Meta 於 12 月收購了通用代理開發商 Manus，並承諾繼續營運與整合該服務。此次通話正值 Meta 最新季度財報發布，財報顯示資本開支顯著增加。公司預計 2026 年整體資本開支將介於 1150 億美元至 1350 億美元之間，較 2025 年的 720 億美元大幅上升，資金將用於支援 Meta 超級智慧實驗室及核心業務。此數字雖低於祖克伯格此前預估的 2028 年 6000 億美元總開支，但投資增幅明確。儘管投資者曾批評 Meta 未清楚說明龐大 AI 投資如何轉化為獲利，祖克伯格仍表示 AI 實驗室成果將盡快惠及公眾，並加速業務發展與未來基礎設施建設。

分類: AI 應用

我在 Google 新 AI 世界生成器中建造棉花糖城堡

印度示範如何透過AI提升教育規模化效益

Google地圖現在讓您在行走與騎自行車時可使用Gemini

馬克·祖克柏預告2026年將推出重大AI更新與自主商業工具