分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
前Apple設計師現任Hark打造新AI介面
secretive AI 實驗室 Hark 由創業者 Brett Adcock 創立,宣佈將重新定義人類與智慧軟體的互動方式。該公司計劃設計多模態端到端模型、硬體及介面,以提供「無縫的端到端個人智慧產品」。系統將具備持久記憶,能即時聽、看並與世界互動。Hark 的創辦人 Adcock 在內部備忘錄中指出,當前的 AI 模型不夠智慧,且現有裝置本質上仍屬於 AI 之前,未來將走向類似科幻作品中 Jarvis 或 Her 般的系統,能預測、適應並真正關心使用者。 Hark 已聘請前 Apple 工業設計師 Abidur Chowdhury 擔任設計總監,他負責過 iPhone Air 的設計團隊。Chowdhury 表示,雖然無法透露詳細路線圖,但公司預計今年夏天推出 AI 模型的首次發布。他強調,世界正在改變,但現有裝置仍圍繞舊平臺設計,未來應將智慧置於基礎層而非僅作為應用程式。Chowdhury 認為日常任務如填寫表格、跨裝置分享資訊或規劃旅行應被自動化,以減少使用者的焦慮與時間消耗。他對穿戴式 AI 裝置持保留態度,認為不應在人類與介面之間增加額外層。 Hark 目前擁有 45 名工程師與設計師,包括來自 Meta、Apple 和 Tesla 的專家,所有員工位於 Adcock 旗下其他公司的同一校園。公司預計於四月開始使用新的數千張 Nvidia GPU 叢集。Hark 獲得 Adcock 1 億美元的個人種子資金,正加入各大科技公司爭奪人才與技術的浪潮,試圖解決現有數位生活模型帶來的挫敗感,並打造更優越的個人智慧體驗。
-
靈活機器人成為最新與Google DeepMind合作的機器人公司
德國敏捷機器人公司(Agile Robots)近日與 Google DeepMind 簽署戰略研究合作協議,旨在共同開發具備人工智慧能力的機器人。該合作由敏捷機器人公司於二日在德國慕尼黑正式宣佈。根據協議內容,敏捷機器人將在其機器人中實施 Google DeepMind 的 Gemini 機器人基礎模型,同時收集機器人產生的資料以最佳化底層 Gemini AI 模型。雙方將協同工作,測試、微調並部署應用 Gemini 基礎模型的機器人,涵蓋電子製造、汽車、資料中心及物流等產業領域。敏捷機器人公司共同創辦人兼執行長陳兆峰表示,該公司已在全球安裝超過兩萬套機器人解決方案,證明瞭大規模智慧自動化的可行性,並指出整合 Gemini 機器人模型將使公司處於快速增長市場的領先地位。此項合作被描述為長期性質,但雙方未透露具體時長或價格細節。敏捷機器人公司成立於二零一八年,已從包括軟銀視覺基金、小米集團及中亞集團在內的多位投資者處籌集超過二億七千萬美元風險投資。這是今年第二家與 Google DeepMind 達成合作以推進技術的機器人硬體公司,此前今年早些時候,由現代汽車持有的波士頓動力學公司也宣佈與 Google DeepMind 合作,利用其 AI 基礎模型開發人形機器人 Atlas。此外,德國機器人新創公司 Neura Robotics 亦於三月初與高通達成合作,使用其 IQ10 處理器系列作為未來機器人的參考設計。隨著硬體與軟體日益複雜,具備不同專長的企業透過合作開發自主運作機器人成為趨勢,業界普遍認為實體 AI 是下一個市場前沿,這些合作將推動該領域持續加速發展。
-
蘋果公布2026年WWDC日期,預告將展示「人工智慧進展
蘋果公司宣佈其下一屆全球開發者大會(WWDC)將於六月八日至六月十二日在加州庫比蒂諾總部及線上舉行。與去年專注於「液態玻璃」介面設計不同,今年大會將聚焦於「人工智慧程序」,並涵蓋 iOS、macOS、tvOS 及 watchOS 平臺的更新,同時提供新的軟體與開發工具。會議將透過 Apple Developer 應用程式、官方網站及 YouTube 頻道直播,中國地區則在 Bilibili 頻道播出。市場預期蘋果將推出搭載先進人工智慧功能的新一代 Siri,並可能展示具備更佳個人情境理解與螢幕感知能力的版本。此外,蘋果今年初已與 Google 簽署協議,利用 Gemini 驅動平臺上的 AI 功能。去年大會曾宣佈 Foundation Model 框架,允許 AI 模型在離線環境運作,今年或將進一步展示相關進展。同時,蘋果此前已將 ChatGPT 等編碼模型引入 Xcode,並在今年初引入了 Anthropic 的 Claude Agent 與 OpenAI 的 Codex 等代理編碼工具,這些發展均可能在本屆大會中獲得更多關注。
-
Littlebird 筹得 1100 萬美元資金開發 AI 辅助的「回憶」工具,可讀取電腦螢幕
近期關於為 AI 系統建立語境(context)的討論日益增多,許多消費級軟體起點於搜尋、檔案與會議,旨在捕捉數位生活語境並提供工具連結。Rewind(後改名為 Limitless 並被 Meta 收購)與 Microsoft Recall 試圖捕捉螢幕畫面以協助記憶,而新創公司 Littlebird 則採取不同策略,透過「閱讀」螢幕並將語境儲存為文字格式,而非僅存擷圖。該產品核心理念是透過持續讀取螢幕,使用者無需額外提供生產力語境。Littlebird 允許使用者自訂忽略的應用程式,並自動排除密碼管理員及包含密碼、信用卡等敏感欄位的網頁表單。使用者可連結 Gmail、Google Calendar、Apple Calendar 及 Reminders 等應用程式,並透過預設提示如「今天做了什麼?」或「哪些郵件重要?」來查詢資料,這些提示會隨著時間推移變得更加個人化。 此外,Littlebird 內建類似 Granola 的筆記本,利用系統音訊在背景執行以轉錄會議並生成行動專案。在詳細檢視中,「會議準備」功能會整合過往會議、郵件及公司歷史背景,並從 Reddit 等來源獲取使用者對特定產品或公司的看法。另一工具 Routines 提供可重複執行的詳細提示,如每日簡報、每週活動摘要及昨日工作摘要,使用者亦可自訂指令。Littlebird 由 Alap Shah、Naman Shah 及 Alexander Green 於 2024 年創立,前身為被 AlphaSense 收購的 Sentieo。Green 指出,與依賴擷圖的 Rewind 相比,Littlebird 僅儲存文字資料,使資料量更輕且更具隱私性,同時需將資料儲存於雲端以執行強大模型。該產品免費下載,但付費計劃從每月 20 美元起,提供更多使用限制及影象生成功能。Littlebird 已籌資 1100 萬美元,由 Lotus Studio 領投,參與投資者包括 Lenny Rachitsky、Scott Belsky、Gokul Rajaram、Justin Rosenstein、Shawn Wang 及 Russ Heddleston。投資者認為該產品消除了記憶、檢索及重述自身工作的摩擦,並強調找到關鍵使用案例對產品長期成功至關重要。