文章
所有發布的 AI 新聞與論文。
-
Grok Imagine 是 xAI 新推出的 AI 圖像與影片生成器,讓你製作 NSFW 內容
Elon Musk 旗下的 xAI 公司正式將 Grok Imagine 推出至所有 SuperGrok 及 Premium+ 訂閱使用者的 iOS 應用程式中。該工具可將文字或圖片提示轉換為包含原生音效的十五秒影片,並具備允許生成不適合工作場所(NSFW)內容的「辛辣模式」。此模式允許生成性暗示內容,包括部分女性裸露影像,但存在嚴格限制。測試顯示,許多試圖生成極度露骨內容的提示詞會被系統模糊處理或拒絕,僅能生成半裸露影像。 這種不限制內容的設定符合 Musk 將 Grok 定位為無過濾、突破邊界的人工智慧的立場。此前 xAI 已發布過一個充滿色情色彩的動漫 AI 伴侶,引發了對其可能帶來非預期後果的擔憂。過去 Grok 因生成仇恨、反猶太及厭女內容而受到批評,Grok Imagine 也可能面臨類似挑戰。儘管如此,現有的限制機制仍具安慰性,因為模型允許建立名人影像,如唐納德·特朗普或泰勒·斯威夫特,但對這些物件有額外約束。例如,嘗試生成懷孕的特朗普時,系統僅生成了他抱著嬰兒或站在孕婦旁的畫面。 Grok Imagine 旨在與 Google DeepMind、OpenAI、Runway 及中國競爭對手抗衡。目前生成的真人影像與影片仍處於「恐怖谷」效應中,皮膚質感蠟質且偶爾帶有卡通化特徵。不過,該生成器表現令人印象深刻,能從文字提示在數秒內生成圖片,並隨滾動自動產生新圖,隨後可動畫化為風格化影片。其使用者介面流暢直觀,Musk 亦表示該模型將每日進步。
-
OpenMind 要成為人形機器人的作業系統
矽谷公司 OpenMind 專注於開發人形機器人底層軟體,其推出的 OM1 系統被視為機器人界的 Android,具備開放原始碼且硬體無關的特性。創辦人兼史丹佛大學教授 Jan Liphardt 指出,隨著機器人應用場景從重複性任務轉向需要人類與機器深度互動的居家環境,傳統系統已無法滿足需求,必須發展出更具人類思維模式的作業系統。OpenMind 於本週推出 FABRIC 協議,使機器人能驗證身份並共享情境資訊,利用機器學習能力快速建立連線,例如透過共享語言資料來提升多語言互動能力。該公司成立於 2024 年,預計於九月交付首批十臺由 OM1 驅動的機器人犬。近期 OpenMind 完成由 Pantera Capital 領投、Ribbit、Coinbase Ventures 及 Pebblebed 等機構參與的兩千萬美元融資。公司強調將產品投放市場以收集反饋,並快速迭代最佳化,目標是讓機器人能力與人類需求最佳匹配。
-
蘋果可能正在開發自己的 AI 回答引擎
彭博社記者馬克·古爾曼報導,蘋果已成立一支新團隊,代號為答案、知識與資訊,旨在開發類似 ChatGPT 的應用程式。該團隊正在構建一個能整合全球網路資訊以回答問題的「答案引擎」。此引擎可能以獨立應用程式形式運作,或將搜尋功能整合進 Siri、Safari 及其他蘋果產品中。古爾曼指出,蘋果正針對該團隊招募人員,特別尋找具備搜尋演演算法與引擎開發經驗的申請者。儘管蘋果已將 ChatGPT 整合至 Siri 中,但針對語音助理的更個人化、AI 驅動的更新屢次延遲。此外,由於谷歌在壟斷法訴訟中敗訴,蘋果可能需調整與谷歌的搜尋合作協議。
-
OpenAI 的努力讓 AI 做你想要的任何事情
2022 年,研究員 Hunter Lightman 加入 OpenAI 後,目睹了 ChatGPT 的爆發式成長,同時他領導的 MathGen 團隊專注於訓練模型解決高中數學競賽題目。該團隊被視為 OpenAI 開發具備人類般推理能力的 AI 代理的核心技術基礎。儘管 OpenAI 的最新系統仍存在幻覺問題,但其模型在數學推理方面已顯著進步,其中一個模型近期在國際數學奧林匹克(IMO)中奪得金牌。OpenAI 執行長 Sam Altman 在 2023 年 11 月 6 日的開發者會議上表示,未來的 AI 代理將能自動完成各種任務。 OpenAI 的推理模型突破與強化學習(RL)技術密切相關。2016 年,Google DeepMind 的 AlphaGo 利用 RL 擊敗人類棋手,啟發了 OpenAI 員工 Andrej Karpathy 的構想。2018 年,OpenAI 推出了 GPT 系列大語言模型,但初期在數學處理上表現不佳。直到 2023 年,OpenAI 結合大語言模型、強化學習及「測試時計算」技術,推出了代號「Q*」後更名為「Strawberry」的模型,並引入「鏈式思維」(Chain-of-thought)方法,使模型能像人類一樣進行推理、發現錯誤並回溯。這項突破直接促成了 2024 年秋季推出的 o1 推理模型的誕生。 o1 模型的研發動員了 21 名基礎研究員,其中部分人才隨後被 Meta 以超過 1 億美元的薪酬聘請。OpenAI 透過投入大量計算資源和人才,成功開發出 o1,該模型能同時生成多個代理並探索不同想法以選擇最佳答案。這種技術也被 Google 和 xAI 採用。目前,OpenAI 正致力於將這些推理能力應用於更具主觀性的任務,如網購或尋找停車位,並計劃在未來的 GPT-5 模型中實現更直觀的代理體驗。儘管面臨 Google、Anthropic 等競爭對手,OpenAI 仍希望透過持續的技術創新維持其行業領導地位。