分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
DoorDash 加入 AI 工具加速商家入伙並修飾餐點照片
DoorDash 於週一推出了新的 AI 驅動工具,協助商家加速上線流程、編輯照片以提升菜品視覺效果,並基於其應用程式列表建立網站。上線工具運作方式類似於 Amazon 於 2024 年推出的版本,商家可將工具指向其網站,自動抓取照片、營業時間及選單專案等資訊以建立應用程式列表,並在發布前審查與編輯所有內容。DoorDash 還重構了其影片庫,允許商家在影片中標記菜品,使顧客能直接點選訂購,並展示總瀏覽量、由影片驅動的銷售額及新顧客銷售等統計資料。此外,餐廳獲得了幾款照片編輯工具,包括 AI Retouch,可替換背景、 sharpen 圖片並最佳化照明而不改變菜品樣貌;以及 AI Replate,可操作菜品圖片使其看起來像專業擺盤,調整照明與色彩,商家亦可提供參考圖片以應用特定風格。DoorDash 負責人 Brian Tolkin 表示,這些新工具反映了公司信念,即正確技術應消除摩擦而非增加摩擦,讓商家專注於製作美食與提供顧客體驗。公司也在商業平臺新增功能,讓餐廳老闆可基於現有 DoorDash 內容(如選單與照片)快速建立網站,測試顯示該功能平均訂單轉換率接近 10%。公司還新增了行銷活動建立器,讓商家自動化內容創作、電子郵件外聯與排程。
-
哈佛 study 中,AI 提供的急診診斷準確度高過兩名人類醫生
一項新研究探討大型語言模型在多種醫療情境下的表現,包括真實的急診室案例,其中至少有一個模型在準確性上似乎優於人類醫生。該研究於本週發表於《Science》期刊,由哈佛醫學院與貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center)的醫師與電腦科學家領導的研究團隊完成。研究人員進行了多項實驗,以衡量 OpenAI 的模型與人類醫師的表現差異。其中一項實驗聚焦於 76 位進入貝斯以色列急診室的病患,比較兩位內科主治醫師的診斷與 OpenAI 的 o1 及 4o 模型生成的診斷。這些診斷由另外兩位不知曉來源的主治醫師評估。研究指出,在每個診斷接觸點,o1 模型表現與兩位主治醫師相當或略優,且在資訊最少且最需緊急決策的初階分診階段,這種差異尤為顯著。 哈佛醫學院在新聞稿中強調,研究人員未對資料進行任何預處理,AI 模型僅接收電子醫療記錄中當時可用的資訊。在此情況下,o1 模型在 67% 的分診案例中提供了完全或非常接近的診斷,而其中一位醫師僅在 55% 的案例中達成,另一位則為 50%。研究負責人之一、哈佛醫學院 AI 實驗室主管 Arjun Manrai 表示,該模型在幾乎所有基準測試中均超越先前的模型及醫師基線。然而,研究並未宣稱 AI 已準備好做出危及生命的緊急決策,而是指出需要進行前瞻性試驗以評估這些技術在真實世界患者照護中的表現。研究人員還指出,模型僅針對文字資訊進行測試,現有研究顯示基礎模型在處理非文字輸入時推理能力有限。 貝斯以色列的醫生 Adam Rodman 警告稱,目前缺乏關於 AI 診斷的正式責任框架,且患者仍希望人類引導其做出生死攸關及具挑戰性的治療決策。急診醫師 Kristen Panthagani 在評論中表示,這是一項有趣的 AI 研究,但也引發了一些過度吹噓的標題,因為研究比較的是 AI 診斷與內科醫師,而非急診醫師。她指出,若要比較 AI 工具與醫師的臨床能力,應先與實際該專科醫師比較,並強調急診醫師的首要目標是確定患者是否有致命狀況,而非
-
ChatGPT Images 2.0 在印度受歡迎,但在其他地區尚未成為主要成功案例
OpenAI 於週四表示,印度已成為 ChatGPT Images 2.0 自上線以來最大的使用者群體。然而,TechCrunch 審查的第三方資料顯示,全球反應較為謹慎,整體增長有限,僅在部分新興市場出現顯著波動。ChatGPT Images 2.0 作為 OpenAI 最新的影象生成升級版本,旨在處理更複雜的提示詞並生成包含多語言準確文字的詳細視覺效果。早期資料顯示,使用者特別是在其最大市場印度,正利用該工具建立個人視覺內容,如頭像、風格化肖像及幻想主題影象。Sensor Tower 與 Similarweb 提供的資料表明,儘管 ChatGPT 應用下載量週增 11%,但整體參與度增長溫和,日活躍使用者與會話數僅上升約 1%。全球網頁流量亦僅微幅增長約 1.6%。不過,Sensor Tower 資料指出,巴基斯坦、越南及印尼等新興市場的下載量出現 sharper spikes,部分地區週增高達 79%。印度在下載量方面表現突出,上線週下載約 500 萬次,遠高於美國的 200 萬次,但週增幅度仍屬溫和,印度日活躍使用者則上升約 3.4%。在印度,早期趨勢顯示 ChatGPT Images 2.0 主要被用作自我表達的工具,使用者利用日常照片建立工作室風格肖像、社交媒體-ready 影象及以自身為中心的想像視覺。資料還顯示 AI 影象工具在不同市場的採用方式存在差異,雖然印度龐大的使用者群體推動了整體規模,但巴基斯坦和印尼等地的顯著增長表明新興市場對新使用者的需求更強。OpenAI Images 2.0 的推出正值 AI 影象生成競爭加劇之際,Google 的 Nano Banana 模型此前在印度也獲得了強勁的早期 traction。隨著新版本的發布,OpenAI 進一步提升了非拉丁文字(如印地語和孟加拉語)的渲染能力,並引入新的「思考」功能,允許其從單一提示詞中最佳化輸出並生成多種變體。除了風格化肖像和頭像外,印度早期使用者還嘗試了更廣泛的格式,從幻想新聞封面到塔羅風格視覺及時尚情緒板。此外,使用者還利用該 AI 工具修復舊照片並建立電影風格肖像拼貼,這表明早期的使用模式更偏向
-
OpenAI 限制訪問 Cyber 也因曾貶損 Anthropic 的限制措施
OpenAI 創辦人 Sam Altman 在批評 Anthropic 限制其網路安全工具 Mythos 僅對選定使用者開放後,確認 OpenAI 將對競爭對手工具 Cyber 採取同樣做法。Altman 於週四在 X 平臺發文表示,OpenAI 將於數日內開始向關鍵網路防禦者推出 GPT-5.5-Cyber 版本。OpenAI 在其網站提供應用程式,使用者需提交資格認證及計劃用途以獲取訪問許可權。該版本 Cyber 可執行滲透測試、漏洞識別(及利用)以及惡意軟體逆向工程等任務,旨在協助企業發現安全漏洞並測試防禦機制,但擔心可能被惡意勢力濫用。此前當 Anthropic 限制 Mythos 訪問時,Altman 稱此為基於恐懼的行銷,部分評論家也認為其言論過度誇張,且有人未經授權成功取得 Mythos 訪問許可權。OpenAI 正透過與美國政府諮詢並識別更多具備合法網路安全資格的使用者來擴大 Cyber 的可用性。據 TechCrunch 報導,OpenAI 稱為可信訪問(TAC)的系統已驗證數千名防禦者及數百支負責保護關鍵軟體的團隊。這些使用者可使用最新模型 GPT 5.5 進行網路安全任務,且受安全防護幹擾較少。TAC 許可權計畫分為不同層級,具備合法防禦用途的關鍵防禦者可申請訪問更允許網路攻擊的模型,如 GPT-5.4-Cyber 及即將推出的 GPT-5.5-Cyber。