分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
Rebel Audio 是一個專為新手創作者打造的全新 AI 廣播工具
Rebel Audio 是一款旨在簡化播客製作流程的全新平臺,專為初創者設計,解決了傳統播客製作中裝置、軟體及推廣門檻過高的問題。該平臺提供一站式解決方案,讓創作者能在單一介面完成節目製作、錄音、編輯、上傳封面、生成字幕、製作社交媒體短影片及發布等所有步驟。Rebel Audio 近期在過額定的種子輪融資中獲得 380 萬美元,官方公開測試將於 5 月 30 日開始。隨著播客產業預計在 2030 年達到 1145 億美元規模,且 2025 年全球播客聽眾已超過 5.84 億人,市場需求顯著增長。 Rebel Audio 的核心賣點在於將營收整合至平臺初期,提供廣告、品牌合作、動態廣告插入及聽眾訂閱等功能。平臺大量運用人工智慧技術,包括 AI 助手協助命名與描述、根據概念生成封面圖、自動轉錄、配音、翻譯及聲音克隆。針對 AI 生成內容可能引發的版權與倫理爭議,Rebel Audio 已實施防護機制,例如聲音克隆需使用者確認許可權,並設有過濾系統防止不當影象生成。該平臺由 AI 諮詢公司 Lattice Partners 開發,創辦人 Jared Gutstadt 曾創立 Audio Up,並計劃將包含 Machine Gun Kelly 等知名人士的節目目錄遷移至新平臺。團隊成員來自 MGM 與 DreamWorks,並邀請了《Survivor》與《Shark Tank》製作人 Mark Burnett 擔任顧問。服務價格分為三檔,基礎版每月 15 美元,Plus 版每月 35 美元,Pro 版每月 70 美元,涵蓋動態廣告插入、訂閱功能及多語言支援等高階特性。
-
Google Workspace 內 Gemini 優化功能值得使用的特色
Google 正持續將 Gemini 整合進 Google Workspace,涵蓋 Docs、Gmail、Sheets、Slides、Drive、Meet 及 Calendar 等多個應用。以下為各應用中 Gemini 的實用功能摘要。在 Google Docs 中,Gemini 擅長自動摘要長文與報告,並提供「Help me create」工具,根據 Drive、Gmail 及 Chat 的上下文生成文章初稿,另有「Help me write」用於潤飾文字、「Match writing style」統一文風,以及「Match the format」複製檔案結構,這些功能目前仍在測試階段。Gmail 方面,「AI Inbox」能過濾非重要郵件並高亮關鍵訊息,如醫療預約或體育練習提醒;Gemini 可摘要長郵件串,並提供「Help me write」生成不同語氣的回覆,以及「AI Overview」功能,可透過提問搜尋過去郵件中的特定資訊,例如查詢去年浴室裝修的報價單。在 Google Sheets 中,Gemini 能透過單一提示整合 Gmail、Chat 及 Drive 資訊生成結構化表格,並自動繪製圖表,還有「Fill with Gemini」功能加速表格填補。Google Slides 的 Gemini 優勢在於格式化,可快速建立符合主題的簡報初稿,並支援「refine text」縮短段落或調整格式,此外還可使用 Nano Banana 編輯圖片。Google Meet 的自動筆記功能可捕捉會議重點、決策與行動專案,並協助延遲加入者快速瞭解內容,同時具備實時翻譯字幕、改善音質等升級功能。Google Drive 允許快速搜尋檔案、摘要行銷計畫或生成更新內容,並提供「AI Overview」整合多檔案資訊,新測試工具「Ask Gemini in Drive」則可跨日曆、檔案、郵件及網路提問。Google Calendar 的「Help me schedule」能根據所有人時程建議最佳會議時間,並考慮個人偏好,還能自動建立事件與調整重排時間以減少衝突。Google Chat 可摘要對話串、提取行動專案並撰寫回覆,同時能連結檔案進行提問。Google Vids 中,Gemini 可根據主題生成影片粗剪、撰寫指令碼與旁白,並透過 transcript trimming 移除口語贅字,甚至利用 Gemini Veo 3 將圖片轉為影片或輸入指令碼使用 AI 虛擬人。最後,Google Forms 的 Gemini 能根據描述
-
此新創公司希望讓企業軟體看起來更像一個提示
新創公司 Eragon 由 Josh Sirota 於八月創立,近期以 1 億美元的投後估值籌資 1200 萬美元,旨在為企業客戶開發一套代理式人工智慧作業系統。Sirota 提出「軟體已死」的理論,認為未來商業運作將透過提示詞(prompt)取代傳統介面,Eragon 試圖透過大型語言模型整合 Salesforce、Snowflake、Tableau 及 Jiras 等全套企業軟體。該公司團隊包含來自伯克利與 MIT 的博士後進士,並獲得 Arielle Zuckerberg、Soma Capital 及 Axiom Partners 等機構投資。 Eragon 的技術策略在於利用客戶資料對開源模型如 Qwen 和 Kimi 進行後訓練,並確保資料與模型權重保留在企業自有雲端環境中,以解決安全與審計問題。目前該工具已應用於 Corgi 等數十家新創與大型企業,Corgi 執行長 Nico Laqua 稱其為市場上最佳應用型企業人工智慧。Sirota 預期 Eragon 將成為連線現代團隊運作與決策的關鍵組織,並預測該公司將於今年年底成為十億美元企業。此發展與 Nvidia 執行長 Jensen Huang 在 GTC 會議上提出的「代理式即服務」概念及 NemoClaw 計劃相呼應,顯示企業級代理式人工智慧競爭將日益激烈。儘管 MIT 資料指出 95% 的企業人工智慧試點失敗,Sirota 仍堅信透過讓高層真正掌握員工日常運作,Eragon 能成功突破市場瓶頸。
-
Google 的個人智能功能將擴展至所有美國用戶
Google 於週二宣佈將擴充套件其「個人智慧」功能,該功能允許 AI 助手透過連結 Gmail、Google 照片等生態系統來為使用者量身打造回應,此舉將惠及美國所有使用者。此前該功能僅限付費使用者使用,現已開放於搜尋引擎的 AI 模式、Gemini 應用程式以及 Chrome 中的 Gemini。Google 表示,無論使用者是尋找之前購買的特定品牌運動鞋,還是根據飯店確認單和過去旅行回憶規劃家庭度假,個人智慧都能協助使用者無需提供所有背景資訊即可找到所需內容。該功能預設為關閉狀態,使用者可選擇是否及何時將 Google 應用程式與這些服務連結。若使用者在輪胎店忘記車輛輪胎尺寸,Gemini 可透過識別 Google 照片中的家庭公路旅行照片,進一步建議適合所有天氣的輪胎。在規劃假期時,AI 模式可結合 Gmail 中的訂房記錄與 Google 照片中的過往旅行回憶,推薦包含適合每位家人喜好的客製化行程,例如基於照片中許多冰淇淋自拍而推薦一家老式冰淇淋店。另一例子是尋找新包包以搭配剛購買的鞋子,Chrome 中的個人智慧會根據近期購買記錄和偏好的品牌風格提供選項,甚至推薦與新金色鞋子配飾相符的包袋細節。Google 強調,Gemini 不會直接訓練於 Gmail 收件箱或 Google 照片庫,而是基於 Gemini 或 AI 模式中的特定提示及模型回應進行訓練。個人智慧今日已在美國的搜尋引擎 AI 模式中可用,並開始向美國免費層級使用者在 Gemini 應用程式和 Chrome 中推出。Google 指出,這些體驗僅適用於個人 Google 帳戶,不適用於 Workspace 企業、企業或教育使用者。