語言: 英文
英文 的 AI 新聞與論文。
-
OpenAI 即將推出 Sora 應用程式,其自訂 TikTok 對手,並同步發佈 Sora 2 模型
OpenAI 於 2025 年 9 月 30 日星期二宣佈推出 Sora 2,這是一款旨在取代去年 Sora 的音訊與影片生成模型。隨之而來的是一個名為 Sora 的聯動社交應用,使用者可在此生成自己及朋友的影片並分享到類 TikTok 的演算法Feed 中。雖然團隊尚未親自測試該邀請制應用與 Sora 2 模型,但 OpenAI 已分享令人印象深刻的範例。Sora 2 在遵循物理法則方面表現更佳,使影片更真實。公開片段展示了海灘排球比賽、滑板技巧、體操動作及跳水板跳入水中等場景。OpenAI 指出,先前的影片模型過於樂觀,常會扭曲現實以滿足文字提示,例如籃球未投中時球會自動飛入籃筐;而在 Sora 2 中,未投中的球會反彈至後板。 Sora 應用內含名為「Cameos」的「上傳自己」功能,允許使用者將自己置入任何 Sora 生成的場景中。為此,使用者需上傳一次性的影片與音訊錄製以驗證身份並捕捉外貌。此功能還允許使用者分享自己的 Cameos,並授予他人許可權將其形象納入生成的影片中,包括多人同框影片。OpenAI 認為,基於此功能的社交應用是體驗 Sora 2 魔力的最佳方式。Sora iOS 應用現已可下載,初期將在美國和加拿大推出,但 OpenAI 希望迅速擴充套件至其他國家。目前 Sora 社交平臺為邀請制,但 ChatGPT Pro 使用者無需邀請即可嘗試 Sora 2 Pro 模型。 生成的影片可在 Sora 應用內的 Feed 中分享,類似 TikTok、Instagram Reels 或其他短影片 Feed。Meta 上週剛在其 Meta AI 應用中新增了名為「Vibes」的影片 Feed。為了編排演算法推薦,OpenAI 將考慮使用者的 Sora 活動、位置(透過 IP 地址獲取)、過去帖子的參與情況以及 ChatGPT 對話歷史,儘管這些可關閉。Sora 應用還附帶透過 ChatGPT 實現的家長控制功能,允許家長覆蓋無限滾動限制、關閉演算法個性化並管理誰可以給孩子傳送直接訊息,但這些功能的效果取決於家長的技術知識。Sora 應用在推出
-
AI 聘請或人類努力?揭密 startups 操作的新前沿:TechCrunch Disrupt 2025
在 2025 年 10 月 27 日至 29 日於舊金山 Moscone West 舉辦的 TechCrunch Disrupt 活動中,一場關於用 AI 代理取代或補充早期員工的新浪潮主題板塊將揭開序幕。該板塊由 Builders Stage 主辦,邀請了技術創始人與資深營運者,探討人與機器之間的界線以及過度自動化帶來的風險。參與者包括 Firecrawl 的創辦人兼執行長 Caleb Peffer,他協助超過 35 萬開發者及 Shopify、Zapier 等企業將 AI 直接整合至網路,其平臺正重塑 AI 代理與網路的互動方式。另一位講者是 Artisan 的創辦人兼執行長 Jaspar Carmichael-Jack,他發起「停止僱用人類」運動,公司已籌得 3500 萬美元用於建立 AI 員工,首階段聚焦於銷售業務,預計將帶來關於用程式碼取代市場開拓團隊的深刻見解。此外,Lattice 執行長 Sarah Franklin,前 Salesforce 總裁兼行銷長,將分享她在領導高層團隊時累積的智慧,分析 AI 在擴充套件企業時的助益與潛在危害。此座談會不僅關注 hype,更著重於實際的投資回報率、信任建立、團隊動態以及如何在更少的人力下讓企業運作更快。活動邀請超過 1 萬名創始人、風投與創新者參與,並提供 Regular Bird 優惠券,最高可節省 668 美元,截止日期為 9 月 26 日太平洋時間晚上 11 點 59 分。
-
Granola 加入可重複提示功能的筆記應用
會議記錄助手 Granola 推出了名為 Recipes 的新功能,允許使用者建立可重複使用的提示捷徑。使用者可在 Granola 聊天中輸入斜線符號並鍵入名稱來呼叫該提示,亦可自行建立,並設定其適用於單一會議或跨多個會議。公司提供了指導檔案以幫助構建高效提示,並允許使用者分享自定義提示給其他使用者,同時還提供預設的提示庫,按會前、會中和會後分類。Granola 共同創辦人 Chris Pedregal 表示,目前該應用與會議是這些可重複提示的上下文,但公司正致力於讓使用者連線其他服務以擴充套件上下文並提供更多資料。他提到,許多使用者習慣將轉錄複製到 ChatGPT 或 Claude 中提問,而新特性讓使用者能利用 Granola 的完整上下文執行量身定做的提示。除了 Granola,Fireflies、Fathom 和 Circleback 等會議記錄助手也提供模板和基於提示的洞察生成功能,但大多數僅在會議結束後運作。
-
漢斯將在TechCrunch Disrupt 2025展示其千位元大小的AI音訊處理軟體
挪威新創公司 Hance 開發了一套小巧快速的音訊處理軟體,旨在解決高速度環境下的通訊問題,例如賽車手在 200 英哩每小時的速度下無法清楚聽到工程師的指令。該公司已被選為 2025 年 10 月 27 日至 29 日在舊金山 Moscone Center 舉辦的 TechCrunch Disrupt 活動的 200 家新創之一。Hance 團隊約有 10 名員工,創辦人兼執行長 Stian Aagedal 也是音訊軟體公司 Acon Digital 的執行長,另一位創辦人 Peder Jørgensen 則經營音效庫 Soundly。團隊利用人工智慧技術,基於 Soundly 的高品質錄音進行模型訓練,包括 F1 賽車聲與冰島火山噴發聲。經過最佳化後,Hance 的處理模型僅需 242 千位元的空間,可於裝置端執行而非雲端,實現僅 10 毫秒的延遲。該技術能有效分離聲音、去除雜音、回聲與混響,並提升語音清晰度。Hance 已與 Intel 及 F1 官方無線電供應商 Riedel Communications 合作,並與 FIFA 等機構建立夥伴關係,同時也在與其他晶片製造商及未公開的智慧型手機廠商洽談。執行長 Joote Hika 表示,這些專業合作關係預計將持續數年且為非排他性,有助於公司規模化。儘管已聘請首位首席商業官,Hance 仍將專注於研發,並優先招募具備人工智慧能力的員工以保持輕盈與競爭力。