閃濫洪災是全球最致命的天氣事件之一,每年造成超過 5,000 人死亡,且極難預測。由於閃濫洪災發生時間短、範圍小,難以像溫度或河川流量那樣進行全面監測,導致資料缺口使得深度學習模型無法準確預測。為解決此問題,Google 研究人員利用 Gemini 大型語言模型,整理全球 500 萬篇新聞文章,篩選出 260 萬起不同洪災報告,並將其轉化為名為「Groundsource」的地理標記時間序列資料。這是 Google 首次將語言模型應用於此類工作,該研究與資料集於週四上午公開。
基於 Groundsource 作為真實世界基準,研究人員訓練了一個基於長短期記憶(LSTM)神經網路的模型,用於攝取全球天氣預報並生成特定區域閃濫洪災發生的機率。目前,Google 的閃濫洪災預測模型已在 Flood Hub 平臺上為全球 150 個國家的城市地區標示風險,並將資料與世界各地的緊急應變機構分享。南部非洲發展共同體(Southern African Development Community)的緊急應變官員 António José Beleza 表示,該模型協助其組織更快應對洪災。
儘管模型存在限制,例如解析度較低,僅能識別每 20 平方公里的風險,且不如美國國家氣象局的洪水警報系統精準,部分原因在於 Google 的模型未納入本地雷達資料以進行即時降雨追蹤。然而,該專案設計初衷便是針對無法負擔昂貴天氣感測基礎設施或缺乏氣象資料記錄的地區運作。Google 的 Juliet Rothenberg 指出,透過聚合數百萬份報告,Groundsource 資料有助於平衡地圖資訊,並推斷到其他資訊較少的地區。團隊希望未來能將大型語言模型應用於從書面定性來源開發定量資料集,以處理其他短暫但重要的預測現象,如熱浪和泥流。Upstream Tech 執行長 Marshall Moutenot 認為,Google 的貢獻是為深度學習天氣預測模型組裝資料的成長努力之一,並指出資料匱乏是地球物理學中最具挑戰性的問題之一。