川觀新聞 2024-07-30 10:02:08
“這是全球首個(gè)億級(jí)參數(shù)量的地震波大模型,今天正式發(fā)布。”7月28日,由國(guó)家超級(jí)計(jì)算成都中心、中國(guó)地震局地球物理研究所與清華大學(xué)聯(lián)合開(kāi)發(fā)的“諦聽(tīng)”地震波大模型正式發(fā)布。
出席活動(dòng)的四川省地震局副局長(zhǎng)杜斌表示,四川作為經(jīng)濟(jì)和能源大省,地質(zhì)構(gòu)造復(fù)雜,是中國(guó)地震活動(dòng)水平最高、強(qiáng)度最大的地區(qū)之一。此次“諦聽(tīng)”地震波大模型的發(fā)布不僅是地震科學(xué)技術(shù)的重大突破,也是對(duì)國(guó)家重大戰(zhàn)略需求的積極回應(yīng)。
諦聽(tīng)地震波大模型發(fā)布現(xiàn)場(chǎng)。
如何練出聽(tīng)震“神獸”?
“‘諦聽(tīng)’原本是中國(guó)神話傳說(shuō)中的神獸,可以通過(guò)聽(tīng)音來(lái)辨認(rèn)世間萬(wàn)物。”中國(guó)地震局地球物理研究所副所長(zhǎng)陳石說(shuō),“我們研發(fā)的‘諦聽(tīng)’,是一種大型地震學(xué)數(shù)據(jù)集以及在此基礎(chǔ)上訓(xùn)練的人工智能大模型。”
發(fā)布會(huì)上,陳石如此解釋“諦聽(tīng)”的來(lái)歷:它們都是通過(guò)“聽(tīng)”去認(rèn)識(shí)、分析自然界中的信息。
陳石說(shuō),隨著我國(guó)地震監(jiān)測(cè)體系的持續(xù)優(yōu)化升級(jí)以及近年來(lái)人工智能技術(shù)的迅猛發(fā)展,地震學(xué)研究和防震減災(zāi)工作也進(jìn)入了地震波大數(shù)據(jù)時(shí)代,“諦聽(tīng)”地震波大模型應(yīng)運(yùn)而生。
那如何訓(xùn)練這只可以辨識(shí)地震的“神獸”?
首先要有數(shù)量足夠的數(shù)據(jù),這就是“諦聽(tīng)”數(shù)據(jù)集。最初,科研團(tuán)隊(duì)將2013年至2020年間的震相觀測(cè)報(bào)告和國(guó)家測(cè)震臺(tái)網(wǎng)數(shù)據(jù)備份中心的數(shù)據(jù),經(jīng)過(guò)清洗和脫敏處理后,建立了1.0版本的“諦聽(tīng)”數(shù)據(jù)集。隨著數(shù)據(jù)規(guī)模的擴(kuò)大,2023年9月,成都產(chǎn)業(yè)集團(tuán)運(yùn)營(yíng)的國(guó)家超算成都中心與中國(guó)地震局地球物理研究所達(dá)成戰(zhàn)略合作,雙方合作共建“地震大模型創(chuàng)新應(yīng)用聯(lián)合實(shí)驗(yàn)室”,新一代“諦聽(tīng)”數(shù)據(jù)集正式落戶成都。
數(shù)據(jù)集是大模型訓(xùn)練的基礎(chǔ),數(shù)據(jù)集的規(guī)模和質(zhì)量直接決定了模型的訓(xùn)練效果。目前,“諦聽(tīng)”數(shù)據(jù)集不僅是國(guó)內(nèi)首個(gè),同時(shí)也是目前國(guó)內(nèi)外最大規(guī)模、樣本類(lèi)型和標(biāo)注最為全面的地震學(xué)專業(yè)AI訓(xùn)練數(shù)據(jù)集之一。
陳石介紹,第一版“諦聽(tīng)”地震波大模型基于2300萬(wàn)條地震事件波形進(jìn)行了預(yù)訓(xùn)練,而我國(guó)中國(guó)地震臺(tái)網(wǎng)每年產(chǎn)生的標(biāo)注事件波形約為50萬(wàn)條。以此計(jì)算,剛“出生”不久的“諦聽(tīng)”地震波大模型已相當(dāng)于擁有約40年地震信號(hào)識(shí)別經(jīng)驗(yàn)的“老專家”。
其次,是算法、模型的設(shè)計(jì)和調(diào)優(yōu)。來(lái)自清華大學(xué)自動(dòng)化系的助理研究員劉暢博士介紹,作為全球范圍內(nèi)地震波大模型的首次探索,需要進(jìn)行大量基礎(chǔ)性研究,否則模型訓(xùn)練不充分,實(shí)際應(yīng)用效果不及預(yù)期。
簡(jiǎn)單來(lái)說(shuō),算法的選擇和設(shè)計(jì)直接決定了模型的學(xué)習(xí)能力和表達(dá)能力,算法的優(yōu)化和改進(jìn)可以提高模型的性能和效果。參數(shù)則是大模型訓(xùn)練的調(diào)節(jié)器,可直接影響模型的準(zhǔn)確性和穩(wěn)定性。在“諦聽(tīng)”大模型中,參數(shù)的數(shù)量非常龐大,也給最優(yōu)參數(shù)的確認(rèn)造成極大的挑戰(zhàn)。
“人工智能算法的關(guān)鍵在于兩個(gè)因素,訓(xùn)練數(shù)據(jù)量和模型參數(shù)量。”陳石用比喻來(lái)解釋:訓(xùn)練數(shù)據(jù)量可以看作是算法的“閱歷”,而參數(shù)量則是算法的“腦容量”。要想有效地記憶和理解海量的地震數(shù)據(jù),并充分挖掘和利用其中的信息,就必須發(fā)展與之相匹配的大“腦容量”的大模型。
“諦聽(tīng)”都能干什么?
據(jù)悉,目前“諦聽(tīng)”地震波大模型已可投入使用。陳石談到,“諦聽(tīng)”地震波大模型依托中國(guó)地震臺(tái)網(wǎng)的海量數(shù)據(jù),通過(guò)先進(jìn)的人工智能技術(shù),在測(cè)試中發(fā)現(xiàn),可以顯著提升地震信號(hào)的識(shí)別準(zhǔn)確率和速度。
因此,從短期看,“諦聽(tīng)”地震波大模型可直接應(yīng)用于地震信號(hào)識(shí)別、地震活動(dòng)監(jiān)測(cè)、大地震快速響應(yīng)等領(lǐng)域,有望減輕地震局一線業(yè)務(wù)人員的工作壓力。
從長(zhǎng)期看,地震學(xué)是一門(mén)觀測(cè)科學(xué),重大的突破往往來(lái)自對(duì)觀測(cè)數(shù)據(jù)的深刻理解。對(duì)觀測(cè)的理解越全面,對(duì)觀測(cè)的整合能力越強(qiáng),離地震學(xué)科學(xué)問(wèn)題的突破就越近。目前,傳統(tǒng)方法和中小模型均無(wú)法充分利用百TB、PB級(jí)別的地震觀測(cè)數(shù)據(jù),而這些數(shù)據(jù)中蘊(yùn)含著許多重要的地震學(xué)科學(xué)問(wèn)題,只有大模型才能深入挖掘這些“寶藏”。因此,“諦聽(tīng)”地震波大模型有望為地震科學(xué)研究帶來(lái)重大突破。
從應(yīng)用領(lǐng)域看,“諦聽(tīng)”地震波大模型的前景也十分令人期待。
“未來(lái),該模型的應(yīng)用場(chǎng)景還可用于礦震監(jiān)測(cè)、頁(yè)巖氣開(kāi)采、城市地下空間結(jié)構(gòu)探測(cè)、海底地震監(jiān)測(cè)等多個(gè)領(lǐng)域。”國(guó)家超算成都中心常務(wù)副主任王建波說(shuō)。
以尋找油氣為例。目前全球95%以上的油氣田發(fā)現(xiàn)主要是依靠地震勘探。王建波說(shuō),地震波在不同介質(zhì)中傳播時(shí),強(qiáng)度、形態(tài)等特征都不同,“諦聽(tīng)”地震波大模型通過(guò)學(xué)習(xí)儲(chǔ)存石油區(qū)域的波形特點(diǎn),就可以推導(dǎo)出地下是否含有油氣。
陳石表示,第一版“諦聽(tīng)”地震波大模型完成了從預(yù)訓(xùn)練到微調(diào)完整流程的從無(wú)到有的探索,初步展示了優(yōu)于中小模型的性能,為后續(xù)充分挖掘和發(fā)揮地震波大模型的優(yōu)勢(shì)探索了道路,積累了經(jīng)驗(yàn)。
“諦聽(tīng)”之外,超算還能做什么?
“發(fā)展地震波大模型不僅是人工智能地震學(xué)領(lǐng)域的必然趨勢(shì),也是該領(lǐng)域的科技制高點(diǎn)。”陳石說(shuō),“在具備了足夠的數(shù)據(jù)和算力基礎(chǔ)后,我們迅速組織團(tuán)隊(duì)第一時(shí)間開(kāi)展相關(guān)研究工作,力求填補(bǔ)這一重要空白,為地震科學(xué)研究和防震減災(zāi)事業(yè)貢獻(xiàn)一份力量。”
成都數(shù)據(jù)集團(tuán)黨委副書(shū)記、成都超算中心運(yùn)營(yíng)管理有限公司董事長(zhǎng)郭黎表示,“諦聽(tīng)”地震波大模型的研發(fā),不僅極大地推動(dòng)了人工智能算法在地震學(xué)領(lǐng)域的開(kāi)發(fā)、測(cè)試和應(yīng)用,更為地震監(jiān)測(cè)預(yù)報(bào)業(yè)務(wù)的智能化發(fā)展提供了堅(jiān)實(shí)的技術(shù)支撐。
作為長(zhǎng)期在超算領(lǐng)域工作的資深從業(yè)者,王建波認(rèn)為,“諦聽(tīng)”地震學(xué)數(shù)據(jù)集正式落戶國(guó)家超級(jí)計(jì)算成都中心地震大模型創(chuàng)新應(yīng)用聯(lián)合實(shí)驗(yàn)室,這是垂直領(lǐng)域?qū)I(yè)數(shù)據(jù)和大規(guī)模算力深度融合、軟硬一體的一次新嘗試。
“‘諦聽(tīng)’地震波大模型的發(fā)布對(duì)于突破中小地震波模型性能瓶頸,提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義。”王建波說(shuō),國(guó)家超算成都中心強(qiáng)大算力和技術(shù)服務(wù)能力,不僅可以滿足中國(guó)地震局地球物理研究所等科研單位定制化的軟硬一體的服務(wù)需求,更是為人工智能和機(jī)器人等未來(lái)產(chǎn)業(yè)發(fā)展提供了堅(jiān)實(shí)的平臺(tái)保障。
目前國(guó)家超算成都中心已在多個(gè)領(lǐng)域形成特色算力應(yīng)用。其中:在人工智能大模型領(lǐng)域,國(guó)家超算成都中心與成都曉多科技合作,研發(fā)了基于大語(yǔ)言模型技術(shù)開(kāi)發(fā)的垂類(lèi)電商客服行業(yè)的大型語(yǔ)言模型,可為電商企業(yè)提供智能化的服務(wù)和營(yíng)銷(xiāo)一體化解決方案。今年5月,該模型成功通過(guò)國(guó)家生成式人工智能服務(wù)備案。
國(guó)家超算成都中心。
在防災(zāi)減災(zāi)領(lǐng)域,中國(guó)科學(xué)院成都山地災(zāi)害與環(huán)境研究所就聯(lián)合國(guó)家超算成都中心,開(kāi)展了“氣候變化條件下山地致災(zāi)風(fēng)險(xiǎn)綠色調(diào)控關(guān)鍵技術(shù)與示范”項(xiàng)目研究,搭建山地災(zāi)害風(fēng)險(xiǎn)模擬與險(xiǎn)情預(yù)報(bào)平臺(tái),突破精細(xì)化、精準(zhǔn)化災(zāi)害預(yù)警預(yù)報(bào)瓶頸。此外,國(guó)家超算成都中心還與四川氣象部門(mén)合作,提供精準(zhǔn)氣象預(yù)報(bào)服務(wù)。
“國(guó)家超算成都中心還將不斷加速人工智能技術(shù)在防災(zāi)減災(zāi)、城市治理等領(lǐng)域的應(yīng)用與發(fā)展,充分發(fā)揮我們作為大國(guó)重器的戰(zhàn)略支撐作用。”王建波說(shuō)。
國(guó)家超算成都中心供圖
視頻:四川新聞聯(lián)播
來(lái)源:川觀新聞
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP