每日經(jīng)濟(jì)新聞 2023-12-01 16:32:33
浪潮信息人工智能軟件研發(fā)總監(jiān)吳韶華在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)首先分析了Open AI的做法。他提到,Open AI最核心的模型是GPT4,而GPT4是一個(gè)基礎(chǔ)大模型,沒有行業(yè)屬性。
談及大模型在研發(fā)和迭代過程中遇到的挑戰(zhàn),吳韶華直言算法創(chuàng)新非常難。
每經(jīng)記者 張蕊 每經(jīng)編輯 陳星
室外冷風(fēng)呼嘯,室內(nèi)“熱氣騰騰”,會(huì)場(chǎng)兩側(cè)通道和后面全都站滿了人……這是2023人工智能計(jì)算大會(huì)(AICC)分論壇現(xiàn)場(chǎng)的一幕。這場(chǎng)分論壇的主題是“大模型創(chuàng)新”,大模型的火爆可見一斑。
11月29日,以“智算力就是創(chuàng)新力”為主題的2023人工智能計(jì)算大會(huì)(AICC)在北京召開。本屆大會(huì)由北京市科委中關(guān)村管委會(huì)、北京市經(jīng)濟(jì)和信息化局、海淀區(qū)政府支持,浪潮信息主辦。
《每日經(jīng)濟(jì)新聞》記者從大會(huì)現(xiàn)場(chǎng)獲悉,大會(huì)重點(diǎn)圍繞智算基礎(chǔ)設(shè)施、大模型創(chuàng)新、自動(dòng)駕駛創(chuàng)新與應(yīng)用等話題開設(shè)一場(chǎng)主題論壇,六場(chǎng)專題分論壇,近百位政產(chǎn)學(xué)研專家現(xiàn)場(chǎng)分享智算產(chǎn)業(yè)前沿趨勢(shì)和創(chuàng)新成果。
中國(guó)工程院院士王恩東在致辭中表示,大模型帶動(dòng)生成式人工智能產(chǎn)業(yè)迅速發(fā)展,給科學(xué)探索、技術(shù)研發(fā)、藝術(shù)創(chuàng)作、企業(yè)經(jīng)營(yíng)等諸多領(lǐng)域都帶來了巨大的創(chuàng)新機(jī)會(huì),提升大模型智能水平需要提升模型訓(xùn)練的參數(shù)量和數(shù)據(jù)量,這必須要通過更大更好的智算力才能夠支撐,從這個(gè)意義上可以說智算力就是創(chuàng)新力,當(dāng)前人工智能產(chǎn)業(yè)發(fā)展的基礎(chǔ)是智算能力。
目前,國(guó)內(nèi)大模型已超過180個(gè),業(yè)界戲稱為“百模大戰(zhàn)”。如此多的企業(yè)都在開發(fā)大模型,大模型的核心競(jìng)爭(zhēng)壁壘到底是什么?是不是每一個(gè)行業(yè)都需要有自己的大模型?
對(duì)此,浪潮信息人工智能軟件研發(fā)總監(jiān)吳韶華在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)首先分析了Open AI的做法。他提到,Open AI最核心的模型是GPT4,而GPT4是一個(gè)基礎(chǔ)大模型,沒有行業(yè)屬性,因?yàn)镺pen AI的目標(biāo)非常明確,就是要做通用智能。
“我們是認(rèn)可這條路線的,我們認(rèn)為基礎(chǔ)模型是最核心的部分,當(dāng)模型的能力達(dá)到GPT4,就可以把這種具體模型應(yīng)用到行業(yè)場(chǎng)景里,結(jié)合行業(yè)的數(shù)據(jù)作進(jìn)一步微調(diào),或者把行業(yè)數(shù)據(jù)做成知識(shí)庫(kù),用檢索、增強(qiáng)的形式來提升模型的準(zhǔn)確度等。”吳韶華說。
在他看來,行業(yè)是一個(gè)大場(chǎng)景,里面有成百上千個(gè)具體的需求點(diǎn),所以它是基礎(chǔ)模型針對(duì)行業(yè)場(chǎng)景的一種應(yīng)用。
吳韶華提到,上一輪深度學(xué)習(xí)興起時(shí),碎片化場(chǎng)景是AI(人工智能)落地最主要的一個(gè)問題,因?yàn)楫?dāng)時(shí)沒有通用模型(基礎(chǔ)模型)。當(dāng)時(shí)的模型很多是為了解決具體的分類任務(wù)、識(shí)別任務(wù)。“現(xiàn)在到了大模型階段,大模型這種通用性是它最核心的能力,只有它的通用能力足夠強(qiáng),才能在行業(yè)落地時(shí)解決原來碎片化的問題。”
“而所謂的行業(yè)模型事實(shí)上是大模型在行業(yè)場(chǎng)景里面具體的應(yīng)用。”吳韶華說,因?yàn)镚PT4在這方面已經(jīng)給出非常好的例子,它用在bing(必應(yīng))搜索里面,就可以支撐bing搜索更好用;在代碼里面就可以做出來非常好的編程輔助工具,但它就是一個(gè)基礎(chǔ)模型。
記者在現(xiàn)場(chǎng)了解到,吳韶華團(tuán)隊(duì)是國(guó)內(nèi)最早做大模型的團(tuán)隊(duì)之一,在大模型還遠(yuǎn)未如此“瘋狂”的2021年9月就曾發(fā)布源1.0大模型,近期源2.0大模型又正式對(duì)外發(fā)布,并且實(shí)現(xiàn)了千億參數(shù)的全面開源。
談及大模型在研發(fā)和迭代過程中遇到的挑戰(zhàn),吳韶華直言算法創(chuàng)新非常難。
“GPT4的模型能力逼迫我們不得不去做算法創(chuàng)新。”吳韶華說,想要快速把能力提上去,就要兩條腿走路,一條腿是算法,另外一條腿是數(shù)據(jù)。
從算法創(chuàng)新上來看,要找到一種更合適的算法結(jié)構(gòu)來進(jìn)行自然語(yǔ)言的學(xué)習(xí),挑戰(zhàn)非常大。另外,高質(zhì)量的數(shù)據(jù)非常難獲取。吳韶華講述,為了獲取中文數(shù)學(xué)數(shù)據(jù),團(tuán)隊(duì)清洗了從2018年至今約12PB(拍字節(jié))的互聯(lián)網(wǎng)數(shù)據(jù),但僅獲取到了約10GB(千兆字節(jié))的數(shù)學(xué)數(shù)據(jù),“投入與收益差異之大一目了然”。
吳韶華坦言,GPT4是閉源的,我們沒有東西能夠參考。“在這種情況下,我們必須思考一個(gè)很重要的問題,就是怎么通過開源快速凝聚起開發(fā)者的力量,快速提升我們基礎(chǔ)模型的能力。”
近年來全球AI應(yīng)用率
記者了解到,大會(huì)上,作為中國(guó)AI算力發(fā)展“風(fēng)向標(biāo)”的《2023-2024年中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》發(fā)布。
報(bào)告指出,大模型和生成式人工智能的發(fā)展將引發(fā)計(jì)算范式、產(chǎn)業(yè)動(dòng)量、算力服務(wù)格局之變,未來“以應(yīng)用為導(dǎo)向、系統(tǒng)為核心”將是算力升級(jí)的主要路徑。2023年,中國(guó)通用算力規(guī)模預(yù)計(jì)達(dá)到59.3EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算),同比增長(zhǎng)8.8%;智能算力預(yù)計(jì)達(dá)到414.1EFLOPS,同比增長(zhǎng)59.3%,6.7倍于通用算力增速,其中我國(guó)人工智能服務(wù)器市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)664億元,同比增長(zhǎng)82.5%。
報(bào)告公布了中國(guó)人工智能城市排名榜單和人工智能行業(yè)應(yīng)用滲透度排名榜單。在城市人工智能算力排行中,北京、杭州、深圳、上海、蘇州排名前五,廣州、濟(jì)南、合肥、重慶和成都位居6-10位。
一方面,智算中心的建設(shè)是拉動(dòng)地區(qū)實(shí)現(xiàn)人工智能發(fā)展的重要驅(qū)動(dòng)力,上榜城市均十分重視算力的投入,不斷推進(jìn)人工智能產(chǎn)業(yè)的發(fā)展;另一方面,人工智能算力排名靠前的城市也是發(fā)布大模型數(shù)量較多的城市。
在人工智能行業(yè)應(yīng)用滲透度排行中,互聯(lián)網(wǎng)行業(yè)作為生成式人工智能技術(shù)應(yīng)用的主陣地居于首位,電信、政府、金融和制造業(yè)位列前五。
封面圖片來源:視覺中國(guó)-VCG41N1356593648
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP