自3月以來(lái),國(guó)內(nèi)大模型進(jìn)入“井噴”狀態(tài),從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機(jī)構(gòu)到科創(chuàng)企業(yè),大家對(duì)AI大模型都趨之若鶩,短時(shí)間內(nèi)紛紛推出自有的大模型產(chǎn)品。
▲a&s統(tǒng)計(jì)的部分大模型發(fā)布情況
根據(jù)科技部新一代人工智能發(fā)展研究中心5月底發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,我國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),幾乎進(jìn)入“百模大戰(zhàn)”。
進(jìn)入到四五月,大模型產(chǎn)品甚至以每日一款的速度扎堆誕生,一些AI、物聯(lián)網(wǎng)企業(yè)還有科技大佬個(gè)人在各自的領(lǐng)域開(kāi)始了新一輪的“跑馬圈地”,從功能應(yīng)用、適用場(chǎng)景以及核心技術(shù)優(yōu)勢(shì)等方面宣告其大模型的特色和亮點(diǎn)。
為什么大模型會(huì)在這個(gè)時(shí)間節(jié)點(diǎn)集中爆發(fā)?
ChatGPT的發(fā)布像一根引線,一經(jīng)點(diǎn)燃,便燃起了大模型的熊熊之火,一時(shí)之間,玩家紛紛入場(chǎng),各類大模型瘋狂涌現(xiàn)。
為什么大模型會(huì)在這個(gè)時(shí)間節(jié)點(diǎn)爆發(fā)?
海量參數(shù)規(guī)模條件催促大模型“涌現(xiàn)”
從純技術(shù)理論的角度看,中國(guó)科學(xué)院院士陳潤(rùn)生表示,一個(gè)復(fù)雜系統(tǒng)由很多微小個(gè)體構(gòu)成,這些微小個(gè)體湊到一起,相互作用,當(dāng)數(shù)量足夠多時(shí),在宏觀層面上展現(xiàn)出微觀個(gè)體無(wú)法解釋的特殊現(xiàn)象,即為“涌現(xiàn)”。大模型的運(yùn)算表明,當(dāng)訓(xùn)練數(shù)據(jù)很大時(shí)(比如超過(guò)了1000億),就會(huì)出現(xiàn)“涌現(xiàn)”現(xiàn)象。
據(jù)目前市場(chǎng)已公布的大模型產(chǎn)品來(lái)看,10億參數(shù)規(guī)模以上的大模型產(chǎn)品已多達(dá)80個(gè),其中像百度、騰訊、華為云等企業(yè)推出的大模型參數(shù)規(guī)模均已達(dá)千億已上。
當(dāng)參數(shù)規(guī)模達(dá)到一定量級(jí)的時(shí)候,大模型的涌現(xiàn)“現(xiàn)象”便具備了先決條件,這也是當(dāng)下大模型爆發(fā)的一大關(guān)鍵。
以技術(shù)驅(qū)動(dòng)變革的產(chǎn)業(yè)有著它自己的發(fā)展路徑,中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院未來(lái)產(chǎn)業(yè)研究中心研究員、高級(jí)咨詢師鐘新龍同樣認(rèn)為,由于經(jīng)過(guò)這么多年的積累,特別是信息化數(shù)字化的長(zhǎng)達(dá)10年至20年如此長(zhǎng)的時(shí)間積累,所以我們相比歷史上任何一個(gè)時(shí)期,都有更多的數(shù)據(jù)可以用,這是訓(xùn)練大模型成為可能的必備要素。大模型即便放到歷史維度中提前的某一個(gè)時(shí)刻,可能因?yàn)閿?shù)據(jù)不夠,訓(xùn)練的效果會(huì)不太好。
企業(yè)間的競(jìng)爭(zhēng)角逐
大模型的爆發(fā),還跟企業(yè)間的競(jìng)爭(zhēng)意識(shí)相關(guān)聯(lián)。
目前已推出大模型產(chǎn)品的企業(yè),無(wú)一例外是通用或垂直行業(yè)領(lǐng)域頭部玩家,這些玩家之間不排除很多企業(yè)存在“競(jìng)爭(zhēng)”心理,人無(wú)我有,人有我優(yōu)的心態(tài)也驅(qū)動(dòng)著大廠在大模型賽道你追我趕,推陳出新。
在人工智能領(lǐng)域,幾乎所有的研究團(tuán)隊(duì),包括頭部企業(yè)都在競(jìng)爭(zhēng)開(kāi)發(fā)最先進(jìn)的大模型,而且不少頭部大模型都開(kāi)始走向開(kāi)源開(kāi)放。這種競(jìng)爭(zhēng)是一種良性的競(jìng)爭(zhēng),它有利于推動(dòng)技術(shù)的發(fā)展,也有利于推動(dòng)技術(shù)的共享。
產(chǎn)業(yè)認(rèn)知達(dá)成新的共識(shí)
底層技術(shù),包括數(shù)據(jù)、算力、算法的支撐為大模型奠定了必要的條件和基礎(chǔ),而國(guó)內(nèi)大模型在今年開(kāi)始爆發(fā),還有一大原因在于大家對(duì)于AI大模型的應(yīng)用需求達(dá)到新的峰值。無(wú)論是用戶端還是技術(shù)供應(yīng)端,大家普遍看到了AI技術(shù)應(yīng)用的需求和困境,此前的AI工具普遍存在泛化能力不足,使用成本高企等問(wèn)題,亟待通用性強(qiáng)、泛化能力強(qiáng)、能夠便捷使用的新的AI工具,AI大模型是數(shù)字經(jīng)濟(jì)驅(qū)動(dòng)下產(chǎn)業(yè)認(rèn)知達(dá)成共識(shí)的產(chǎn)物。
目前市場(chǎng)上已發(fā)布的大模型普遍具備大規(guī)模和預(yù)訓(xùn)練的特點(diǎn),一方面有良好的通用性、泛化性,能夠解決傳統(tǒng)AI應(yīng)用中門檻高、部署難的問(wèn)題,另一方面可以作為技術(shù)底座,支撐智能化產(chǎn)品及應(yīng)用落地。
360創(chuàng)始人周鴻祎表示,互聯(lián)網(wǎng)公司都去做大模型的原因,是因?yàn)闆](méi)人能篤定某一家公司能做出來(lái)成功的大模型產(chǎn)品。但這個(gè)技術(shù)對(duì)中國(guó)很重要,它是工業(yè)級(jí)的,對(duì)各行各業(yè)都能帶來(lái)工業(yè)革命級(jí)的推動(dòng)。
用大語(yǔ)言模型來(lái)變革業(yè)務(wù)層、為具體的業(yè)務(wù)落地場(chǎng)景賦能,這也已經(jīng)是諸多互聯(lián)網(wǎng)廠商的共同策略。并且在當(dāng)下這個(gè)存量市場(chǎng)中,在效率上的些許變化就已經(jīng)能兌現(xiàn)為競(jìng)爭(zhēng)優(yōu)勢(shì)。
大模型成為應(yīng)對(duì)AI領(lǐng)域應(yīng)用碎片化的一種方式。
大模型也正在改變AI產(chǎn)業(yè)的規(guī)劃與格局。比方說(shuō),牽引AI產(chǎn)業(yè)快速收斂,構(gòu)建AI產(chǎn)業(yè)的底座;匯聚和沉淀行業(yè)生態(tài)及開(kāi)發(fā)者生態(tài),形成產(chǎn)業(yè)生態(tài)黏性。