5月27日,“2023?黑馬AIGC峰會(huì)”在京舉辦。有趣的是,360集團(tuán)董事長(zhǎng)周鴻祎在這次會(huì)議上,首次以“數(shù)字分身”形式參加,引發(fā)極大關(guān)注。
以下為周鴻祎的數(shù)字分身現(xiàn)場(chǎng)分享內(nèi)容整理:
很多朋友很關(guān)心360的大模型進(jìn)展,我來(lái)講講360發(fā)展大模型的優(yōu)勢(shì)與策略,做廣告的同時(shí)也給大家一個(gè)參考。
首先明確一個(gè)認(rèn)知,大模型是超級(jí)人工智能到來(lái)的拐點(diǎn),也是通用人工智能發(fā)展的基點(diǎn)。原來(lái)的人工智能是弱智能,帶來(lái)的影響有限,而大模型屬于通用人工智能,在很多維度上已經(jīng)超越了人類。這次GPT出現(xiàn),最大的意義是人類第一次把所有知識(shí)進(jìn)行了重新編碼和存儲(chǔ),現(xiàn)在GPT-4已經(jīng)是世界上最聰明的人,這是一個(gè)巨大的拐點(diǎn)。
為什么說(shuō)GPT是通用人工智能?首先它用一套模型、算法、數(shù)據(jù),解決了所有自然語(yǔ)言理解的問(wèn)題;其次,GPT從感知進(jìn)化到了認(rèn)知,能夠理解文字、語(yǔ)言、分析、規(guī)劃,這對(duì)傳統(tǒng)人工智能是一場(chǎng)顛覆性的革命。
未來(lái)我們?cè)谌斯ぶ悄艿幕A(chǔ)上構(gòu)建數(shù)字化的新場(chǎng)景,能夠做到事半功倍。
所以我認(rèn)為,GPT是生產(chǎn)力工具,而不僅僅是公司間競(jìng)爭(zhēng)的利器。在大模型推動(dòng)下,智能化才是數(shù)字化的高峰。過(guò)去很多人執(zhí)迷于大數(shù)據(jù),但不知道怎么用,大數(shù)據(jù)很像工業(yè)時(shí)代的石油,大模型像發(fā)電廠,把數(shù)據(jù)變成數(shù)據(jù)鏈,輸送給百行千業(yè),可以輸送未來(lái)所有的軟件、APP和網(wǎng)站。甚至,所有的行業(yè)在通用人工智能大語(yǔ)言模型的加持之下,都值得重塑一遍。
我們總結(jié)了開(kāi)發(fā)大模型的技術(shù)實(shí)踐,可以分為五個(gè)步驟:
第一步,構(gòu)建一個(gè)大模型;
第二步,無(wú)監(jiān)督學(xué)習(xí),把知識(shí)灌進(jìn)大模型;
第三步,監(jiān)督微調(diào),強(qiáng)化學(xué)習(xí),做人工知識(shí)標(biāo)注;
第四步,價(jià)值觀糾偏;
第五步,上下文學(xué)習(xí),在用戶使用場(chǎng)景中不斷地迭代優(yōu)化大模型。
這五步中,數(shù)據(jù)、訓(xùn)練方法和場(chǎng)景,是大模型能否做成功的關(guān)鍵。
那么,如何描述360的人工智能策略?我可以用八個(gè)字:兩翼齊飛,技術(shù)并發(fā)。
360并不是突然切入人工智能賽道的,實(shí)際上2015年我們就成立了人工智能研究院,2018年開(kāi)始探索多模態(tài)的數(shù)字技術(shù)應(yīng)用,2022年在知識(shí)圖譜的世界杯比賽里戰(zhàn)勝了圖靈獎(jiǎng)團(tuán)隊(duì),獲得了冠軍。
為什么微軟、谷歌、百度等搜索引擎公司都在發(fā)展GPT?因?yàn)樽鏊阉鞯墓咎烊挥邪l(fā)展大語(yǔ)言模型的技術(shù)基因,作為國(guó)內(nèi)第二大搜索引擎廠商,360發(fā)展大模型可以說(shuō)順理成章。
很多人問(wèn)我,大模型到底有沒(méi)有門(mén)檻?事實(shí)上我認(rèn)為大模型的底層架構(gòu)、技術(shù)原理都差不多,今天大模型的競(jìng)爭(zhēng)主要集中于用什么數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練,以及用什么樣的訓(xùn)練方法來(lái)提升模型的能力。360這些年在搜索上的積淀,讓我們擁有大規(guī)模、多樣性、高質(zhì)量的訓(xùn)練語(yǔ)料,具備很多公司不具備的數(shù)據(jù)獲取和清洗能力。
目前,ChatGPT有兩個(gè)最大的短板,恰好我們的搜索引擎都可以彌補(bǔ)。一是數(shù)據(jù)更新不及時(shí),而搜索引擎恰恰能夠搜索到最新的數(shù)據(jù)和知識(shí),幫助它及時(shí)更新,我們現(xiàn)在已經(jīng)把360搜索和大語(yǔ)言模型連在了一起,完全解決了這個(gè)問(wèn)題。GPT的另一個(gè)缺點(diǎn)是幻覺(jué),說(shuō)白了就是胡說(shuō)八道,這是GPT在很多專業(yè)應(yīng)用場(chǎng)景上最致命的問(wèn)題。這種情況下更需要搜索的知識(shí)校正,360有強(qiáng)大的搜索能力,它和大模型之間能夠形成相互增強(qiáng),形成正向的雙向循環(huán),用來(lái)解決大模型知識(shí)滯后、知識(shí)模糊、數(shù)據(jù)校對(duì)的問(wèn)題。反過(guò)來(lái),大模型能夠提升搜索難以解決的低質(zhì)量回答問(wèn)題。
與眾多互聯(lián)網(wǎng)公司相比,360還具有工程化優(yōu)勢(shì),就是大流量、大用戶的工程化調(diào)度能力,這是已經(jīng)被證明過(guò)的。同時(shí)360還擁有強(qiáng)大的AI內(nèi)容安全隊(duì)伍,可以保證數(shù)據(jù)安全輸出。作為一家以安全聞名的廠商,360也有多年積累,我們打造的大模型安全風(fēng)險(xiǎn)評(píng)估體系,可以為全球大模型安全賦能。我相信,大模型能不能保證自身的安全會(huì)成為未來(lái)的核心競(jìng)爭(zhēng)力之一。
在算力方面,360把算力分為兩部分:訓(xùn)練算力和推理算力。
在訓(xùn)練算力上,我們?cè)?月份至少可以擁有600臺(tái)8卡服務(wù)器,將近5000張顯卡。這方面360的理念和其他公司不太一樣,很多公司都拿AI做數(shù)據(jù)推理,這是很大的浪費(fèi)。360拿消費(fèi)級(jí)的顯卡來(lái)做推理的機(jī)器,解決了很多問(wèn)題,取得了一些成果。
目前在核心大模型上,360已經(jīng)完成上千億個(gè)參數(shù)的大模型布局,包括360GPT以及一個(gè)多模態(tài)大模型,還有與清華智譜AI合作研發(fā)的360PLM大模型,最近在多個(gè)權(quán)威第三方評(píng)測(cè)中,比如中文模型基準(zhǔn)評(píng)測(cè)SuperCUE中,360大模型的總分也是國(guó)內(nèi)領(lǐng)跑的。
在場(chǎng)景布局方面,360的策略叫做“四路并發(fā)”。其中,面向消費(fèi)者,我們用搜索和瀏覽器打造用戶的個(gè)人AI助理;面向中小微企業(yè),打造SaaS化垂直應(yīng)用工具;面向企業(yè)/政府/城市,合作打造私有化部署GPT;最后面向行業(yè),360將攜手行業(yè)伙伴,與擁有行業(yè)數(shù)據(jù)的龍頭企業(yè)共同打造行業(yè)的垂直GPT。
今天,面向黑馬的伙伴,我想重點(diǎn)講講企業(yè)的場(chǎng)景。
企業(yè)在使用公有GPT的時(shí)候會(huì)面臨幾個(gè)問(wèn)題:一是使用過(guò)程中數(shù)據(jù)可能會(huì)泄露;二是GPT行業(yè)知識(shí)深度不夠,對(duì)企業(yè)也不了解,通用模型可能不會(huì)用。
所以,我認(rèn)為,未來(lái)企業(yè)可能需要基于公有GPT,通過(guò)公有云數(shù)據(jù)訓(xùn)練、行業(yè)數(shù)據(jù)訓(xùn)練、企業(yè)數(shù)據(jù)訓(xùn)練、機(jī)密數(shù)據(jù)融合這四步,打造企業(yè)的專有GPT。專有GPT相當(dāng)于企業(yè)的AI中臺(tái),能夠提供四個(gè)方面的價(jià)值:一是能變成員工的知識(shí)助手;二是成為員工的辦公助手,提升辦公的效率;三是成為領(lǐng)導(dǎo)的決策助手;四是成為企業(yè)的智能客服。
這個(gè)AI中臺(tái)未來(lái)存在兩種可能:一是成為“副駕駛”,大模型賦能企業(yè)的內(nèi)部業(yè)務(wù)系統(tǒng);二是未來(lái)還有可能成為企業(yè)內(nèi)部的“主駕駛”,當(dāng)大模型變成企業(yè)內(nèi)部所有信息系統(tǒng)的前端,會(huì)成為企業(yè)內(nèi)部的智能調(diào)度中樞,知識(shí)多引擎調(diào)度能力實(shí)際上就是engine模式,把企業(yè)內(nèi)部的信息系統(tǒng)都變成企業(yè)專有GPT的插件。
大模型在中國(guó)的發(fā)展和每一個(gè)企業(yè)的發(fā)展都息息相關(guān),特別是將成為中小企業(yè)最有力的武器,不管你在哪個(gè)行業(yè),都有機(jī)會(huì)通過(guò)大模型實(shí)現(xiàn)突破和反超。反過(guò)來(lái)說(shuō),不能搭上這班車的企業(yè)也將面臨淘汰。
但是,很多中小企業(yè)可能沒(méi)有這方面的技術(shù)基礎(chǔ),怎么選擇大模型、利用大模型,是很多企業(yè)家面臨的困惑。為了探索解決之道,我們今天正式宣布和創(chuàng)業(yè)黑馬開(kāi)展戰(zhàn)略合作。
未來(lái),360會(huì)和黑馬一起通過(guò)技術(shù)服務(wù)等形式,在AIGC這個(gè)領(lǐng)域?qū)Υ竽P偷陌l(fā)展和中小企業(yè)的應(yīng)用做幾件事,包括:成立產(chǎn)學(xué)研一體化的大模型聯(lián)盟,聯(lián)合研發(fā)行業(yè)垂類模型核心業(yè)務(wù),打造城市產(chǎn)業(yè)項(xiàng)目在AI領(lǐng)域的標(biāo)桿等。
未來(lái)中國(guó)不會(huì)只有一個(gè)GPT,現(xiàn)在也只有幾十家科技公司發(fā)布了自己的大模型,都還沒(méi)有在用戶場(chǎng)景里,讓用戶廣泛使用、接受用戶的真實(shí)反饋,所以,大模型帶來(lái)的這場(chǎng)工業(yè)革命才剛剛拉開(kāi)序幕。
我相信,未來(lái)無(wú)論是AIGC產(chǎn)業(yè)在中國(guó)的發(fā)展,還是360和黑馬的合作,都會(huì)帶來(lái)令人矚目的價(jià)值與成果,我們將共同見(jiàn)證、助力中國(guó)AIGC產(chǎn)業(yè)的繁榮發(fā)展!