人工智能賦能產(chǎn)業(yè),正成為引領(lǐng)經(jīng)濟(jì)、科技發(fā)展的重要驅(qū)動(dòng)力。
在較為低迷的投融資大環(huán)境下,全球投資者對(duì)于 AI 的關(guān)注度有增不減。2021 年,全球 AI 初創(chuàng)企業(yè)融資破紀(jì)錄達(dá)到 668 億美元,是 2020 年融資總額的兩倍之多。2022 年 Q1 相較于 2021 年 Q4 融資額下降了 12%,但仍低于同期全球風(fēng)險(xiǎn)投資整體下降幅度。
新的一年,人工智能會(huì)朝著什么方向發(fā)展?CB Insights 提出了 2022 年值得關(guān)注的七大 AI 趨勢(shì)。
合成數(shù)據(jù),保護(hù)隱私
目前,由于 AI 技術(shù)呈指數(shù)級(jí)發(fā)展,變得更加先進(jìn),但其局限性仍然存在。例如,某些行業(yè)缺乏足夠的真實(shí)數(shù)據(jù)來(lái)訓(xùn)練 AI 模型,又或者合規(guī)隱私成為一些行業(yè)技術(shù)發(fā)展的痛點(diǎn)。
企業(yè)紛紛開(kāi)始部署 Synthetic data (合成數(shù)據(jù)),即由計(jì)算機(jī)人工生成的數(shù)據(jù),可用于替代自現(xiàn)實(shí)世界中采集的真實(shí)數(shù)據(jù)集。
雖然有人質(zhì)疑合成數(shù)據(jù)模擬真實(shí)數(shù)據(jù)的準(zhǔn)確性,但仍有一些大公司將賭注押在了這項(xiàng)技術(shù)上。
illumina 正在使用由創(chuàng)業(yè)公司 Gretel 開(kāi)發(fā)的合成基因數(shù)據(jù)進(jìn)行醫(yī)學(xué)研究。在一項(xiàng)聯(lián)合研究中,兩家公司均強(qiáng)調(diào)了,取得患者的知情同意權(quán)等舉措限制了部分醫(yī)學(xué)研究的速度和規(guī)模。Gretel 便使用真實(shí)的基因型和表型數(shù)據(jù)進(jìn)行 AI 算法訓(xùn)練,生成人工基因組合成數(shù)據(jù)。
在金融領(lǐng)域,J.P. Morgan 正在利用合成數(shù)據(jù)訓(xùn)練金融 AI 模型。而在電信行業(yè),由于無(wú)法獲得客戶(hù)同意,預(yù)計(jì)高達(dá) 85% 的真實(shí)客戶(hù)數(shù)據(jù)無(wú)法獲取,這給行為分析和預(yù)測(cè)造成了極大障礙。西班牙電信公司 Telefónica 與 Most AI 合作,模擬真實(shí)客戶(hù)數(shù)據(jù)的統(tǒng)計(jì)模式,創(chuàng)建 GDPR 合規(guī)的客戶(hù)合成數(shù)據(jù)檔案。
現(xiàn)階段,基于 GANs 的圖像合成技術(shù)和視頻合成技術(shù)發(fā)展迅猛,但高效且可行的表格數(shù)據(jù)合成技術(shù)仍處于初級(jí)階段。整體來(lái)看,數(shù)據(jù)匿名化、隱私合規(guī)和糾正算法偏見(jiàn)等優(yōu)勢(shì)使得合成數(shù)據(jù)技術(shù)成為吸引各行業(yè)公司的關(guān)鍵要素。
芯片追逐戰(zhàn)
隨著 AI 技術(shù)不斷進(jìn)步,加速在各行業(yè)落地應(yīng)用。無(wú)論是云數(shù)據(jù)中心還是像照相機(jī)這樣的智能邊緣設(shè)備,適用于計(jì)算密集型的專(zhuān)業(yè)硬件需求激增。
Nvidia(英偉達(dá))的圖形處理器曾一度主導(dǎo)著價(jià)值 670 億美元的 AI 芯片市場(chǎng),如今多家公司相繼入局。
谷歌最新推出的 Pixel 手機(jī)搭載了自研的 Tensor 處理器,強(qiáng)化了軟件應(yīng)用,而Amazon(亞馬遜)也在 2021 年 Q4 推出了自研芯片 Graviton3。
除了這幾家大公司外,一些初創(chuàng)企業(yè)也紛紛殺入。曾聲稱(chēng)造出世界最大芯片的明星創(chuàng)企 Cerebras Systems 在 2021 年 Q4 融資 2.5 億美元,估值達(dá)到 40 億美元。
圖 | 截至 2022 年 5 月 13 日,融資前十的全球 AI 芯片供應(yīng)商(來(lái)源:CB Insights)
由于空間和能源的限制,大型芯片并不適用于許多日常的 AI 應(yīng)用場(chǎng)景??紤]到這一點(diǎn),越來(lái)越多的公司開(kāi)始研發(fā)可以用于汽車(chē)傳感器、照相機(jī)、自動(dòng)化工廠機(jī)器人等低功耗設(shè)備的 AI 芯片。
On-device AI processing(端側(cè) AI)能夠?qū)崿F(xiàn)低延遲以及數(shù)據(jù)隱私的保護(hù)。Mythic、Syntiant 和 Kneron 等初創(chuàng)公司分別籌集了超過(guò) 1 億美元研發(fā)該項(xiàng)技術(shù)。
像 Untether AI 和 HOUMO.AI(后摩智能)這樣的初創(chuàng)公司正致力于研發(fā)“in-memory computing”(存內(nèi)計(jì)算)技術(shù)。與傳統(tǒng)方法相比,存內(nèi)計(jì)算把計(jì)算和存儲(chǔ)合二為一實(shí)現(xiàn)高度集成,能夠大幅度提升性能。Samsung 公司報(bào)告稱(chēng),采用存內(nèi)計(jì)算技術(shù)后,語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)的速度提高了一倍以上,資源消耗削減了一半。
AI 芯片獨(dú)角獸公司 Graphcore 采用3D 封裝技術(shù)極大提高了性能。3D封裝技術(shù),簡(jiǎn)單來(lái)說(shuō),就是指在不改變封裝體尺寸的前提下,在同一個(gè)封裝體內(nèi),在垂直方向上疊放兩個(gè)或者更多芯片的技術(shù)。
其他公司則拋棄了傳統(tǒng) AI 芯片,轉(zhuǎn)而使用光子芯片,即利用光而不是電信號(hào)來(lái)傳輸數(shù)據(jù)。光子學(xué)最大的優(yōu)勢(shì)是速度,與依靠電纜傳輸?shù)碾娮酉啾龋饪梢砸愿斓乃俣?、更大的帶寬和更少的能量傳輸信息。隨著人們對(duì) AI 工具的需求呈指數(shù)級(jí)增長(zhǎng),光子學(xué)有望成為破除 AI 硬件局限性的方法。
多年來(lái),研究人員一直在研發(fā)通用性光子芯片。像 Lightmatter 和 Luminous Computing 等初創(chuàng)公司都希望構(gòu)建更快、更節(jié)能的芯片,支持機(jī)器學(xué)習(xí)以及能夠處理繁瑣算法的“AI 超級(jí)計(jì)算機(jī)”。
新的技術(shù)層出不窮,新一代芯片在提高性能的同時(shí)降低功耗。展望未來(lái),像量子機(jī)器學(xué)習(xí)這樣的前沿科技將不斷改變 AI 發(fā)展的面貌。
AI 賦能內(nèi)容審核
在美國(guó),玩電子游戲的人數(shù)達(dá)到了史上前所未有的最高水平。76% 的 18 歲以下的青少年沉迷于電子游戲,這讓家長(zhǎng)們擔(dān)心孩子們極有可能接觸到不合時(shí)宜或者充滿(mǎn)仇恨的信息。
處理網(wǎng)絡(luò)仇恨言論是一個(gè)老生常談的問(wèn)題。據(jù)悉,在 2016 年至 2021 年間,Meta 花費(fèi)了 130 億美元用于內(nèi)容審查,而 TikTok 聲稱(chēng)在 2020 年有近萬(wàn)人從事內(nèi)容審查工作。TikTok 和 Meta 都曾被內(nèi)容管理員起訴,因?yàn)樗麄冊(cè)趫D文審查工作中遭受了心理創(chuàng)傷。
隨著元宇宙的火熱以及網(wǎng)絡(luò)游戲生態(tài)系統(tǒng)的迅速發(fā)展,有害信息已經(jīng)從社交媒體蔓延到新的陣地,即網(wǎng)絡(luò)游戲和虛擬世界。
網(wǎng)絡(luò)游戲環(huán)境惡劣,充斥著各種仇恨言論、網(wǎng)絡(luò)霸凌以及故意退出。反誹謗聯(lián)盟的一項(xiàng)研究發(fā)現(xiàn),在比較受歡迎的多人游戲中,高達(dá) 80% 的玩家都曾受到騷擾。
一些初創(chuàng)公司正著眼于利用 AI 技術(shù)進(jìn)行內(nèi)容審核。Spectrum Labs 稱(chēng),其 NLP 平臺(tái)可以將音頻和文本的內(nèi)容審核工作減少 50% ,有害信息檢測(cè)能力提高 10 倍。
美國(guó)初創(chuàng)公司 GGWP 通過(guò) AI 監(jiān)控聊天記錄和游戲數(shù)據(jù)來(lái)打擊游戲中的有害行為。此前,這家初創(chuàng)公司已經(jīng)籌集了 1200 萬(wàn)美元的種子資金,投資者包括 BITKRAFT Esport Ventures、Sony Innovation Fund(索尼創(chuàng)新基金)和 Riot Games。
2021 年 4 月,美國(guó) Hive 公司募集了 5000萬(wàn)美元的 D 輪融資,估值達(dá)到 20 億美元。Hive 公司成立于 2013 年,是一個(gè)專(zhuān)注于 AI 培訓(xùn)數(shù)據(jù)的智能眾包平臺(tái),提供自動(dòng)內(nèi)容審核服務(wù),幫助像 HighRise 和 Naver Z 這樣的元宇宙公司解決玩家發(fā)表的仇恨言論、網(wǎng)絡(luò)欺凌等問(wèn)題。
為了提高審核能力,大型科技公司收購(gòu)了一些 AI 初創(chuàng)公司。例如,2021 年 10 月,微軟收購(gòu)了 AI 內(nèi)容審核服務(wù)公司 Two Hat,該公司的客戶(hù)包括 Roblox、 Epic Games 和微軟旗下的 Minecraft。
利用 AI 技術(shù)實(shí)現(xiàn)完美的內(nèi)容審核是不可能的。在線用戶(hù)能夠不斷適應(yīng)審查規(guī)則,逃避平臺(tái)的審查。但是,在 NLP 和基于深度學(xué)習(xí)的圖像分類(lèi)等關(guān)鍵領(lǐng)域取得的突破,以及以?xún)?nèi)容審查為業(yè)務(wù)方向的 AI 初創(chuàng)企業(yè)獲得多輪融資,在一定程度上表明了 AI 審核將成為未來(lái)的方向之一。
Deepfakes
Deepfakes(深度偽造)不僅能創(chuàng)造出極其逼真的圖像,還能生成“假”聲音和視頻。
利用 AI 學(xué)習(xí)算法,Deepfakes 的技術(shù)愈發(fā)精進(jìn),效果十分逼真。網(wǎng)絡(luò)上公開(kāi)發(fā)布的視頻和錄音數(shù)量之多,容易獲取,這使得訓(xùn)練 AI 算法和 Deepfakes 容易許多。研究人員表示,對(duì)于人們來(lái)說(shuō),區(qū)分 AI 偽造的人像、物體和視頻與真實(shí)情況十分困難。
2022 年,Deepfakes 在媒體上大量涌現(xiàn),尤其是在政治領(lǐng)域。2022 年 3 月,《華爾街日?qǐng)?bào)》報(bào)道了韓國(guó)總統(tǒng)大選候選人 Yoon Suk-yeol 利用 Deepfakes 技術(shù)改善自己在年輕選民中的公眾形象的新聞。這個(gè)名為“AI Yoon”的數(shù)字人看起來(lái)十分風(fēng)趣幽默。
Deepfakes 衍生出的假新聞和假消息是一個(gè)大問(wèn)題。對(duì)于消費(fèi)者來(lái)說(shuō)。Deepfakes 還有可能成為網(wǎng)絡(luò)釣魚(yú)和勒索詐騙的工具。
微軟認(rèn)為,AI 防御體系無(wú)法完全打擊 Deepfakes 生成的假冒產(chǎn)品,于是推出了 Project Origin(起源項(xiàng)目),允許出版商使用防篡改元數(shù)據(jù)對(duì)媒體進(jìn)行認(rèn)證的服務(wù)。
美國(guó)加州的一家創(chuàng)業(yè)公司 Truepic 使用加密和區(qū)塊鏈技術(shù)打造圖像視頻真實(shí)驗(yàn)證平臺(tái)。Truepic 一直在與高通公司合作,為高通公司應(yīng)用芯片組的智能手機(jī)拍攝的照片加上水印。去年 Truepic 獲得 Adobe、微軟 M12、Sony Innovation Fund(索尼創(chuàng)新基金)等 2700 萬(wàn)美元的融資。
為了應(yīng)對(duì)日益增長(zhǎng)的網(wǎng)絡(luò)安全威脅,一些科技公司開(kāi)始嘗試各種解決方案,包括設(shè)備端認(rèn)證軟件和 API、區(qū)塊鏈等。去年,Meta 的研究人員聲稱(chēng)他們不僅可以確定圖像是否是偽造的,還可以剖析用于深度偽造的 AI 模型。但是 Deepfakes 技術(shù)還將持續(xù)演進(jìn)、無(wú)處不在,人們需要尋找新的方法將其摧毀。
低代碼/零代碼開(kāi)發(fā)
算法能將自然語(yǔ)言命令翻譯成計(jì)算機(jī)代碼,特別是對(duì)公民開(kāi)發(fā)者來(lái)說(shuō),這意味著軟件開(kāi)發(fā)新一股的浪潮。
2021 年 6 月,GitHub(2018 年該公司被微軟收購(gòu))和 OpenAI(微軟持有其10 億美元的少數(shù)股權(quán))聯(lián)合推出了 Copilot。Copilot 最大的一個(gè)功能就是可以將英語(yǔ)注釋轉(zhuǎn)換為代碼。
微軟并不是唯一一家涉獵該領(lǐng)域的科技巨頭。2022 年 2 月,谷歌 DeepMind 發(fā)布了新的編程系統(tǒng) AlphaCode,作為讓其 AI 世界的代表競(jìng)逐編程比賽。在通過(guò) Codeforces 平臺(tái)上的編程競(jìng)賽后,DeepMind 表示其 AI 的表現(xiàn)已到達(dá)中等水平。
初創(chuàng)公司則更關(guān)注軟件測(cè)試:自動(dòng)化質(zhì)量檢查和代碼單元測(cè)試。其中包括,得到 CRV 和 Google Ventures 融資的 Mabl、獲 Salesforce Ventures 融資的 Autify、2022 年 Q1 獲 1000 萬(wàn) B 輪融資以及牛津大學(xué)的衍生公司 Diffblue。
自動(dòng)編程仍處于初級(jí)階段。但該領(lǐng)域技術(shù)進(jìn)步促使一些初創(chuàng)公司不斷拓展零代碼/低代碼解決方案,讓非技術(shù)用戶(hù)能夠參與數(shù)據(jù)科學(xué)項(xiàng)目,縮小技能差距,并加快生產(chǎn)周期。
多模態(tài) AI 崛起
多模態(tài) AI 正在打破單一感官的藩籬,使用一個(gè)通用 AI 模型科技將多種類(lèi)型的數(shù)據(jù)所蘊(yùn)含的語(yǔ)義信息概念化并作出預(yù)測(cè)。
在 2021 年初,OpenAI 發(fā)布了可以根據(jù)文本信息生成圖像的 AI 模型 DALL-E。
2022 年 1 月,OpenAI 發(fā)布了升級(jí)版 DALLE-2,生成圖像的畫(huà)質(zhì)提升了 4 倍。
2022 年 5 月,谷歌推出了圖像生成器 Imagen。據(jù)稱(chēng),Imagen 在生成圖像的質(zhì)量以及輸入文本和生成的圖像的一致性方面要優(yōu)于 OpenAI 模型。
今年早些時(shí)候,Meta 發(fā)表了一篇名為 “不同視覺(jué)模態(tài)都能通吃的雜食者”的論文,其中詳細(xì)介紹了如果對(duì)一種 AI 模型進(jìn)行識(shí)別 2D 圖像的預(yù)訓(xùn)練,不經(jīng)過(guò)額外的模態(tài)訓(xùn)練,該模型也能可以識(shí)別視頻或三維圖像中的南瓜。
多模態(tài) AI 正在從實(shí)驗(yàn)室走到實(shí)際應(yīng)用。例如,谷歌正在使用多模態(tài) AI 來(lái)改進(jìn)搜索體驗(yàn)。未來(lái),如果用戶(hù)上傳了一張登山靴的照片,并附上“我能穿著這雙靴子去富士山徒步旅行嗎?”的文字,搜索引擎將識(shí)別上傳的圖像,從文本、圖像和視頻數(shù)據(jù)中挖掘網(wǎng)絡(luò)上關(guān)于富士山的信息,并將這些瑣碎的信息連接起來(lái),提供一個(gè)貼切的答案。
多模態(tài) AI 正在走出實(shí)驗(yàn)室,為搜索服務(wù)和內(nèi)容生成等應(yīng)用提供驅(qū)動(dòng)力。
AI for AI
隨著 AI 技術(shù)應(yīng)用延展,企業(yè)正在尋求徹底改變現(xiàn)有的數(shù)據(jù)管理模式的解決方案,轉(zhuǎn)向“AI 優(yōu)先”策略。
說(shuō)起來(lái)容易做起來(lái)難。從采集數(shù)據(jù)、運(yùn)行數(shù)據(jù)質(zhì)量檢查到開(kāi)發(fā)模型和監(jiān)測(cè)后期生產(chǎn)表現(xiàn),一個(gè)項(xiàng)目從原始數(shù)據(jù)轉(zhuǎn)變?yōu)樯a(chǎn)準(zhǔn)備是一個(gè)多步驟的過(guò)程。
市場(chǎng)上涌現(xiàn)出數(shù)以百計(jì)的公司研發(fā)各階段的解決方案。
端到端的機(jī)器學(xué)習(xí)公司將 AI 生命周期管理過(guò)程中的多步驟融合成一個(gè) SaaS 產(chǎn)品,這將為那些希望快速高效構(gòu)建 AI 系統(tǒng)的企業(yè)提供絕佳選擇。
2021 年 5 月,谷歌發(fā)布了端到端開(kāi)發(fā)平臺(tái) Vertex AI,該公司稱(chēng) Vertex AI 能為沒(méi)有機(jī)器學(xué)習(xí)經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供一站式服務(wù)。
DataRobot 是一家市值 63 億美元的公司,多年來(lái)通過(guò)并購(gòu)積極擴(kuò)大產(chǎn)品規(guī)模。去年,DataRobot 進(jìn)行了 3 筆收購(gòu),擴(kuò)大市場(chǎng)份額。
無(wú)代碼和低代碼趨勢(shì)也擴(kuò)展至機(jī)器學(xué)習(xí)平臺(tái),以彌合 AI 技能差距,plug-and-play(即插即用)的功能激勵(lì)非專(zhuān)家人員參與到 AI 項(xiàng)目中。為此,2021 年,全球第二高估值 AI 獨(dú)角獸公司 Databricks 收購(gòu)了低程序代碼工具供應(yīng)商 8080 Labs。
隨著大多數(shù)老牌廠商開(kāi)始布局 Auto ML(自動(dòng)機(jī)器學(xué)習(xí))功能,“AI for AI”也成為增長(zhǎng)的領(lǐng)域。企業(yè)開(kāi)始使用 AI 技術(shù)將 AI 開(kāi)發(fā)過(guò)程的各環(huán)節(jié)自動(dòng)化,如數(shù)據(jù)質(zhì)量檢查或部分模型開(kāi)發(fā)環(huán)節(jié)。
持續(xù)分化,未來(lái)已來(lái),“AI for AI”將迎來(lái)更廣闊的發(fā)展空間。