在3月底舉行的“深圳市智慧安防商會第一屆二次會員大會”上,北京深鑒科技有限公司銷售與市場總監(jiān)付祺偉圍繞著“深度學(xué)習(xí)處理器與多場景AI應(yīng)用”的主題現(xiàn)場做了些許分享,在演講當(dāng)中,付祺偉重點提到了關(guān)于降低人工智能應(yīng)用門檻的問題,也是當(dāng)前用戶端比較關(guān)心的問題。
近兩年來,隨著算力條件的不斷升級以及各行各業(yè)應(yīng)用需求的爆發(fā),人工智能成為當(dāng)前炙手可熱的商業(yè)“課題”。而人工智能要做到“有用,好用”,在硬件架構(gòu)上需要大規(guī)模的GPU、CPU做運算支持,這意味著高成本的投入,為了讓人工智能在應(yīng)用領(lǐng)域爆發(fā)開來,當(dāng)前我們需要解決應(yīng)用門檻的問題,直白的說就是把應(yīng)用成本降下來。如何解決成本的問題呢?首先,我們來了解一下計算平臺的變革歷程。
計算平臺變革帶來性能和成本的改變
2012年初,谷歌算法工程師轟動全球的貓臉識別,當(dāng)時動用了1000臺服務(wù)器和16000個CPU ,模擬了一個10億個節(jié)點的神經(jīng)網(wǎng)絡(luò),一千萬張谷歌貓臉圖片,訓(xùn)練出了貓臉識別的算法,耗資巨大。同年,一位叫Geoffrey的工程師僅用一臺服務(wù)和2個GPU,開發(fā)了AlexNet的算法,在ImageNet一百萬張圖片庫的識別率就達(dá)到了百分之八十幾。
從16000個CPU到2個GPU,計算平臺的變革所帶來的改變是巨大的,既帶來了使用體驗的高效提升,同時對于成本的控制也顯而易見。
通用芯片轉(zhuǎn)向?qū)S眯酒?/strong>
人工智能所需的深度學(xué)習(xí)需要很高的內(nèi)在并行度、大量浮點計算能力以及矩陣運算,計算量巨大,因此也推動著通用的智能芯片向?qū)S眯酒霓D(zhuǎn)化。付祺偉向大家介紹了目前業(yè)內(nèi)出現(xiàn)的一些定制級的AI芯片,比如國外的芯片巨頭如ARM在CPU上添加神經(jīng)網(wǎng)絡(luò)加速庫、NVIDA的針對AI訓(xùn)練側(cè)的GPU、Xilinx的FPGA、針對深度學(xué)習(xí)推理側(cè)的TPU V1、把自動駕駛算法寫到芯片上的Mobileye Eye Q5 、Intel CPU 、Movidius DSP 等都是針對不同層級的AI芯片。
這兩年來,隨著國產(chǎn)AI芯片的崛起,國內(nèi)如寒武紀(jì)、地平線、深鑒科技等也在AI芯片上取得了不錯的進展,其針對的AI層級也有所不同,如寒武紀(jì)面向更通用的機器學(xué)習(xí)市場的Cambricon MLU 、深鑒科技自家的DeePhi DPU則更加關(guān)注深度學(xué)習(xí)層面、地平線的Horizon Journey更專注于面向行業(yè)的算法。
相比于通用芯片,專用芯片是為特定場景而定制的,具備低功耗、低成本、高性能的優(yōu)勢。
深度模型壓縮算法:提速、減負(fù)、降成本
目前在深度學(xué)習(xí)領(lǐng)域分類兩個派別,一派為學(xué)院派,研究強大、復(fù)雜的模型網(wǎng)絡(luò)和實驗方法,為了追求更高的性能;另一派為工程派,旨在將算法更穩(wěn)定、高效的落地在硬件平臺上,效率是其追求的目標(biāo)。付祺偉認(rèn)為,復(fù)雜的模型固然具有更好的性能,但是高額的存儲空間、計算資源消耗是使其難以有效的應(yīng)用在各硬件平臺上的重要原因。
深鑒科技擁有一套深度模型壓縮算法,這里的壓縮并不同于我們接觸的H.264(H.265)視頻壓縮,而是對算法神經(jīng)網(wǎng)絡(luò)、算法模型的壓縮。為什么算法模型需要壓縮?
付祺偉表示,一套算法模型一般有大約100Byte的內(nèi)存規(guī)模,里面包含了神經(jīng)網(wǎng)絡(luò)各個節(jié)點的權(quán)重值以及各種計算的鏈接,如果把這么多的權(quán)重值和鏈接都讀到內(nèi)存中讓它們之間相互做運算,它所需要消耗的DDR和存儲空間都是非常巨大的,同時也將產(chǎn)生巨大的計算量。
深鑒科技深度模型壓縮算法可以通過“剪枝”和稀疏化來實現(xiàn)對算法模型的壓縮。
付祺偉解釋道,“剪枝”就是把不必要的信息過濾掉,稀疏化即是把沒有產(chǎn)生鏈接,沒用的權(quán)重值去掉,通過這樣的方式,就可以把比較大的神經(jīng)網(wǎng)絡(luò)壓縮成一個小型規(guī)模的神經(jīng)網(wǎng)絡(luò),降低功耗的同時,性能保持不變,也讓運算速率提升起來。
小結(jié)
人工智能熱度不減,因為AI確實是當(dāng)前個各智能產(chǎn)業(yè)領(lǐng)域提升生產(chǎn)力的重要推力,但目前市場上大談算法和技術(shù)成果的企業(yè)很多,真正能拿出手的應(yīng)用案例仍相對較少。AI 企業(yè)更應(yīng)該站在用戶的角度,解決AI落地應(yīng)用的問題,包括成本控制、運算性能等,這樣才能讓人工智能在應(yīng)用領(lǐng)域加速普及,“工程派”的企業(yè)也將走得更穩(wěn),更遠(yuǎn)。