在第四期百度大腦開放日上,百度AI技術(shù)生態(tài)部高級(jí)產(chǎn)品經(jīng)理婁雙雙宣布百度大腦在6-7月新開放與升級(jí)的產(chǎn)品能力共22項(xiàng),包含新能力開放、開發(fā)平臺(tái)的全新升級(jí)、以及新硬件的發(fā)布等。
其中在視覺方向,人體分析與車輛識(shí)別方向有3項(xiàng)新能力,包括手部關(guān)鍵點(diǎn)識(shí)別、危險(xiǎn)行為識(shí)別、車輛分割;以及3款產(chǎn)品能力升級(jí),包括人體關(guān)鍵點(diǎn)識(shí)別、人流量統(tǒng)計(jì)、駕駛行為分析。更精細(xì)的關(guān)鍵點(diǎn)定位,將助力人機(jī)交互、互動(dòng)娛樂等場(chǎng)景應(yīng)用,而更豐富、精準(zhǔn)的行為分析與識(shí)別能力,也將有效助力公共和交通安全。
OCR方向,婁雙雙表示,車牌、表格文字、通用文字(高精度/高精度含位置版)以及行駛證5款產(chǎn)品識(shí)別召回率均有不同程度的提升。同時(shí)人臉離線識(shí)別SDK升級(jí)至3.0版本,活體檢測(cè)與通行全流程耗時(shí)低于300ms;人臉識(shí)別私有化部署包適配了最新的RTX系列2080顯卡,并進(jìn)一步提升模型性能。
在AI模型開發(fā)過程中,數(shù)據(jù)標(biāo)注往往占據(jù)了一半以上的時(shí)間和金錢成本。婁雙雙表示,此次EasyDL定制化模型訓(xùn)練與服務(wù)平臺(tái)在數(shù)據(jù)標(biāo)注、模型、服務(wù)部署三方面再度更新,智能標(biāo)注可節(jié)約70%的數(shù)據(jù)標(biāo)注成本。
AI模型在端上的落地應(yīng)用往往伴隨著復(fù)雜的硬件選型、軟硬件適配,耗時(shí)耗力。百度大腦本次推出了三款全新的硬件方案:EdgeBoard邊緣AI計(jì)算盒、EasyDL開發(fā)套件(十目)、EdgeBoard全目標(biāo)抓拍機(jī),為終端應(yīng)用場(chǎng)景提供實(shí)踐。
在深度學(xué)習(xí)平臺(tái)方面,源于產(chǎn)業(yè)實(shí)踐的開源深度學(xué)習(xí)平臺(tái)飛槳(PaddlePaddle)此次主要升級(jí)的內(nèi)容包括:核心框架Paddle Fluid v1.5版本發(fā)布,PaddleNLP,PaddleCV,發(fā)布動(dòng)態(tài)圖,訓(xùn)練性能優(yōu)化;工具組件PaddleHub新增29個(gè)預(yù)訓(xùn)練模型、發(fā)布圖學(xué)習(xí)框架PGL Preview版。
其中,PaddleNLP是百度大腦工業(yè)級(jí)NLP開源工具與預(yù)訓(xùn)練模型集,具備了中文詞法分析、文本情感分類等10項(xiàng)NLP應(yīng)用任務(wù)。