10月27日至11月2日,兩年一屆的國際計算機視覺大會ICCV 2019(International Conference on Computer Vision)在韓國首爾召開。國際計算機視覺大會(ICCV)與計算機視覺模式識別會議(CVPR)、歐洲計算機視覺會議(ECCV)并稱計算機視覺方向的三大頂級會議。澎思科技首次參加便一舉獲得ICCVLFR三項競賽第一,并獲得組委會頒發(fā)的特別創(chuàng)意獎,這彰顯了澎思在落地應用場景化的計算機視覺技術實力。
無約束條件下的靜態(tài)圖像人臉識別和動態(tài)視頻人臉識別是計算機視覺領域研究最為深入的課題之一,在視頻監(jiān)控、生物醫(yī)療等領域擁有廣泛的應用場景。近年來,計算機視覺各領域的新技術、新方法都在多個頂級計算機視覺會議上被提出,基于深度學習的人臉識別技術也取得了階段性的進展。
盡管在人臉識別領域的研究取得了很多成果,但在基于深度學習的輕量級人臉識別研究和努力仍有待加強。在面對大數(shù)據(jù)庫人臉識別應用的背景下,尋找一個可以在無限制的動態(tài)監(jiān)控視頻場景下有優(yōu)異的表現(xiàn)的輕量級高精度的模型依然是一個挑戰(zhàn)。
ICCV LFR(Lightweight Face Recognition Challenge)輕量級人臉識別挑戰(zhàn)賽正是基于這樣的目的設立。它也成為今年ICCV的一項重要競賽,吸引了來自全球292支競賽隊伍的參加。不同于其他人臉識別比賽,ICCV LFR挑戰(zhàn)賽嚴格限制了訓練數(shù)據(jù)和測試數(shù)據(jù)。在如此嚴格的限制條件下,如何在292個參賽隊伍中脫穎而出變得異常艱難。
此次ICCV LFR挑戰(zhàn)賽一共分為四項競賽,每項競賽都有各自的限制和側重點:
1、Protocol-1 (DeepGlint-Light) 圖像人臉識別輕量級識別模型,運算復雜度小于1Gflops,模型大小小于20MB,數(shù)據(jù)類型float32,特征維度512 (FPR@1e-8);
2、Protocol-2 (DeepGlint-Large) 圖像人臉識別大型級識別模型,運算復雜度小于30Gflops,數(shù)據(jù)類型float32,特征維度512 (FPR@1e-8);
3、Protocol-3 (IQIYI-Light) 視頻人臉識別輕量級識別模型,運算復雜度小于1Gflops,數(shù)據(jù)類型float32,特征維度512 (FPR@1e-4);
4、Protocol-4 (IQIYI-Large) 視頻人臉識別大型識別模型,運算復雜度小于30Gflops,數(shù)據(jù)類型float32,特征維度512 (FPR@1e-4)。
最終,澎思新加坡研究院申省梅團隊提出基于關系圖的無監(jiān)督學習方法來強化特征,在ICCVLFR挑戰(zhàn)賽的輕量級圖像識別、大型圖像識別和輕量級視頻圖像識別三項競賽中成績第一,領先微軟亞洲研究院、中科院自動化所、京東、今日頭條等參賽的研究機構和企業(yè),并與它們拉開了不小的差距。在輕量級圖像識別比賽中,誤報率在億分之一(1e-8)的情況下,澎思科技取得了93.41%成績,比其他參賽者高了近六個百分點。在輕量級視頻圖像比賽中,澎思科技72.23%的成績比其他參賽者高了近九個百分點。
在ICCV LFR的Workshop上,澎思新加坡研究院團隊做了題為“A Graph Based Unsupervised Feature Clustering for Face Recognition”的口頭報告,闡述了團隊提出的無監(jiān)督學習方法,利用測試數(shù)據(jù)兩兩之間的關系,使得屬于同一個ID的特征分布更加緊湊,不同ID的特征之間距離更加分散,由此大幅度提高了識別精度。該方法的有效性在IJB-C,YTF和CFP數(shù)據(jù)庫上都已經(jīng)被驗證,并且大幅度提高了基線模型(baseline)的精度。
除了在ICCVLFR挑戰(zhàn)賽上取得三項第一外,澎思科技最新的算法模型在美國NIST人臉識別公開數(shù)據(jù)集IJB-C上的表現(xiàn)也打破了世界記錄。IJB-C是在無限制條件下的美國NIST人臉識別公開數(shù)據(jù)集中最為科學全面的基準數(shù)據(jù)庫。在LFW,CFP-FP,AgeDB-30精確度普遍飽和的今天,IJB-C是目前最貼近視頻監(jiān)控實戰(zhàn)應用場景的人臉識別基準數(shù)據(jù)庫。
不僅僅是人臉識別領域,澎思科技近期在行人再識別(ReID)、視頻行人再識別(Video-based ReID)、即時定位與地圖構建(SLAM)等計算機視覺技術上均取得突破,獲得多項世界冠軍。
- 7月,澎思科技在行人再識別(ReID)三大主流數(shù)據(jù)集測試Market1501,DukeMTMC-reID,CUHK03上刷新世界紀錄。
- 8月,澎思科技刷新視頻行人再識別(Video-based ReID)三大數(shù)據(jù)集PRID-2011,iLIDS-VID,MARS歷史最好成績。
- 10月,在剛剛結束的ISMAR 2019上,澎思科技在AR-SLAM挑戰(zhàn)賽中獲得VSLAM競賽第三名。SLAM技術可以用于各種應用包括自動駕駛,運動機器人,3D重建,增強現(xiàn)實和混合現(xiàn)實。視覺SLAM是澎思科技在計算機視覺技術上的一個重要積累,也將為公司在現(xiàn)有和將來的業(yè)務中附加更多價值。正在舉行的2019深圳安博會上,澎思科技推出了面向安防場景的無人巡邏警車,后續(xù)澎思自研的深度學習Visual SLAM技術就將逐步替代3D LiDAR來完成無人巡邏車的定位導航,從而降低成本,擴展應用場景。
目前,澎思科技在北京和新加坡兩地設立研究院,不斷匯聚全球AI人才,擁有全自研、全棧的計算機視覺技術,橫跨計算機視覺多個研究領域。在此基礎之上,澎思科技一方面立足于現(xiàn)有業(yè)務和商業(yè)模式,結合公司的發(fā)展方向展開面向場景的AI技術研發(fā)和創(chuàng)新;另一方面不斷從全球視角探索前沿技術,讓公司始終保持對突破性科技的敏感度和關注度,為公司發(fā)力人工智能領域、探索新業(yè)務做好技術儲備。