前言:本文提出了一種基于大數(shù)據(jù)與人工智能分析的現(xiàn)代人口管控技術(shù),研究了復(fù)雜條件下人像識別技術(shù),并將成果成功應(yīng)用于基層公安實(shí)戰(zhàn),探索了一條結(jié)合集成實(shí)際的公安信息化建設(shè)的道路。其成果能夠有效整合跨警種、跨部門的人員信息資源,有效的提升公共安全領(lǐng)域的信息化水平,并在實(shí)戰(zhàn)中取得優(yōu)異成績。
文/李夏風(fēng) 云從科技研發(fā)總監(jiān)
(一)背景/引言:
隨著經(jīng)濟(jì)的高速發(fā)展以及城鎮(zhèn)化進(jìn)程的加快,我國城市人口日趨密集,城市人口流動(dòng)性也大大增加,但是各種犯罪活動(dòng)也爆發(fā)式增長,犯罪手段也越來越豐富隱秘,如通過使用多重身份證、假身份證實(shí)行犯罪,逃避抓捕等,加之交通便利、人口流動(dòng)性大,更加大了公安工作人員打擊抓捕犯罪嫌疑人的難度與力度。
當(dāng)前城市治安視頻監(jiān)控系統(tǒng)正處在大規(guī)模建設(shè)階段的后期,地方也投入大量資金人力去建設(shè)平安城市,但是僅僅依靠采集到的視頻圖像。當(dāng)前應(yīng)用的現(xiàn)狀是僅僅各級監(jiān)控中心走馬觀花的看看各監(jiān)控點(diǎn)的視頻,和在發(fā)生案件后刑偵部門為查找線索翻翻錄像資料。這種簡單的應(yīng)用對于幾千萬甚至幾個(gè)億的建設(shè)投資,或每年成百上千萬租賃費(fèi)用來講,顯然是遠(yuǎn)遠(yuǎn)不夠的。同時(shí)在大規(guī)模視頻監(jiān)控系統(tǒng)中,因其缺乏對視頻的智能分析,要在海量的監(jiān)控視頻以及百萬計(jì)的照片庫中找出犯罪嫌疑人,不僅費(fèi)時(shí)費(fèi)力,還有可能造成遺漏等情況,破案的效率大打折扣。對治安事件無法實(shí)時(shí)記錄和預(yù)警;長期觀察監(jiān)控視頻也突顯了人員疲勞的局限性;而且海量的錄像數(shù)據(jù)難以管理和有效查看。對公安刑偵視頻破案、對犯罪嫌疑人、重點(diǎn)高危人員實(shí)時(shí)布控等需要智能信息技術(shù)的支撐。
進(jìn)一步,由于沒有統(tǒng)一建設(shè)一個(gè)信息化平臺,造成了公安機(jī)關(guān)各部門的信息資源不能得到充分的利用,也不能為領(lǐng)導(dǎo)的決策提供及時(shí)、準(zhǔn)確、詳細(xì)的可靠依據(jù)。各級各部門的信息化建設(shè)目前基本處在各自應(yīng)用的水平,沒有達(dá)到各警種各部門之間的信息共享,各類信息的應(yīng)用資源沒有得到充分的挖掘和合理有效的綜合利用,還不能為領(lǐng)導(dǎo)決策提供科學(xué)及時(shí)的服務(wù),也不能為一線民警提供全天候、全方位、全過程的綜合信息支持。
在進(jìn)入人工智能時(shí)代,人臉識別技術(shù)在以上情況下解決視頻、圖片等非結(jié)構(gòu)化信息到人員照片、身份信息等結(jié)構(gòu)化的轉(zhuǎn)變。針對目前現(xiàn)存的社會(huì)維穩(wěn)、反恐工作壓力巨大,警力資源有限,傳統(tǒng)工作模式和技術(shù)手段難以支撐等各種問題,需要建立一套專業(yè)的公安人臉大數(shù)據(jù)實(shí)戰(zhàn)應(yīng)用平臺,助力公安辦案業(yè)務(wù)智能化。比如,對案發(fā)嫌疑人進(jìn)行視頻偵查需要對嫌疑人的動(dòng)態(tài)活動(dòng)軌跡、社會(huì)關(guān)系等的數(shù)據(jù)的及時(shí)采集和分析,對重點(diǎn)場所的防控離不開對場所的人流趨勢、風(fēng)險(xiǎn)因素等深度分析;對重點(diǎn)人群的服務(wù)離不開對重點(diǎn)人群的組成、行為習(xí)慣等的分析;對社會(huì)矛盾的化解離不開對幕后推手的深挖。
因此,結(jié)合公安實(shí)戰(zhàn),研究基于大數(shù)據(jù)與人工智能分析的現(xiàn)代人口管控技術(shù)與應(yīng)用,就可以最大限度發(fā)揮各類人像數(shù)據(jù)資源的作用,為各級公安機(jī)關(guān)和各警種提供服務(wù),實(shí)現(xiàn)以“人臉”找人,深挖各類影像數(shù)據(jù)的實(shí)戰(zhàn)價(jià)值,為公安實(shí)戰(zhàn)提供簡單、高效、實(shí)用的技術(shù)手段。
同時(shí)將人像比對應(yīng)用“嵌入”到平安城視頻監(jiān)控系統(tǒng)中,在治安和刑偵業(yè)務(wù)開展環(huán)節(jié),實(shí)現(xiàn)可疑身份、在逃份子等有效監(jiān)管,能夠有效利用現(xiàn)有視頻監(jiān)控資源。通過后期查詢抓拍庫的人員,確認(rèn)出現(xiàn)在某個(gè)攝像機(jī)下的人員身份,能夠有效震懾犯罪,消除社會(huì)治安隱患。
人像比對就是在尋找一種人像的描述方式,能夠不受各種因素影響。但是,無論是最早使用的幾何描述方式還是后來比較常用的代數(shù)描述方式,都不可避免地存在各種干擾。正因?yàn)樵谌四樧R別的過程中存在上述的各種各樣的問題,因此在實(shí)際的檢測和識別過程中,當(dāng)這些因素疊加到一起的時(shí)候,情況就變得更加復(fù)雜,輕微的光線變化就有可能導(dǎo)致識別失敗。本文的研究是基于深度神經(jīng)網(wǎng)絡(luò),通過引入深度學(xué)習(xí)技術(shù),提升人像比對準(zhǔn)確率,適應(yīng)公安實(shí)戰(zhàn)需要。
一、分層矢量化模型
圖:單層的特征編碼的流程圖
為了解決深度神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)的問題,我們提出了分層矢量化多媒體信息表達(dá)體系。分層矢量化實(shí)際上是一個(gè)多層的特征編碼的過程。一個(gè)單層的特征編碼由以下幾個(gè)步驟組成:首先,對圖片庫里所有的人臉圖像進(jìn)行分塊;其次對每塊區(qū)域提取局部特征(如LBP、SIFT)形成局部特征描述子;然后,對所有局部特征進(jìn)行量化形成字典;最后,根據(jù)字典信息和人臉圖像的映射,編碼形成人臉圖像的特征向量,我們定義該特征向量為人臉DNA。
人臉DNA特征能夠很好的描述特定人臉的不變量,該特征對人臉光線、角度、表情以及各種圖片噪聲具有一定的抗干擾性,再由雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化與學(xué)習(xí),人臉的區(qū)分性更強(qiáng),識別效果更佳。
舉個(gè)例子:我們認(rèn)一個(gè)人,最簡單的從這個(gè)人的身高、體型出發(fā)、發(fā)型等來判斷是誰(認(rèn)知第一層);更深一層從這個(gè)人的人臉、骨骼、虹膜、指紋來確認(rèn)這個(gè)人的身份(認(rèn)知第二層);更深層次,我們可以通過這個(gè)人的DNA來確認(rèn)這個(gè)人的真實(shí)身份(認(rèn)知第三層)。所以認(rèn)知一個(gè)人,隨著逐層深入,一層比一層更加可靠。
人臉DNA類似,在計(jì)算機(jī)人臉識別過程中,我們可以將人臉的最外在特征眼睛大小形狀(丹鳳眼、濃眉大眼等),鼻子形狀(鷹鉤鼻、平鼻),嘴的大小形狀(櫻桃小嘴)理解成第一層;可以將眼睛的距離,五官的位置,臉的輪廓等理解成第二層;將人臉信息更抽象,提煉出人臉不隨光照、角度、年齡等影響的特征,就是更深的層,我們定義為人臉DNA。
二、雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)
為了將兩張照片映射到同一特征空間中進(jìn)行比較,在異構(gòu)深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,我們提出了雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)模型。此模型中每層都是一個(gè)深度網(wǎng)絡(luò)(分別以兩張照片為輸入),在訓(xùn)練時(shí)采用二分類損失函數(shù)并對兩個(gè)網(wǎng)絡(luò)中對應(yīng)權(quán)值的差異性進(jìn)行正則化,可實(shí)現(xiàn)不同圖像空間到相同特征空間的映射。在特征空間中,相同身份人臉圖像的類內(nèi)差異變小,而不同身份人臉圖像的類間差異變大,從而增強(qiáng)了特征的判別性。
以人證合一為例:人的證件照要和現(xiàn)場的抓拍照或者普通照片上的人臉進(jìn)行比對,我們不能直接拿來比對,這樣因?yàn)槟挲g、光照等各種信息影響,識別不準(zhǔn)。我們應(yīng)該將證件照送到深度神經(jīng)網(wǎng)絡(luò)的一層,現(xiàn)場照送到深度神經(jīng)網(wǎng)絡(luò)的另一層,兩張照片通過兩層不同的網(wǎng)相互交換信息(年齡差距、角度差距、光照影響等),逐漸的去掉這些對人臉識別不利的因素,將兩張人臉照片映射到同一個(gè)可比的空間再進(jìn)行比較。
圖:雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)示意圖