人臉識(shí)別技術(shù)與指紋、虹膜、掌紋、聲音等生物特征識(shí)別技術(shù)相比,人臉識(shí)別(Automatic FACE Recognition,AFR)是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。它所使用的人臉圖像需要攝像機(jī)進(jìn)行捕捉,并自動(dòng)地在圖像中檢測和跟蹤人臉,進(jìn)而對(duì)檢測到的人臉進(jìn)行特征提取、比對(duì)等一系列相關(guān)的技術(shù),其包括人臉圖像采集、人臉定位、人臉識(shí)別預(yù)處理、記憶存儲(chǔ)和比對(duì)辨識(shí),以達(dá)到識(shí)別不同人身份的目的。
雖然傳統(tǒng)身份驗(yàn)證方法發(fā)展至今依舊沿用著,好比口令、身份證卡等各類識(shí)別物、鑰匙、門栓等等,但傳統(tǒng)方式的不方便、不安全、不可靠的缺點(diǎn)已經(jīng)不適應(yīng)社會(huì)發(fā)展,各式各樣的破解之法已深深地傷害著用戶。直到生物特征識(shí)別技術(shù)(Biometric)的出現(xiàn),最終受到了廣泛的應(yīng)用、重視以及被深入地研究。它利用人體固有的生物特征或者行為特征來進(jìn)行身份的鑒定和確認(rèn),好比指紋、人臉、虹膜、掌紋、聲音、指靜脈等,其具有唯一性、永久性、可靠性和隨身固有性等優(yōu)點(diǎn),從根本上杜絕了偽造和竊取,在金融安全、社會(huì)安全、國家公共安全以及人機(jī)交互等各領(lǐng)域都得到了非常廣泛的應(yīng)用。特別在國家公共安全方面,能夠有效保障國家公共安全,特別是人臉、指紋、聲紋識(shí)別技術(shù)對(duì)于危險(xiǎn)分子能夠起到有效及時(shí)的監(jiān)控和驗(yàn)證,提供了強(qiáng)加有力的技術(shù)保障。
如何認(rèn)人識(shí)臉
人臉存在著大量體現(xiàn)個(gè)體差異的細(xì)節(jié),而作為一個(gè)異常復(fù)雜的人臉結(jié)構(gòu),加上人面部肌肉的運(yùn)動(dòng)和易受環(huán)境和歲月的影響,又使得人臉成為一種非剛性物體,因此人臉成像到算法技術(shù)識(shí)別認(rèn)證成為一個(gè)難解的問題。比如隨著年齡的增長,人臉?biāo)a(chǎn)生的一系列變化,同時(shí)人臉圖像采集還會(huì)受成像距離、拍攝角度、光線、面部表情等等因素的影響,從而使人臉圖像采集存在很大的差異性。不過人類的人臉又具有相似的結(jié)構(gòu)特點(diǎn),頭部輪廓、人臉區(qū)域各器官的獨(dú)特灰度分別、各器官的分布特性等等,造就如今能夠認(rèn)人、識(shí)臉。
中國建標(biāo)會(huì)通信工程西北委員會(huì)常委陳嘉偉:“人臉識(shí)別是智能分析里最復(fù)雜的技術(shù),人臉識(shí)別是利用計(jì)算機(jī)人臉圖像識(shí)別技術(shù),自動(dòng)地從靜態(tài)或動(dòng)態(tài)圖像中檢測出并識(shí)別人臉的這一過程。除了預(yù)先人臉建模外,人臉識(shí)別主要分三個(gè)過程,分別是人臉檢測、特征提取、識(shí)別分類。”人臉檢測是從圖像獲取后,判斷圖像是否存在人臉,并確認(rèn)人臉圖像中的人臉位置、大小等信息。并且檢測過程中,光照、噪聲、角度、遮擋等因素,都會(huì)影響到特征的提取以及人臉分類這兩個(gè)過程的準(zhǔn)確性。隨后就是特征提取,這也是人臉識(shí)別系統(tǒng)中的最核心部分。由于人臉是三維圖像,對(duì)于二維人臉圖像識(shí)別,其會(huì)受到此前所說的遮擋、化妝、光照、表情等因素的干擾與影響,并且人臉圖像表現(xiàn)為像素的灰度值矩陣,維度較大,無法直接進(jìn)行描述人臉。所以,特征提取就是解決以上兩個(gè)問題的核心技術(shù)。最后就是人臉分類,將識(shí)別到的人臉和已知人臉數(shù)據(jù)庫中的人臉進(jìn)行比對(duì),尋找出最相似的人臉?;跀?shù)據(jù)量龐大以及特征提取、識(shí)別分類算法的精度與效率,人臉識(shí)別能否最終“認(rèn)出”真人臉,成為其中最大的挑戰(zhàn)。
識(shí)別難嗎
人臉識(shí)別作為非“入侵”式的生物特征識(shí)別方法,具有較高的可靠性、安全性,在國防安全、視頻監(jiān)控、人機(jī)交互等方面具有廣泛的應(yīng)用。傳統(tǒng)人臉識(shí)別算法在受某種或某幾種特定因素影響的限制條件下能夠獲得較好的效果(如采集角度、照度、位置等都預(yù)先設(shè)定),但在非限制條件下識(shí)別性能便急劇下降。北京博思廷科技有限公司總經(jīng)理王巍(以下簡稱“博思廷王巍”)也說道:“人臉識(shí)別技術(shù)根據(jù)人臉來識(shí)別人員的身份,是將傳感器(尤其是攝像機(jī))采集到的人臉圖像轉(zhuǎn)換成人臉數(shù)據(jù)與人臉數(shù)據(jù)庫中的人臉數(shù)據(jù)進(jìn)行比對(duì),得到兩個(gè)人臉之間的相似度,判定是否為同一人員,或找到庫中與此人最相似的人員。然后根據(jù)傳感器獲取到的數(shù)據(jù)不同,主流算法可以分為根據(jù)2D圖像識(shí)別和根據(jù)3D形狀識(shí)別兩大類。”
目前,非限制條件下人臉識(shí)別研究就是博思廷王巍提到的基于3D模型和2D模型人臉識(shí)別方法。其中,后者是研究的熱點(diǎn)?;?D模型的人臉識(shí)別方法,對(duì)克服環(huán)境因素中姿態(tài)和光照影響非常有效。但3D模型法計(jì)算復(fù)雜,擬合時(shí)間較長,不易達(dá)到實(shí)時(shí)性要求。2D模型法主要將人臉圖像中具有判別性的相對(duì)不變的特征表達(dá)出來。盡管人類能夠清晰地識(shí)別出復(fù)雜背景中的人臉,人類也研發(fā)出了很多基于2D模型、3D模型的獨(dú)特算法,但是計(jì)算機(jī)自動(dòng)地執(zhí)行算法至人臉的準(zhǔn)確識(shí)別,卻是難度極大的問題。目前再好的人臉識(shí)別系統(tǒng)也只能在用戶比較配合下、采集環(huán)境條件理想的情況下才能夠基本滿足一般的應(yīng)用需求。而在用戶不配合情況下的自動(dòng)人臉識(shí)別,最大的困難主要表現(xiàn)在以下幾點(diǎn):
1、人臉特征的不穩(wěn)定性
人臉是一個(gè)具有極強(qiáng)可塑性的三維柔性皮膚表面,它會(huì)伴隨著人的年齡、表情、化妝、意外傷害,甚至整容等因素的變化而改變,有些易容、整容手段犀利的人在改變?nèi)菝埠?,即便是站在生物鏈最高端的人類本身都難以用肉眼進(jìn)行分辨。
2、可靠性、安全性較低
雖然不同個(gè)體的人臉各有差別,但是人的面孔大體上還是相似的,并且在全球人類總數(shù)高達(dá)77億的地球上,以致于眾多面孔之間的差別綜合起來還是非常微小的,人群中總是能夠找到幾個(gè)相似的,所以技術(shù)上實(shí)現(xiàn)完全安全可靠的認(rèn)證是相當(dāng)有難度的。
3、外界條件影響
系統(tǒng)從傳感器攝取人臉的過程中會(huì)遭受不同光照條件、角度、幾何變化、遮擋等因素影響,同一個(gè)人臉在不同的環(huán)境以及采集條件下,獲取到的人臉數(shù)據(jù)往往會(huì)差異非常大,這些不確定的外界因素對(duì)于人臉識(shí)別算法的穩(wěn)定性、識(shí)別準(zhǔn)確性都是非常大的挑戰(zhàn)。
4、視覺識(shí)別模型的缺乏
到目前為止,神經(jīng)生理學(xué)、心理學(xué)等相關(guān)研究領(lǐng)域?qū)τ谌祟惖囊曈X模型和識(shí)別機(jī)制還處于缺乏狀態(tài),在已有的知識(shí)上建立起較好的模型還是困難重重。
5、硬件設(shè)備需求高
工欲善其事必先利其器,要克制外界條件影響,或許基于3D模型的方式可解決,不過對(duì)硬件的需求也相應(yīng)變大。
在此,佛山華運(yùn)科技技術(shù)有限公司總經(jīng)理毛巨勇(以下簡稱華運(yùn)科技毛巨勇)作如下的表示:“技術(shù)未來依舊會(huì)不斷進(jìn)步的,所以將來識(shí)別必然會(huì)更準(zhǔn)確、更精準(zhǔn)。但是目前最大的阻礙還是技術(shù)不夠完善,好比在陽光照射或者照度較低的情況下,人臉識(shí)別的識(shí)別率就有所下降。所以基于目前的人臉識(shí)別技術(shù)還是在硬件上的改進(jìn),更好的CPU、平臺(tái)、鏡頭、紅外、濾光片等才得以應(yīng)對(duì)目前人臉識(shí)別的各種困境”。
穩(wěn)中求勝之舉
迄今為止,計(jì)算機(jī)從一個(gè)“盲人”,需要被動(dòng)式的接受由鍵盤、文件輸入、代碼信息到現(xiàn)在能夠自助處理和判斷信息的人工智能,經(jīng)歷的時(shí)間可謂是非常漫長,其中攻克不少難以解釋的課題,從而使得計(jì)算機(jī)能夠自動(dòng)對(duì)人臉進(jìn)行視覺處理、人臉分析識(shí)別。早期人臉識(shí)別算法是在得到一個(gè)“正面人臉”的前提下進(jìn)行的,但是隨著應(yīng)用范圍的不斷擴(kuò)展和開發(fā),這種“正面人臉”已經(jīng)無法滿足現(xiàn)今的需求。雖然目前技術(shù)已經(jīng)攻克必須“正面人臉”,但是實(shí)際應(yīng)用上“正面人臉”并不是最終問題,從上述總結(jié)的五點(diǎn)就可以了解到現(xiàn)今的難處。面對(duì)如此復(fù)雜的具有挑戰(zhàn)性的問題,綜合起來最終可分為兩大難點(diǎn):
由人臉內(nèi)在的變化引起的,如人臉表情、年齡等引起的變化、器官缺失等;
由外在條件變化引起的,如面部被部分遮擋、傳感器、采集角度、光照影響、成像設(shè)備等。其實(shí)還有不能忽略的“偽人臉”,目前3D打印技術(shù)、人臉套膜等手段的出現(xiàn),意圖不軌者要破解人臉識(shí)別系統(tǒng)也變得并不難。
此前,華運(yùn)科技毛巨勇為筆者講道:“人臉識(shí)別分識(shí)別和驗(yàn)證兩類。首先是驗(yàn)證,驗(yàn)證時(shí)獲取的圖片跟系統(tǒng)圖片進(jìn)行對(duì)比,檢驗(yàn)是否為合法身份,是需要用戶主動(dòng)一對(duì)一進(jìn)行身份確認(rèn)的。而識(shí)別最為典型的例子就是警察詢證,通過前端攝像機(jī)獲取人臉圖像,再與圖片數(shù)據(jù)庫中的黑名單進(jìn)行比對(duì),如果獲取的人臉圖像與黑名單圖像近似,就會(huì)進(jìn)行盤查確認(rèn),這種方式只需要前端采集即可,無需用戶主動(dòng)配合。” 所以面對(duì)困難重重之下從識(shí)別到驗(yàn)證的過程中提高最終的識(shí)別率與準(zhǔn)確率。必須穩(wěn)中求勝,從規(guī)范的識(shí)別環(huán)境、強(qiáng)大的算法以及多重核對(duì)方式去識(shí)別偽人臉的存在。
制定人臉識(shí)別適用環(huán)境
光照可以說是人臉識(shí)別最大的敵人,如果無法獲取人臉進(jìn)行識(shí)別,那就不用考慮后面的驗(yàn)證了,所以克制光照帶來的負(fù)面影響成為必須解決的問題。雖然在算法上可以通過圖像均衡化、對(duì)數(shù)變換的方式將獲取的圖片光照正規(guī)化最后達(dá)到理想的識(shí)別效果,或者通過3D模型分析不同光照對(duì)人臉識(shí)別的影響,試圖通過計(jì)算機(jī)視覺理論,給光照變化建立統(tǒng)一的模型,但其假設(shè)過多,計(jì)算太復(fù)雜。所以在實(shí)際項(xiàng)目工程,人臉識(shí)別還是需要規(guī)范使用場所,比如恒定的光照環(huán)境、補(bǔ)光均勻的照明設(shè)備等等,在未能滿足人臉識(shí)別使用的環(huán)境需求,強(qiáng)制安裝人臉識(shí)別設(shè)備也是無補(bǔ)于事,識(shí)別率、準(zhǔn)確率必然會(huì)大大低于廠商給予的理論值。
深度學(xué)習(xí)算法
識(shí)別與驗(yàn)證過程必須要有算法支持,而基于Gabor、LBP、SIFT、LDA、SVM分類器、貝葉斯模型等的各式各樣算法比比皆是,在未來算法也將會(huì)越來越完善,因此合適的算法是保證最終識(shí)別率、準(zhǔn)確率的根基。其中深度學(xué)習(xí)算法近年來興起較快,深度學(xué)習(xí)最大的特色是 “自動(dòng)學(xué)習(xí)”提取有利于識(shí)別分類的圖像信息,系統(tǒng)會(huì)不斷更新每次識(shí)別的數(shù)據(jù)以致于提高準(zhǔn)確度。北京智諾英特科技有限公司章九九為筆者介紹道:“深度學(xué)習(xí)是先識(shí)別人臉,后面是通過提供的計(jì)算模型進(jìn)行評(píng)價(jià)自動(dòng)提取人臉特征,并且會(huì)不斷自我更新數(shù)據(jù),數(shù)據(jù)量大,當(dāng)然人臉識(shí)別的準(zhǔn)確率也相應(yīng)提高,面對(duì)長時(shí)間跨度人臉的識(shí)別問題也得以解決。”
多重生物識(shí)別復(fù)核
曾有人跟筆者說過在2014年APEC會(huì)議就有犯罪分子混進(jìn)現(xiàn)場,不過在進(jìn)入安檢時(shí)先是被人臉識(shí)別偵察到是通緝犯,再則是通過提供的假身份證進(jìn)行比對(duì)確認(rèn),發(fā)現(xiàn)身份信息不符合才能以鎖定并捕獲他們。面對(duì)金融行業(yè)、出入境、重要會(huì)議安檢等領(lǐng)域,犯罪分子的手段可謂是層出不窮。博思廷王巍也說道:“在一對(duì)一的人臉驗(yàn)證用途中,可以將人臉識(shí)別技術(shù)與其他生物識(shí)別技術(shù)搭配使用,能夠顯著提高準(zhǔn)確率。例如只采用人臉識(shí)別的錯(cuò)誤接受率為千分之一,但搭配人臉識(shí)別與指紋識(shí)別則錯(cuò)誤接受率可以降低到千萬分之一。”因此,為了區(qū)分識(shí)別的人臉是否為“偽人臉”,最簡單粗暴的方式就是傳感器和算法兩方面技術(shù)的結(jié)合。
人臉識(shí)別與商用、大數(shù)據(jù)的圓舞曲
華運(yùn)科技毛巨勇曾說:“人臉識(shí)別應(yīng)用的領(lǐng)域會(huì)越來越廣,從傳統(tǒng)安防到司法公安,并以快速的節(jié)奏逐漸擴(kuò)展到商用領(lǐng)域。而且人臉識(shí)別將成為大數(shù)據(jù)挖掘的最有用工具,因?yàn)閳D像視頻可與人對(duì)應(yīng)匹配,這樣商家就能夠從大數(shù)據(jù)中挖掘到客戶的需求。”確實(shí)如此,除了傳統(tǒng)安防、企業(yè)管理、司法公安等外,連鎖商鋪運(yùn)用人臉識(shí)別也越來越多。比如大型的專賣店,他們會(huì)將人臉識(shí)別做成VIP顧客識(shí)別,尤其是VIP顧客到訪時(shí),服務(wù)員能夠快速察覺并以最高等級(jí)的服務(wù)要求去招待顧客,畢竟越大的品牌商店對(duì)于不同等級(jí)的顧客都有著各自的管理服務(wù)方式,以便于提升業(yè)務(wù)和更好的服務(wù)質(zhì)量。而大型超市、廣告服務(wù)公司還可以結(jié)合大數(shù)據(jù)以及高準(zhǔn)確率的人臉識(shí)別,來統(tǒng)計(jì)分析商業(yè)場客流(剔除服務(wù)人員及避免對(duì)同一顧客重復(fù)計(jì)數(shù))。
綜合而言,人臉識(shí)別技術(shù)發(fā)展至今可謂日益成熟,運(yùn)用的領(lǐng)域也越來越廣,算法更為靈活,即便是犯罪分子手段再多,人臉識(shí)別也可以結(jié)合其他生物識(shí)別技術(shù)進(jìn)行復(fù)核驗(yàn)證。由此可見,未來人臉識(shí)別將會(huì)以其顯著的技術(shù)優(yōu)勢成為一種極具潛力的生物識(shí)別方式。