什么是高清攝像機
直到10年前攝像機系統(tǒng)還只能產(chǎn)生大約320×240像素的影像——或者稱之為VGA標準。隨后,文件格式被更特別地引向采用諸如ITU-R PAL制式的352×288像素的視頻標準(這有賴于它們是否采用PAL或NTSC視頻標準),畫面大小就是眾所周知的1CIF。為節(jié)省存儲空間,通常就采用標準尺寸四分之一的影像(稱為QCIF)。如果將一個QCIF或1CIF的影像不管用什么方法放大,畫面將會充滿顆粒感,這是因為像素數(shù)并沒有隨畫面放大而增加。為解決這一局限性,許多制造商研發(fā)了能拍出更多像素的攝像機系統(tǒng)。
最初,分辨率增大至1CIF尺寸的4倍的分界點,即704×576像素/幀,稱之為4CIF,以及720×576像素/幀,稱為D1。如果要計算1CIF影像中的像素數(shù),結(jié)果大約是0.1百萬像素,一幅4CIF的畫像也僅有0.4百萬像素。
如今的百萬像素攝像機每幀都擁有更多的像素(名副其實地超過百萬)。事實上,在筆者寫此文時,300萬和500萬像素的攝像機已經(jīng)隨處可見了,而且數(shù)家制造商已發(fā)布了其高分辨率的攝像機系統(tǒng),分辨率越高,圖像越清晰,影像能被放大很多倍而細節(jié)依然清晰可辨。這就使得識別系統(tǒng)(比如人臉識別或車牌識別系統(tǒng))和其它需要獲取影像細節(jié)以便作視頻分析的系統(tǒng),甚至那些只依靠工作人員手動放大影像來獲得更多細節(jié)以作證據(jù)用的非智能系統(tǒng)都能顯著獲益。
有兩類芯片技術(shù)普遍流行于攝像機制造業(yè):CCD和CMOS。CCD芯片廣泛用于較低分辨率的攝像機。
制造商采用CCD芯片是因為它較之CMOS芯片感光更為敏感,在光線較暗的地方仍能獲得到較好的影像。相比CMOS芯片,CCD芯片還能提供更為“干凈”的圖像,它顯示的影像具有較少的細小的瑕疵——通常稱為“噪點”,而對于CMOS芯片顯示的噪點就相對較多。
而另一方面,CMOS芯片制造成本更低,耗能少,節(jié)省成本即能轉(zhuǎn)化成低價格。
現(xiàn)在,絕大多數(shù)較新的攝像機都采用CCD技術(shù),但無論如何,多數(shù)百萬像素攝像機制造商都采用CMOS技術(shù)以降低價格。傳統(tǒng)攝像機和大多數(shù)百萬像素攝像機所得到的圖像之間有品質(zhì)上的差異。因而,百萬像素圖片(如果它們是用CMOS攝像機拍的)可能會擁有更高的分辨率,但也潛在地會有更多的噪點,在低照明度環(huán)境下圖片會不夠清晰。
[nextpage]
高分辨率百萬像素攝像機的優(yōu)勢
就人眼而言,觀看百萬像素攝像機和低分辨率攝像機所獲得的影像在清晰度上的差異是非常明顯的。
其一就是數(shù)字放大影像,百萬像素攝像機能看到的細節(jié)部位,對低分辨率攝像機是不可能看到的;另一就是能夠使攝像機對準擁擠的大型露天運動場,如果有足夠的像素,比如選用百萬像素攝像機就可能看清每個人的面部細節(jié),而低分辨率攝像機是做不到的,除非安裝多臺。
因此,百萬像素攝像機制造商就著眼于提高成像質(zhì)量以及人們能從每幀照片中能獲取多少的細節(jié)信息。
考慮到城市監(jiān)控中要用到成千上萬個攝像機。如果有一宗在某個攝像機鏡頭前實施的罪行被記錄了下來,那就有可能對影像中某個關(guān)系人通過數(shù)碼放大來辨識他或她。這將極大地提高擁有此類監(jiān)控系統(tǒng)的價值,因為傳統(tǒng)的低分辨率攝像機攝制的圖像是很難辨識出任何人。
百萬像素攝像機的缺點
百萬像素圖像有個主要的缺點就是,因有太多的信息使得這些攝像系統(tǒng)的成像在存儲和傳送方面的花費更高。從存儲和傳送1CIF影像到存儲和傳送4CIF影像,成本要增大4倍,而百萬像素影像則可能更是高達10倍。
一個500萬像素攝像機較之一個1 CIF攝像機需要50倍于后者的存儲空間和傳輸帶寬。
存儲和帶寬的考量是很重要的,即便人工系統(tǒng)也是如此。對一個自動化監(jiān)控系統(tǒng)而言,還有第三個因素不可忽略。要執(zhí)行視頻分析,在計算能力上花費的成本與影像大小成正比。因此,如果一臺服務(wù)器支持25個能產(chǎn)生1CIF影像的攝像機,則它將只能處理一臺250萬像素的攝像機。
即使存儲、帶寬和計算成本在下降,但像這樣10到50倍的成本增長無疑會影響到項目的效益,用戶至少會衡量他們在獲益上是否值得。因而,對高分辨率圖像的信息價值和選用它的成本,用戶通常會在兩者之間尋得折衷方案。
很幸運,有些高性能的用于偵測的視頻分析系統(tǒng)能在1CIF甚至QCIF影像上完成任務(wù)而僅有極小的精度誤差。因此,用戶列出系統(tǒng)要求清單以詳細說明它們的需求就顯得非常重要。對一個智能系統(tǒng)而言,指明系統(tǒng)能較好工作所需要的最小影像分辨率的要求是必不可少的。
2009年3月22日,一名男子在悉尼機場被殺害,現(xiàn)場有多名旅客目擊了全過程。警方相信這是一起發(fā)生在敵對摩托車幫派之間的斗毆引起的血案,受害人被10名攻擊者毆打致死。機場內(nèi)到處都有攝像機,然而事后的調(diào)查報告指出,現(xiàn)場沒有一臺攝像機拍下了清晰得足夠辨認出攻擊者的照片,所有的圖像質(zhì)量都不足以用作證據(jù)。假如機場內(nèi)有合適的百萬像素攝像系統(tǒng),這將不會成為問題(事實上,警察和安全部門已接到旅客們的警示。機場內(nèi)數(shù)百套攝像系統(tǒng)毫無智能,盡管事發(fā)當時可能有多名受過訓練的安全人員盯著攝像畫面在監(jiān)看,但竟然沒有一人看到事發(fā)經(jīng)過)。就因為缺少一套智能軟件,警方不得不花上許多天的時間調(diào)出存儲的攝影資料,并一一地瀏覽以獲取有用的場景信息用于審訊。
[nextpage]
從百萬像素攝像機中提取價值和回報
正如大家所見,百萬像素攝像機可以在人或機動車輛識別中大有用武之地,因為它能為兩者的分辨提供大量的信息,它能使你看到兩者的特寫畫面。
然而,在對人員或車輛進行識別之前,用戶必須提出一個進行這兩類識別的任務(wù)需求,并且該需求通常由一套有效的偵測系統(tǒng)來提供。偵測系統(tǒng)的任務(wù)是捕獲所有不正常的行為,比如,假如有人闖入了禁區(qū),你希望能辨識他;或者,有人跌倒或遺棄了一個行李包或在涂鴉。同樣地,如果有車輛違章停車,逆向行駛,或停在不該停車的地方,都有必要識別它。
偵測需要廣角視野,能總攬場景中所有能被觀察到的個體或目標的行為。識別需要近景特寫同一個人或目標。因此,完成這兩項任務(wù)傳統(tǒng)習慣上會需要多個安裝在不同部位的低分辨率攝像機。
在過去,可控攝像機(PTZ攝像機)(見圖1)
常被用于試圖同時做這兩件事。因此,此類攝像機會看到全部場景。講一件曾發(fā)生過的事情:有人跳越圍墻進入一片受監(jiān)控的區(qū)域,PTZ攝像機立刻捕捉住他并放大用近景去識別闖入者。
起初的方式是由人工完成這一操作,一旦偵測到闖入,操作員會手動控制攝像機去放大聚焦在跳過圍墻的闖入者身上。但很快就發(fā)現(xiàn),手工操作很容易出差錯,很難將鏡頭聚焦在目標身上,即使是一個熟練的操作員也不易將攝像機鏡頭直接鎖定在目標人物上。
這等同于用來復槍準鏡瞄準目標,失之毫厘,謬以千里。這個目標鎖定操作是如此的困難,以至于當有宣稱能自動聚焦在目標上的產(chǎn)品出現(xiàn)時,市場自然就熱烈追捧。在這種系統(tǒng)中,當攝像機發(fā)現(xiàn)有入侵者時,它會立即控制PTZ攝像機鎖定入侵者的座標位置。
但這種方法也有一個非常大的局限性:它很容易被任何熟悉PTZ攝像機的人蒙騙。先送入一個誘餌,攝像機馬上聚焦在誘餌上,而真的入侵者會從另一端進入場景。下一步的進展是采用兩個攝像機,一個固定的攝像機用于偵測,當有入侵者出現(xiàn)時,獨立的PTZ攝像機就會聚焦在入侵者身上進行識別。而此時第一個攝像機繼續(xù)偵測,如果這時有第二個人闖入也被偵測到,但不幸這第二個入侵者將不會被識別,因為PTZ攝像機正忙于識別第一個入侵者。
PTZ攝像機通常通過編程用來追蹤場景中最大的目標。假如有只鳥偶然飛過PTZ攝像機鏡頭前,PTZ攝像機將會追蹤這只鳥(因為鳥比較靠近而顯得大)而忽視真正的入侵者。正因為PTZ攝像機有這些先天的缺陷,嚴謹?shù)囊曨l分析系統(tǒng)用戶在作此類偵測和變焦應(yīng)用時拒絕使用PTZ攝像機。
[nextpage]
如今在許多領(lǐng)域行之有效的解決方案已引入一種完全不同的技術(shù)——即采用百萬像素攝像機。隨著百萬像素攝像機越來越廣泛應(yīng)用,比如說采用500萬像素來記錄的影像,可以同時既被用作偵測又用于目標識別,即對同一個攝像視野進行多任務(wù)偵測和識別。然而,如前所探討的,百萬像素攝像機有其固有的缺點:使用成本出奇的昂貴,因為需要強大的計算能力來處理這些圖像,以及海量存儲和高帶寬傳輸。
直到2008年(甚至現(xiàn)在,對所有其它研發(fā)視頻分析的公司而言),偵測和識別技術(shù)采用了完全不同的算法,該算法針對不同類型的圖像,獨立工作又彼此區(qū)別。事實上,既能做偵測又能做識別的公司是非常罕見的。
目前已經(jīng)有個別公司的創(chuàng)新技術(shù)引導了偵測和識別兩大技術(shù)的結(jié)合,一套已在成功運作中的基于這種技術(shù)的產(chǎn)品,已于2008年中導入市場。這項革新技術(shù)就包含了使用百萬像素攝像機(見圖2)
圖2 偵測和識別兩大技術(shù)結(jié)合的百萬像素攝像機的智能識別圖
它優(yōu)化了在不同分辨率圖像上執(zhí)行偵測和識別以獲取如下幾個重要性能:
·不會像PTZ攝像機那樣易受誘餌的迷惑;
·不像基于標準百萬像素攝像機的系統(tǒng)那樣需要較高的計算能力、存儲和網(wǎng)絡(luò)資源(當采用500萬像素攝像機時,該系統(tǒng)較之使用傳統(tǒng)方式處理圖片的同等系統(tǒng)對計算資源的要求要少200倍);
·能在同一攝像機上對同一場景同時進行偵測(所有類型和全部智能級別)和識別(車牌識別和人臉識別)。
最后,偵測和識別最終能以商業(yè)應(yīng)用方式在同一攝像機上實現(xiàn)。這種技術(shù)不會被一些了解此類系統(tǒng)如何工作的人所蒙騙,并且作為一項開放式的技術(shù),它可以被應(yīng)用于任何的百萬像素攝像機系統(tǒng)中。
該技術(shù)也推動了百萬像素攝像機經(jīng)濟化,采用該技術(shù),使得百萬像素攝像機的應(yīng)用最終達到了一個新的階段:在不致于大幅增加計算、存儲和傳輸成本的同時,其內(nèi)在的潛能被充分地發(fā)掘出來。