在現(xiàn)實生活中,我們經(jīng)??梢钥吹狡胀ㄊ謾C拍攝的圖像質(zhì)量會優(yōu)于多數(shù)公共部門的視頻監(jiān)控系統(tǒng),這是為什么呢?本文從提出問題,到提供解決方案,論述了視頻監(jiān)控攝像系統(tǒng)的清晰度問題,供讀者參考。
目前普遍從CCTV模擬視頻系統(tǒng)中截取并放大用于識辨恐怖分子的圖像非常不清晰,質(zhì)量遠遠不如只有基本配置的、最簡單的數(shù)碼攝像機所提供的圖像。在2006年德國舉辦世界杯足球賽期間,幾乎所有球場都還在使用這些已經(jīng)過時的模擬視頻監(jiān)控攝像機來提供安保。只有凱徹斯勞滕賽場采用了目前為止最先進的、高分辨率的數(shù)字視頻監(jiān)控系統(tǒng)。
只要把這兩種系統(tǒng)提供的圖像作一個簡單比較,就能發(fā)現(xiàn)圖像清晰度的差異有多大:即使一個最簡單的數(shù)碼照相機所存儲的圖像也能達到大約300萬像素,而“傳統(tǒng)”的視頻技術(shù)所提供的像素只是它的1/30,即101000像素或0.1百萬像素。如今有哪位即使是最新手的業(yè)余攝影愛好者還會購買如此低分辨率的模擬攝像機?盡管如此,這種系統(tǒng)直到現(xiàn)在仍然在95%的公共安防系統(tǒng)中被普遍使用。
癥結(jié)所在
這些用于公共安防的圖像質(zhì)量之所以低劣,原因并不如人們所想像的那樣,是因為受到當(dāng)今技術(shù)水平的限制,而是因為人們?nèi)藶榈剡x用50年前的電視技術(shù)標(biāo)準來部署系統(tǒng)。這種系統(tǒng)所提供的實時圖像最高不會超過40萬像素。再由于技術(shù)和成本的制約,這些系統(tǒng)的圖像在存儲時像素被進一步降低到1/4,即只有10萬像素。這樣一來,把圖像局部放大用以識別罪犯面部特征就幾乎不可能了。
不管是哪個廠家生產(chǎn)的,模擬視頻攝像機能提供的最高分辨率是40萬像素。既然如此,為什么我們不以40萬像素的分辨率保存原始圖像,而只有10萬像素呢?雖然也有一些錄像機可以按40萬像素的分辨率保存圖像,但這些設(shè)備成本太高,且清晰度也不足以用于人臉識別。這也歸結(jié)于早已過時的電視技術(shù)標(biāo)準——視頻流以“半幀”傳輸。恰如其名,清晰度也只有一半。由這樣隔行掃描生成的兩個半幀組合起來的圖像必然會導(dǎo)致快速移動物體的圖像產(chǎn)生邊緣模糊,也即梳狀失真,而移動物體恰恰是安防監(jiān)控所要重點關(guān)注的對象。
CIF格式圖像的10萬像素是怎樣計算而來的?模擬視頻攝像機提供的圖像有576線,即縱向有576行。它由兩個半幀組成。每個半幀為288線,隔行顯示。這兩個半幀被相繼攝錄后逐幀傳輸。由于技術(shù)和成本的限制,目前95%的系統(tǒng)只對一個半幀進行數(shù)字化處理并存儲。為了使寬高比適中,288線中的每一行被分成352個水平像素。這樣就生成了一個具有352×288=101000像素(相當(dāng)于10萬像素)的CIF格式圖像。
[nextpage]
問題頻出
那么使用2CIF或4CIF格式是否能使圖像更清晰呢?答案是:2CIF或4CIF格式雖然成倍地增加了像素,但并不能有效地提高圖像的清晰度。2CIF格式的圖像縱向也只有288線,但每行的水平像素卻翻了一倍,即704個水平像素。因此,圖像像素大約為20萬像素。雖然每一行的像素增加了,但由于整幅圖像中每隔一行即被忽視,因此,仍然丟失了大量重要信息。所以,我們看到的圖像恰如其名只是半幀或半圖。
4CIF格式的圖像由兩個時間上連續(xù)的隔行掃描半圖像拼合而成,這種格式的實際像素達到704×576=40萬,但由于兩個半幀是在不同瞬間生成的,所以行與行之間會發(fā)生錯位(如圖1所示)。這樣會導(dǎo)致所謂的梳狀失真,這就是4CIF格式很難在實際系統(tǒng)中得到應(yīng)用的原因。即使在德國世界杯足球賽這樣的重要場合,也只存儲CIF或2CIF半幀圖像。
現(xiàn)有的視頻技術(shù)還存在一個問題,那就是回放或存儲圖像時刷新率(幀頻)很低。同樣由于技術(shù)和成本的原因,95%的現(xiàn)有系統(tǒng)不會超過每秒1到3幀的幀頻范圍。由于“快照”的刷新率太低,所以罪犯面對攝像機的瞬間很難碰巧有圖像被拍攝下來,即很難找到可用于面部識別的圖像。
幀頻之所以這樣低,是因為一個視頻存儲設(shè)備(通常是一臺帶視頻管理軟件的計算機)要負責(zé)對多臺攝像機攝錄的視頻進行數(shù)字化和存儲。一臺計算機的計算能力一般只夠兩臺模擬攝像機之用,因此當(dāng)需要存儲的攝像機超過兩臺時,幀頻就必須相應(yīng)降低。由于計算機有限的處理能力,所以MPEG-4視頻格式也不適于攝錄高分辨率視頻——計算機的處理能力是絕對無法應(yīng)對多臺攝像機的。
為何不使用分辨率更高的攝像機?為什么傳統(tǒng)攝像機生產(chǎn)商不在他們的攝像機中使用分辨率更高的圖像傳感器?答案很簡單,但不令人愉快:這些系統(tǒng)所依托的技術(shù)標(biāo)準已經(jīng)有五十年的歷史了,讓傳統(tǒng)的視頻傳輸線纜處理高分辨率的圖像,從技術(shù)角度講是根本不可能的。這個過時的標(biāo)準最后導(dǎo)致整個視頻行業(yè)技術(shù)上停止不前,經(jīng)濟上蒙受損失??紤]到公眾利益,技術(shù)革新勢在必行。
數(shù)字產(chǎn)品帶來契機
新興的數(shù)字技術(shù)為年輕創(chuàng)新型企業(yè)帶來了契機。他們開發(fā)了功能極高的微型計算機和相應(yīng)軟件,并將它們嵌入攝像機內(nèi)。通過在高分辨率攝像機中集成多種智能,諸如視頻處理﹑動態(tài)偵測和視頻數(shù)據(jù)的存儲管理等任務(wù)都可以由這個微型計算機系統(tǒng)獨立完成。視頻控制中心的計算機可得到大幅減荷。
圖2便是一個令人信服的證據(jù),它比較了某攝像機所存儲的960線、130萬像素和一個288線、10萬像素圖像的用于辨認車牌的局部放大圖像的效果。
現(xiàn)代網(wǎng)絡(luò)攝像機技術(shù)的一大優(yōu)勢是,用戶可以隨時隨地通過網(wǎng)絡(luò)遠程管理所有攝像機的設(shè)置,并在攝像機攝錄存儲圖像的同時,遠程調(diào)取實時圖像和存儲在攝像機內(nèi)部的歷史圖像。當(dāng)然這些攝像機應(yīng)連接在已有的公司局域網(wǎng)上,或通過防火墻安全連接于因特網(wǎng)中。這樣,如果在火車站、機場等公共場所發(fā)生意外或有可疑情況,就可以立即通過網(wǎng)絡(luò)將圖像調(diào)取到控制中心來進行分析,而不必派遣人員到現(xiàn)場,也不必中止存儲記錄和實時監(jiān)控。如果有新開發(fā)的或升級版的軟件,可以通過網(wǎng)絡(luò)方便地加載到攝像機中。
近年來,高分辨率智能網(wǎng)絡(luò)攝像機得到越來越廣泛的應(yīng)用。人們不僅能在美國的大使館、英國的機場、日本的水庫大壩或以色列的郵政大樓中看到這種攝像機,也可在沙特阿拉伯的輸油管道和麥加的停車場旁找到它們的身影。
2004年,Bosch公司為德國的第一家監(jiān)獄(JVA)安裝了多臺此類攝像機。2006年在德國凱徹斯勞滕足球場安裝了77臺該廠家提供的攝像機。德國鐵路公司已在許多火車站和鐵路路段使用了該類產(chǎn)品。其應(yīng)用極為廣泛,有用于保障旅客安全的,有用于準確播報火車進出站時刻的,等等。
經(jīng)過對系統(tǒng)總體成本的核算,可以發(fā)現(xiàn),新興的攝像機技術(shù)實際上比目前的標(biāo)準視頻技術(shù)更節(jié)省成本。通過使用960線(而不是傳統(tǒng)的288線),該類攝像機中存儲的圖像清晰度要比一般系統(tǒng)的圖像高12倍,這意味著,對于同樣的監(jiān)視面積,所需的攝像機用量更少。例如,一臺這種攝像機可以監(jiān)視體育場館的多個轉(zhuǎn)動式檢票口。通過使用標(biāo)準的90度廣角鏡頭,僅用一臺攝像機就能完成對整個房間的監(jiān)控,而且清晰度比一般的系統(tǒng)更高。
[nextpage]
隨著IT標(biāo)準在全世界范圍內(nèi)的實施,價廉物美的標(biāo)準連接元件可方便地用于攝像機連接:銅線、光纖或WLAN無線連接。由于該類攝像機不需加熱保溫防霧,所以可終年通過網(wǎng)線供電,而不需專門敷設(shè)電源。這就是為什么在凱徹斯勞滕的世界杯足球場安裝的77臺攝像機僅靠500W的中心穩(wěn)壓電源就能正常運轉(zhuǎn)的原因。該類攝像機廠商開發(fā)的新型存儲技術(shù)只需極少的存儲計算機就能實現(xiàn)高清流暢視頻流的存儲。攝像機中的內(nèi)部緩存可橋接數(shù)分鐘的網(wǎng)絡(luò)故障,避免信息遺失。系統(tǒng)能根據(jù)移動偵測的結(jié)果自動調(diào)整幀頻,這更進一步節(jié)省了存儲空間。由于該類攝像機避免使用機械活動部件和自動光圈鏡頭,整個系統(tǒng)的維護需求低,性能可靠。
將288線的CIF圖像和960線的該類攝像機圖像做個比較,兩者在質(zhì)量和清晰度上的差別便一目了然(如圖3所示)。百萬像素圖像的清晰度要比CIF圖像高12倍,因此,僅占圖像面積1/40的面部仍能清晰可辨。如果再進行適當(dāng)處理,圖像質(zhì)量還可以進一步提高。與之形成鮮明對比的是,從CIF圖像中提取的圖像不可辨識,因此沒有使用價值。
與該類攝像機不同,市面上大多數(shù)所謂的數(shù)字IP攝像機(網(wǎng)絡(luò)攝像機)在原理上使用的仍是陳舊的模擬技術(shù),它只是通過計算機網(wǎng)絡(luò)傳輸經(jīng)數(shù)字化處理后的圖像。它們的構(gòu)造是,以模擬攝像部件采集圖像模擬信號,再把模擬信號數(shù)字化。分辨率還是與以前沒有兩樣。這真是難以置信,但事實上,大多數(shù)的IP系統(tǒng)還是處于這種只存儲CIF、半幀的狀態(tài)。
新型攝像機采用的分布型存儲技術(shù),使一臺計算機就能同時記錄約40路流暢的高分辨率視頻流,這相當(dāng)于舊技術(shù)中的4800幀/秒CIF圖像??墒浅S玫募写鎯π鸵曨l系統(tǒng)中,由于計算機的計算速度和處理能力有限,攝像機的許多高分辨率圖像無法得以完整存儲,其整體幀頻往往不會超過100-200幀/秒的CIF圖像。
[nextpage]
該類攝像機可采用價廉物美的標(biāo)準IT存儲設(shè)備來存儲視頻。一個容量為1.4TB的安全防故障磁盤陣列存儲器(RAID),其存儲空間足夠讓一臺晝夜不間斷運行的攝像機以全幀頻記錄百萬像素高清視頻附音頻長達兩個月,或者讓10臺攝像機連續(xù)記錄六天。如果再由事件驅(qū)動自動調(diào)整記錄幀頻,那么攝錄時間還可成倍增加。
雖然MPEG-4視頻壓縮編解碼目前被廣泛應(yīng)用,但它需要消耗計算機大量的運算能力,從而妨礙了高分辨率攝像機的應(yīng)用和普及。視頻標(biāo)準MPEG-4只適用于單一視頻流(例如電影)的壓縮和回放,而不適于同時實時顯示多臺攝像機的高分辨率視頻流。用MPEG-4編解碼存儲的移動對象圖像分辨率和質(zhì)量都較低,只是由于人眼不能捕捉移動對象的所有細節(jié),因此在看電影的時候我們感覺不到。正是出于這種原因,MPEG-4不適用于安防監(jiān)控領(lǐng)域,因為恰恰是移動對象在安防領(lǐng)域尤為重要,必須保證它們足夠清晰,能夠辨認。
為滿足安防監(jiān)控領(lǐng)域的需要,該類攝像機廠商開發(fā)了視頻編解碼MxPEG,它只需要大約2Mbit/s的數(shù)據(jù)傳輸速率就可顯示和存儲流暢的高分辨率視頻流,反應(yīng)時間也比MPEG-4短得多。MxPEG標(biāo)準正被越來越多的世界各地攝像機生產(chǎn)商和軟件開發(fā)商采用和支持。整套編解碼不需要購買許可證,人人可以免費使用。