智能視頻分析市場(chǎng)回顧
智能視頻分析技術(shù)經(jīng)過(guò)近十年發(fā)展,從最初的市場(chǎng)涌動(dòng),到現(xiàn)在的,市場(chǎng)上一直缺少理性的分析。投機(jī)者不停的轉(zhuǎn)換角色,炒作概念,從智能視頻到物聯(lián)網(wǎng)到智慧城市。但是對(duì)于大量的直接用戶和工程商來(lái)講,實(shí)用的設(shè)備、可用的工具,是項(xiàng)目成功的基本底線。過(guò)去幾年的現(xiàn)實(shí)是,大量的智能視頻項(xiàng)目開(kāi)展時(shí)轟轟烈烈,收尾時(shí)垂頭喪氣。
在宣傳資料上的性能和實(shí)際性能相差太多,大量廠家的智能視頻分析產(chǎn)品還停留在實(shí)驗(yàn)室階段,售前對(duì)于用戶的期望值理解錯(cuò)誤,很多廠家的演示視頻是精心挑選的片段,甚至有的公司直接復(fù)制其他公司的宣傳視頻,更為惡劣者甚至人工制作“精彩”的視頻。
在整個(gè)事件中,有些確實(shí)屬于用戶的想象力太過(guò)于豐富,有些則屬于廠家產(chǎn)品性能太差,無(wú)論如何,這幾年智能視頻應(yīng)用下來(lái)的結(jié)論是:智能視頻技術(shù)還不成熟。果真是這樣嗎?
同時(shí),隨著高清技術(shù)逐步成為市場(chǎng)主流,大量的智能視頻分析還停留在CIF/D1的水平,落后于主流的監(jiān)控技術(shù),也是人們對(duì)于智能視頻分析一個(gè)認(rèn)知。從大量的CIF格式智能視頻分析技術(shù),能直接一步跨越到高清市場(chǎng)嗎?
智能視頻分析技術(shù)應(yīng)用由來(lái)已久,最初應(yīng)用主要集中在醫(yī)療、機(jī)器人、影視制作、工業(yè)檢測(cè)、交通檢測(cè)等領(lǐng)域,但其真正踏入安防應(yīng)用,應(yīng)該起源于美國(guó)國(guó)防部的VSAM大學(xué)研究項(xiàng)目以及一些國(guó)際大公司的圖像實(shí)驗(yàn)室,其代表有:
CMU卡耐基梅隆機(jī)器人研究所體系(VSAM項(xiàng)目負(fù)責(zé)總成和地面靜止平臺(tái)):
· 美國(guó)Object Video公司(專(zhuān)利戰(zhàn)策略);
· 美國(guó)VIdeoIQ公司(被GE收購(gòu)后又于2008年分拆);
· 美國(guó)Guardian solution/Jtech (出售給一防務(wù)公司)。
· Sarnoff研究所體系(VSAM項(xiàng)目負(fù)責(zé)空中運(yùn)動(dòng)平臺(tái)):
· 美國(guó)Cernium(前Sarnoff高管創(chuàng)建);
· Pyramid Vision(Sarnoff研究所子公司);
· L3(購(gòu)買(mǎi)Sarnoff技術(shù));
· Sightlogix(前Sarnoff高管創(chuàng)建)。
大企業(yè)研發(fā)中心:
· 美國(guó)ActiveEye(從飛利浦電子分拆,后被霍尼韋爾收購(gòu));
· 美國(guó)Vidient(于2010年關(guān)閉)。
以色列體系:
· Ioimage公司,現(xiàn)出售給DVtel;
· NICE(面向交鑰匙項(xiàng)目)。
從以上各大主流智能視頻分析廠商可以看出,智能視頻技術(shù)經(jīng)過(guò)近十年的發(fā)展,技術(shù)應(yīng)用領(lǐng)域已經(jīng)基本定型,但是整體走勢(shì)并不樂(lè)觀。筆者總結(jié)主要原因,還是智能視頻分析技術(shù)在近十年來(lái)沒(méi)有較大的技術(shù)突破,復(fù)雜的配置、繁瑣的調(diào)試、基于CIF格式的分析導(dǎo)致的識(shí)別距離過(guò)短等等,不一而足,是智能視頻分析技術(shù)遠(yuǎn)遠(yuǎn)落后于監(jiān)控?cái)z像機(jī)技術(shù)發(fā)展的主要原因。
雖然當(dāng)前一些智能視頻分析技術(shù)已經(jīng)能夠做到過(guò)濾大部分的誤報(bào)源,如云、陰影、樹(shù)枝晃動(dòng)等,但離真正的自適應(yīng)智能視頻分析還有很大的差距,只有真正的自適應(yīng)智能視頻分析成為主流,智能視頻監(jiān)控時(shí)代才會(huì)真正到來(lái),工程商、用戶才能真正享受智能視頻分析帶來(lái)的價(jià)值,降低安裝、運(yùn)維成本。在高清時(shí)代,自適應(yīng)智能視頻分析主要體現(xiàn)在以下兩點(diǎn)。
· 高清智能視頻分析:實(shí)時(shí)分析高清視頻畫(huà)面,其分析比傳統(tǒng)D1分析畫(huà)面識(shí)別距離的2倍,識(shí)別區(qū)域是傳統(tǒng)D1分析畫(huà)面的6倍,同時(shí)因?yàn)榭捎孟袼馗哌_(dá)2百萬(wàn)像素,系統(tǒng)的識(shí)別率也大大改進(jìn);
· 全自動(dòng)自動(dòng)標(biāo)定:通過(guò)先進(jìn)的神經(jīng)元網(wǎng)絡(luò)算法,對(duì)現(xiàn)實(shí)世界中大量的人、車(chē)、船樣本庫(kù)(高達(dá)20多萬(wàn)個(gè)不同觀察角度/側(cè)面的目標(biāo)樣本)進(jìn)行學(xué)習(xí),自適應(yīng)智能視頻分析算法能夠自動(dòng)標(biāo)定3D鏡頭景深,完全省卻傳統(tǒng)智能視頻分析中的人工標(biāo)定環(huán)節(jié),避免最耗時(shí)、最影響識(shí)別性能的環(huán)節(jié)。
同時(shí),配合全分布式錄像存儲(chǔ)架構(gòu),智能視頻分析就能夠真正擔(dān)當(dāng)起智能報(bào)警管理的工作。視頻碼流、幀速率、分辨率可隨著情勢(shì)變化動(dòng)態(tài)調(diào)整,板載高質(zhì)量錄像,回傳低碼流,可快速、方便的構(gòu)建有加有效的監(jiān)控系統(tǒng)。更重要的是,分布式錄像存儲(chǔ)架構(gòu)+智能視頻的組合能夠真正幫助工程商和業(yè)主獲得最佳的工程實(shí)踐和投資回報(bào):完全消除了網(wǎng)絡(luò)帶寬瓶頸、服務(wù)器處理能力瓶頸、錄像存儲(chǔ)瓶頸的同時(shí),獲得最佳的情勢(shì)感知能力。
高清智能視頻分析
HD高清技術(shù)的市場(chǎng)需求遠(yuǎn)遠(yuǎn)超過(guò)人們的預(yù)期,是當(dāng)今安防市場(chǎng)最熱的技術(shù)。相對(duì)于傳統(tǒng)的D1畫(huà)面,HD高清攝像機(jī)能夠給用戶帶來(lái)6倍的像素細(xì)節(jié),用戶可以安裝更少的點(diǎn)位,其成本優(yōu)勢(shì)和技術(shù)優(yōu)勢(shì)是毋庸置疑的。[nextpage]
高清智能視頻分析的必要性
隨著項(xiàng)目中直接一步到位采用高清監(jiān)控的趨勢(shì)越來(lái)越明顯,而智能視頻分析卻一直停留在D1標(biāo)清級(jí)別,甚至大量的廠家算法還處于CIF畫(huà)面級(jí)別,當(dāng)然就更不要提HD高清畫(huà)面級(jí)別的視頻分析能力。這已經(jīng)遠(yuǎn)遠(yuǎn)落后于攝像機(jī)技術(shù)的發(fā)展,嚴(yán)重的制約了整體監(jiān)控系統(tǒng)的應(yīng)用潛力。所以,本文在伊始提到的自適應(yīng)智能視頻分析算法的實(shí)現(xiàn)就成為了解決該問(wèn)題的關(guān)鍵。采用自適應(yīng)智能視頻分析算法,在HD高清畫(huà)面級(jí)別實(shí)現(xiàn)智能視頻分析,將為用戶的高清體驗(yàn)帶來(lái)質(zhì)的飛躍。不僅是識(shí)別距離、識(shí)別范圍的大大擴(kuò)展;更重要的是,更加詳盡的目標(biāo)細(xì)節(jié)和像素能夠幫助用戶更加快速、有效的判斷現(xiàn)場(chǎng)情勢(shì),做出正確的判斷、采取正確的事件響應(yīng)流程。
傳統(tǒng)算法無(wú)法有效分析高清畫(huà)面
DSP/CPU的處理能力、網(wǎng)絡(luò)帶寬一直是傳統(tǒng)智能視頻分析算法的2個(gè)不可逾越的障礙。為了分析D1標(biāo)清像素,需要強(qiáng)大的DSP/CPU處理能力,而視頻編碼處理也需要很大的DSP/CPU計(jì)算資源,傳統(tǒng)智能視頻分析要想做到D1標(biāo)清畫(huà)面級(jí)別分析,一般需要2個(gè)獨(dú)立的DSP分別完成視頻分析和視頻編碼工作,多DSP編程增加了實(shí)現(xiàn)難度和成本。有些采用后臺(tái)CPU的智能視頻分析算法,則需要良好的圖像質(zhì)量,而圖像質(zhì)量和帶寬成正比,高帶寬又對(duì)計(jì)算機(jī)的解碼和視頻分析構(gòu)成壓力,所以會(huì)形成惡性循環(huán),從而導(dǎo)致采用后端CPU分析架構(gòu)的性價(jià)比急劇下降。
· 處理器局限性:按照當(dāng)前的智能視頻分析算法,在處理D1標(biāo)清時(shí),就需要1路單獨(dú)的DSP(720Mhz),如果畫(huà)面升為HD高清,像素?cái)?shù)增加5倍,一個(gè)嵌入式設(shè)計(jì)的智能視頻分析攝像機(jī)或編碼器需要6個(gè)類(lèi)似的DSP才能保證全高清畫(huà)面分析。6路DSP進(jìn)行并行運(yùn)算不僅帶來(lái)編程難度和成本劣勢(shì),同時(shí)電源消耗也遠(yuǎn)遠(yuǎn)超過(guò)了PoE以太網(wǎng)供電的能力,這基本上否定了該系統(tǒng)設(shè)計(jì)。采用后臺(tái)CPU實(shí)現(xiàn)智能視頻分析,貌似解決了CPU編程問(wèn)題和電源問(wèn)題,但是后臺(tái)分析又帶來(lái)了新的挑戰(zhàn),如網(wǎng)絡(luò)帶寬壓力;
· 網(wǎng)絡(luò)帶寬局限性:為了利用HD高清畫(huà)面來(lái)實(shí)現(xiàn)有效視頻分析,必須獲得高畫(huà)質(zhì)的高清畫(huà)面,這將推動(dòng)視頻碼流直接跳到6Mbps以上,并且必須保證網(wǎng)絡(luò)的可靠性,這將大大推高網(wǎng)絡(luò)建設(shè)成本。同時(shí),高碼流解碼+HD智能視頻分析將使得1個(gè)CPU只能分析1到2路,整體性價(jià)比相對(duì)非常低。
自適應(yīng)智能視頻分析算法優(yōu)勢(shì)
自適應(yīng)智能視頻分析算法和傳統(tǒng)分析算法采用同樣的DSP處理器、同樣的攝像機(jī)成像器件,但是采用了低運(yùn)算消耗的創(chuàng)新算法來(lái)實(shí)現(xiàn)同樣的功能和性能,包括能夠在HD高清畫(huà)面級(jí)別實(shí)現(xiàn)視頻分析。
· 先進(jìn)的模式識(shí)別:傳統(tǒng)算法是對(duì)每個(gè)像素進(jìn)行圖像分割,從而導(dǎo)致計(jì)算量居高不止。自適應(yīng)智能視頻分析算法采用先進(jìn)的目標(biāo)建模模型,通過(guò)神經(jīng)元算法對(duì)20多萬(wàn)種不同角度、不同形式的目標(biāo)(人、車(chē)、船)進(jìn)行學(xué)習(xí),從而獲得比傳統(tǒng)算法的像素分割模型高得多的識(shí)別率,還大大降低了DSP的計(jì)算資源;
· 反饋學(xué)習(xí):傳統(tǒng)算法中DSP消耗大戶除了以上提到的圖像分割,再有就是前后景分離。自適應(yīng)智能視頻分析算法放棄了傳統(tǒng)算法中的概率前后景分離過(guò)程,而是采用一種新型的基于反饋學(xué)習(xí)的新方法,不僅實(shí)現(xiàn)效果遠(yuǎn)勝傳統(tǒng)方法,而DSP資源消耗只是傳統(tǒng)模式的1/3;
· 100%自動(dòng)標(biāo)定:減少了人工標(biāo)定的步驟,極大的降低了安裝和維護(hù)成本算法改進(jìn)的結(jié)果是,一種采用標(biāo)準(zhǔn)DSP架構(gòu)的嵌入式智能高清攝像機(jī)。通過(guò)在攝像機(jī)前端實(shí)現(xiàn)智能視頻分析,獲得最佳的原始圖像,將最大可能的提高識(shí)別率、降低誤報(bào)率。同時(shí)不影響回傳圖像的碼流。通過(guò)這種新型的架構(gòu),用戶可以首次實(shí)現(xiàn)低成本的、高清級(jí)別的智能視頻分析,從而充分利用高清畫(huà)面帶來(lái)的監(jiān)控距離和覆蓋范圍的優(yōu)勢(shì)。
100%自動(dòng)標(biāo)定技術(shù)
在智能視頻分析市場(chǎng)上,標(biāo)定的定義是指手動(dòng)定義同一個(gè)人在視場(chǎng)中不同的距離/位置所占據(jù)的像素高度。如果主要目的是檢測(cè)車(chē)輛、船或自行車(chē),則需要對(duì)類(lèi)似目標(biāo)進(jìn)行同樣的手動(dòng)設(shè)定。[nextpage]
手動(dòng)標(biāo)定
一般在攝像機(jī)安裝后,有一個(gè)工程師手持一個(gè)固定高度的立桿進(jìn)入攝像機(jī)視場(chǎng),通過(guò)在不同位置走動(dòng),在后臺(tái)管理軟件的工程師可以手動(dòng)在標(biāo)定界面上標(biāo)注出立桿占據(jù)的像素高度。立桿高度和像素高度的對(duì)應(yīng)比例,可以反映出物理尺寸的人體高度和像素的對(duì)應(yīng)關(guān)系,從而在類(lèi)似高度的目標(biāo)進(jìn)入防區(qū)后,觸發(fā)報(bào)警。這個(gè)標(biāo)定理論的前提是攝像機(jī)視場(chǎng)角度不會(huì)發(fā)生大的改變,現(xiàn)場(chǎng)環(huán)境如地形、樹(shù)木等不會(huì)發(fā)生大的變化,攝像機(jī)在維護(hù)過(guò)程中,不會(huì)被調(diào)整方向。人工標(biāo)定過(guò)程是一個(gè)很浪費(fèi)時(shí)間和人力的過(guò)程,至少2個(gè)人,標(biāo)定成功后還要現(xiàn)場(chǎng)人員四處走動(dòng),以確認(rèn)標(biāo)定是準(zhǔn)確的,如果標(biāo)定不準(zhǔn)確,物理尺寸和像素對(duì)應(yīng)出現(xiàn)大的誤差,那么人體高度識(shí)別就會(huì)出現(xiàn)大的誤差,從而導(dǎo)致誤報(bào)或漏報(bào)。因?yàn)樗^(guò)于依賴高度這個(gè)參數(shù)來(lái)做目標(biāo)分類(lèi),所以人工標(biāo)定的系統(tǒng)往往無(wú)法提供有效的目標(biāo)識(shí)別。
例如,如果一個(gè)人只有部分可見(jiàn),如走在車(chē)輛后邊,被灌木遮擋部分身體,甚至可能只有目標(biāo)的頭部和肩膀可見(jiàn),傳統(tǒng)算法就會(huì)認(rèn)為這個(gè)目標(biāo)過(guò)小,從而導(dǎo)致漏報(bào),如果為了檢測(cè)到目標(biāo),設(shè)定檢測(cè)的目標(biāo)高度范圍擴(kuò)大,那么就有可能導(dǎo)致小動(dòng)物誤報(bào)。另外,一旦地形發(fā)生變化,或者攝像機(jī)角度偏移,目標(biāo)物體尺寸和像素對(duì)應(yīng)關(guān)系發(fā)生巨變,那么根據(jù)這個(gè)透視假設(shè)所識(shí)別的目標(biāo)就完全不準(zhǔn)確了。
自適應(yīng)智能分析算法的不同
自適應(yīng)智能分析算法不是簡(jiǎn)單地通過(guò)目標(biāo)高度來(lái)判斷目標(biāo)屬性,而是通過(guò)目標(biāo)自有特征來(lái)自動(dòng)實(shí)現(xiàn)目標(biāo)分類(lèi),從而對(duì)某一目標(biāo)其在場(chǎng)景不同位置的像素對(duì)應(yīng)關(guān)系構(gòu)建透視對(duì)應(yīng)關(guān)系。反過(guò)來(lái),準(zhǔn)確的透視關(guān)系又改進(jìn)目標(biāo)的識(shí)別率。所以,工程商和用戶可以直接安裝智能攝像機(jī),而無(wú)需考慮人工標(biāo)定過(guò)程。攝像機(jī)安裝當(dāng)天,系統(tǒng)就開(kāi)始自動(dòng)學(xué)習(xí)背景和場(chǎng)景中的目標(biāo),從而實(shí)現(xiàn)自動(dòng)標(biāo)定。即便用戶日后調(diào)整攝像機(jī)角度或地形發(fā)生變化,系統(tǒng)都會(huì)自動(dòng)重新學(xué)習(xí)、自動(dòng)再次標(biāo)定。這大大降低了勞動(dòng)強(qiáng)度和運(yùn)作成本。
分布式存儲(chǔ) 一體化架構(gòu)
如何實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的可伸縮性一直是所有標(biāo)書(shū)中所要求的,也是很多技術(shù)人員所討論的核心之一,但是往往實(shí)現(xiàn)的不夠完美。分布式存儲(chǔ)近年來(lái)進(jìn)入人們的視野,并逐步為用戶所接受,主要在于其良好的可擴(kuò)展性、簡(jiǎn)單、有效。
架構(gòu)優(yōu)勢(shì)
現(xiàn)代網(wǎng)絡(luò)設(shè)備的設(shè)計(jì)初衷是少對(duì)多的數(shù)據(jù)流分發(fā)模式,比如一臺(tái)服務(wù)器由多臺(tái)客戶機(jī)訪問(wèn)。而且往往是數(shù)據(jù)突發(fā)的訪問(wèn),并不是長(zhǎng)期高帶寬傳輸。而對(duì)于視頻或大數(shù)據(jù)量的應(yīng)用,有組播分發(fā)協(xié)議,從而控制整體數(shù)據(jù)流量。
而網(wǎng)絡(luò)監(jiān)控系統(tǒng)正好相反,是多對(duì)少的數(shù)據(jù)流集中模式,多個(gè)攝像機(jī)將數(shù)據(jù)傳送到幾臺(tái)服務(wù)器,網(wǎng)絡(luò)瓶頸和系統(tǒng)可靠性就成了系統(tǒng)設(shè)計(jì)關(guān)鍵。通過(guò)將錄像存儲(chǔ)和智能視頻分析分布在各個(gè)攝像機(jī)前端,用戶就可以智能的瀏覽各個(gè)攝像機(jī)的視頻,而不會(huì)對(duì)網(wǎng)絡(luò)產(chǎn)生過(guò)高的壓力,對(duì)于網(wǎng)絡(luò)可靠性的要求就會(huì)大大降低。
同時(shí),采用分布式存儲(chǔ)設(shè)計(jì),不僅大大降低了以上提到的網(wǎng)絡(luò)瓶頸和平臺(tái)軟件系統(tǒng)的可靠性要求,而且也大大降低了集中存儲(chǔ)的可靠性要求。
一體化架構(gòu)設(shè)計(jì)
實(shí)驗(yàn)室和實(shí)際環(huán)境測(cè)試表明,分布式錄像存儲(chǔ)架構(gòu)可以降低90%的網(wǎng)絡(luò)帶寬,傳統(tǒng)的集中式存儲(chǔ)所要求的高可靠性網(wǎng)絡(luò)需求和復(fù)雜的服務(wù)器、IPSAN存儲(chǔ)系統(tǒng),將不再成為設(shè)計(jì)的中心。另外,由于智能視頻分析直接位于前端,可以根據(jù)不同規(guī)則進(jìn)行不同碼流的錄像和回傳,更加有效的、主動(dòng)實(shí)現(xiàn)管理帶寬。 如當(dāng)有人或車(chē)輛違反規(guī)則時(shí),前端攝像機(jī)進(jìn)行1080P@30fps高清錄像,保證事件調(diào)查時(shí)具有最好的圖像,同時(shí)回傳低碼流的視頻給后臺(tái)軟件。這樣的系統(tǒng)設(shè)計(jì)可以保證網(wǎng)絡(luò)和計(jì)算機(jī)資源的有效、合理分配,從安裝1臺(tái)攝像機(jī)到N臺(tái),完全的線性增長(zhǎng)。
自適應(yīng)智能視頻分析邁向主流
自適應(yīng)智能視頻分析技術(shù)解決了智能高清監(jiān)控技術(shù)的兩大難題:識(shí)別率和成本。通過(guò)革命性的方法,將成像、錄像、識(shí)別融為一體,從而應(yīng)對(duì)最復(fù)雜的安防需求。完全的自動(dòng)標(biāo)定,真正將智能視頻分析技術(shù)演進(jìn)為即插即用的設(shè)備。
所以我們能夠預(yù)見(jiàn)到,在不遠(yuǎn)的將來(lái),高清智能視頻分析將快速進(jìn)入主流市場(chǎng),而一體化設(shè)計(jì)的智能高清攝像機(jī),也將快速進(jìn)入工程商和用戶的視野。