各行各業(yè)熱衷于導(dǎo)入AI技術(shù)來解決企業(yè)自身問題,并且鼓吹邊緣計算的重要性—低延遲及快速反應(yīng)。對于視頻的AI邊緣計算來說,攝像機扮演著重要的角色,可以算是AI視頻邊緣計算的「現(xiàn)在進(jìn)行式」以及「未來完成式」。
處理視頻的3種AI系統(tǒng)架構(gòu)
一般用來處理視頻的AI系統(tǒng)架構(gòu)有三種,分別為:(1)邊緣計算AI攝像機,(2)近緣多路AI計算主機,(3)機房集中式多路AI計算主機。第一種的邊緣計算AI攝像機,是指IP攝像機SoC芯片內(nèi)建AI神經(jīng)網(wǎng)絡(luò)處理器NPU(Neural Processing Unit),除了可運行IP攝像機本身該有的功能,還能執(zhí)行AI識別、可程序化任務(wù),獨立作業(yè)觸發(fā)報警或連動后續(xù)的自動化工作。
傳統(tǒng)AI識別系統(tǒng)是通過AI計算主機,包含「近緣多路」或「機房集中式多路」AI計算主機,近緣(near-edge)架構(gòu)是為了快速反應(yīng)識別后的結(jié)果,所以會安裝在靠近IP攝像機的近端高帶寬環(huán)境,比如交通執(zhí)法用的電信箱內(nèi)。當(dāng)然也有舍近求遠(yuǎn),將所有路口IP攝像機通過5G或光纖收攏在集中式多路AI計算主機進(jìn)行計算及識別的作法。(參見圖1)
就效率來說,近緣架構(gòu)仍然是較理想的作法,如果能把既有的攝像機用來擴充邊緣計算AI功能,就更加便捷?!讣扔袛z像機擴充AI功能」會是需求與趨勢,不過,就像當(dāng)年也能擴充IP網(wǎng)絡(luò)功能的模擬攝像機一樣,最后仍會被IP攝像機直接取代。
圖1、常見AI視頻系統(tǒng)架構(gòu)圖
邊緣計算AI攝像機的3大優(yōu)勢
1、低耗能、低維運成本
AI計算主機有哪些弊端?視頻譯碼及運維成本太高。傳統(tǒng)的AI識別系統(tǒng)是這樣運作的:IP攝像機耗費計算資源將視頻編碼后,繼續(xù)耗費帶寬資源把數(shù)據(jù)傳給AI計算主機,AI計算主機接手耗費資源產(chǎn)生YUV或JPEG照片給AI硬件計算單元(NPU)進(jìn)行AI識別(inference),視頻分辨率越大,識別的物種就越多,對于顯示適配器上的計算能量要求也更高,耗電量十分驚人。
一臺AI計算主機,有500W~700W的耗電是很常見的。試想:當(dāng)今市售最好的顯卡可以進(jìn)行幾路的4K / H.264視頻識別?更遑論壓縮率更高的H.265了。相較于AI主機還要浪費資源譯碼后才能識別,邊緣計算AI攝像機在源頭就提供YUV的照片內(nèi)存地址,讓NPU直接進(jìn)行識別,整體系統(tǒng)架構(gòu)更簡潔,運維的電力成本低,不占用帶寬,系統(tǒng)建設(shè)成本于是更經(jīng)濟。(參見圖2)
圖2、AI計算主機與AI攝像機的計算架構(gòu)差異
2、低延遲:最大優(yōu)點!
AI計算主機還有個致命缺點,就是一系列的計算延遲,包含視頻譯碼延遲、AI識別延遲、物種追蹤算法及行為偵測延遲等。視頻譯碼的部分,以H.264壓縮格式為例,會有2~3幀的解碼成像延遲,導(dǎo)致行為偵測后的警報發(fā)報會延時到200~300毫秒(ms)以后。
識別的延遲呢?AI主機進(jìn)行10次識別,整體延遲會達(dá)到639毫秒,而這還沒有加上4K串流在網(wǎng)絡(luò)傳送時需要的時間。邊緣計算AI攝像機不會有那么高的整體延遲,以4K / 30幀的邊緣計算攝像機為例,1秒可以支持10次識別,約100毫秒后可以觸發(fā)禁區(qū)偵測的警報。(參見表1)
表1、AI計算主機與AI攝像機的比較
3、攝像機成為AI載具,用戶可自行訓(xùn)練AI模型、保障隱私問題
此外,企業(yè)在導(dǎo)入AI時,常會碰到需求單位與研發(fā)人員在領(lǐng)域知識(Domain know how)上有認(rèn)知差異,在銷售時容易造成誤會或沖突。就算企業(yè)內(nèi)部已實現(xiàn)完整的認(rèn)知框架,面對客戶的需求可能又是另一個問題,比如醫(yī)療或國防之類的單位,會因隱私議題無法提供數(shù)據(jù)集來訓(xùn)練,AI模型就很難準(zhǔn)確。
AI的應(yīng)用是五花八門的,永遠(yuǎn)都會有新的對象要識別。讓攝像機成為AI載具,用戶可以自己進(jìn)行AI數(shù)據(jù)集的訓(xùn)練,就不會有隱私權(quán)問題。以利凌提供的Self+AI YOLO轉(zhuǎn)換云來說,可以把用戶自訓(xùn)的AI模型封裝成固件,并以AES256加密,自己的模型永遠(yuǎn)不會外漏。
封裝完的固件要裝在哪里?當(dāng)然就是前端AI攝像機了。例如利凌提供的整體前端識別架構(gòu),可以通過HTTP / HTTPs與后端通信,藉由開源于Github的Python及C# SDK來串接后端應(yīng)用,任何工程師只要熟悉Python及C#環(huán)境,皆可立即引用及開發(fā)。(參見圖3)
圖3、AI攝像機如何與后端系統(tǒng)運作整合
AI邊緣計算攝像機常見的應(yīng)用
近年來,邊緣計算AI攝像機已可加載多個AI模型、同時識別不同物種。比較熱門且迫切的是車牌識別,多國車牌識別已可在100公里時速的雙車道進(jìn)行,停車場出入口自動化更是已經(jīng)被廣泛套用的場景,因為通過攝像機就能直接連動接口設(shè)備,比如空位指引及收費機等,完全不必再經(jīng)過PC,干凈又利落。(參見圖4)
圖4、AI攝像機可同時支持車廠、車種、多國車牌、行為偵測及車牌顏色偵測
而在公共場域,識別遺失物及遺留物也是AI邊緣計算攝像機的看家本領(lǐng)之一。另一個有趣且實用的場域是工地,AI邊緣計算攝像機的識別結(jié)果可以用操作數(shù)來做邏輯判斷,比如通過「同時存在多種對象(AND)」的邏輯來做工地門禁,安全帽、防護(hù)鏡、安全背心要同時佩戴完整才會開門;相反的,「缺少任何一樣物種 (NAND)」則是可以觸發(fā)警報。(參見圖5)
圖5、AI攝像機工地安全柵門警示或自動化應(yīng)用
在智能產(chǎn)線的應(yīng)用方面,只要提供攝像機商品的內(nèi)容物模型,比如配件包、主機、使用手冊、遙控器等,就能進(jìn)行產(chǎn)線自動化或缺件警示。AI PTZ球型追蹤攝像機更被應(yīng)用在船舶追蹤,來厘清船只碰撞時的肇責(zé),或是違規(guī)停車及并排停車的車牌識別,這些應(yīng)用都不需再使用耗電量較大的AI識別主機。
?。ū疚霓D(zhuǎn)自中國臺灣智慧安防網(wǎng),有刪減)