如果說2018年是AI企業(yè)的融資年的話,2019年對AI企業(yè)來說就是“AI賦能智慧”的落地之年。2018年的寒冬不僅僅是對AI企業(yè)而言,各行各業(yè)都感同身受,房地產(chǎn)尤為明顯,企業(yè)名稱連“房地產(chǎn)”三個字都去掉了,紛紛改名“發(fā)展”,就是一個兆頭。
寒冬之后,緊縮的就是投資,資本家也沒有多少錢了。2019年如果AI企業(yè)不能再依靠講故事、比賽拿No 1、做演講拿融資的話,如何實現(xiàn)大規(guī)模擴展、招人、再發(fā)展?企業(yè)存在的意義必須有收入、有利潤,那么2019年必須用Case來說話,用中文說就是業(yè)務(wù)必須落地,今天AI智道 就是要和大家談這個話題。
AI賦能智慧落地有幾大場景:
?金融:幾家獨角獸企業(yè)都取得不錯的成績。
?醫(yī)療:AI落地的重要場景。
?自動駕駛:預(yù)計大規(guī)模落地還需要1-2年的時間。
?機器人:類似于自動駕駛,尚需假以時日。
?教育:音頻和文字識別暫時是主要場景,視頻技術(shù)剛剛啟動。
?消費:主要是2C的市場,手機端應(yīng)用是大熱門。
?大安防市場:AI視覺企業(yè)必爭之地。
作為大安防市場的自媒體,紐豪斯并不像和大家過多的探討其它幾個場景,主要是想和大家聊聊大安防市場。
AI賦能安防場景分析
車牌識別:爛大街的應(yīng)用,是AI賦能大安防發(fā)展最成熟的市場,廣泛應(yīng)用于卡口、電子警察以及停車場出入口管理,是傳統(tǒng)安防企業(yè)的海大天(HDT,海康、大華、天地偉業(yè))、以薩等企業(yè)的天下,AI新貴幾無可能2019在這個市場上分得大蛋糕。
車輛大數(shù)據(jù):如果是基于卡口、電子警察的車輛大數(shù)據(jù),自然是沒有AI企業(yè)的份,主要還是HDT、以薩的市場,以及眾多的大安防SI(佳都科技、東方網(wǎng)力、海信網(wǎng)絡(luò)、高新興、易華錄)的市場。如果將車輛大數(shù)據(jù)引入更大的“城市交通大腦”,情況完全不一樣,BAT、高德、滴滴均有布局并在2018年取得了不錯的戰(zhàn)國,尤其是阿里巴巴獨落10個城市級大腦工程。四大AI獨角獸(SKYY,商湯、曠視、依圖、云從)如果能夠積極布局,相信還有很多機會,畢竟大腦級工程的起步尚未超過2年。
人臉識別:同樣是爛大街的場景。凡號稱安防AI的幾乎沒有那家沒有人臉識別產(chǎn)品或系統(tǒng)的,據(jù)報道瑞為公司在嵌入式門禁人臉識別市場份額很高(有待進(jìn)一步考證),但要說基于全國身份證系統(tǒng)的人臉大庫做Face ID,算法上優(yōu)秀的當(dāng)算SKYY、云天勵飛、???,以廣東飛識、Huawei VPaaS為例,采用的是多算法融合系統(tǒng),同時可以支持以上算法。人臉識別在2018年飽受非議,主要涉及隱私、GDPR《通用數(shù)據(jù)保護(hù)條例》,甚至是微軟公司也發(fā)布了《使用人臉識別技術(shù)應(yīng)遵循六大原則:公平性、透明性、問責(zé)制度、非歧視性、知情同意、合法監(jiān)視》,尤其是在少數(shù)族群識別上識別率差強人意,雖然中國算法公司在這方面做的更好(比如說華云智能),但還不至于領(lǐng)先太多。
非人臉識別:有兩種情況是AI企業(yè)需要考慮的,不是所有的場景都可以采集人臉信息(主要涉及隱私保護(hù)/種族等原因),其次是攝像機沒有/不支持采集到人臉。就需要大規(guī)模的使用到非人臉識別技術(shù),主要包括ReID(行人再識別)、骨骼檢測分析、圖像二次識別、特征識別等。
2019,大安防市場落地趨勢分析
大安防市場紐豪斯曾經(jīng)多次定義,主要包括平安城市、雪亮工程、智感社區(qū)、交通大腦、城市大腦、交通管控、智慧交通、智慧警務(wù)和視頻云工程,對于比較成熟的平安城市、交通管控、智慧交通本文并不會細(xì)致展開。2019年以下幾個趨勢是一定要關(guān)注的:非人臉識別將大行其道、聚焦垂直行業(yè)、聚焦平臺級應(yīng)用、深入了解客戶的需求、大數(shù)據(jù)的開放和整合、兩種模式取其一,說的更準(zhǔn)確一點紐豪斯更關(guān)注公共安全市場(PS,Public Security)。
趨勢一、非人臉識別將大行其道
雖然說人臉識別技術(shù)已經(jīng)爛大街了,但還是有一類人臉應(yīng)用是值得關(guān)注的,那就是人臉聚類。
人臉聚類
人臉聚類將是城市級的PS應(yīng)用,是一定要關(guān)注的,從公開報道來看,商湯和依圖已經(jīng)在積極布局。
A.商湯人臉聚類
根據(jù)商湯科技公眾號報道,香港中文大學(xué)-商湯科技聯(lián)合實驗室(MMLab)提出一種有監(jiān)督的Metric用于人臉聚類,來部分解決無標(biāo)注數(shù)據(jù)內(nèi)部結(jié)構(gòu)復(fù)雜、依賴特定Metric、缺乏Outlier控制,以及時間復(fù)雜度等問題。目前在人臉的公開數(shù)據(jù)集標(biāo)到了百萬級別,人臉識別百萬里挑一的正確率達(dá)到99.9%(MegaFace Benchmark)之后,發(fā)現(xiàn)再也標(biāo)不動了。標(biāo)注員能標(biāo)出來的數(shù)據(jù)永遠(yuǎn)是簡單樣本,而人臉識別模型是個“深淵”,當(dāng)你凝視“深淵”的時候,“深淵”并不想看到你。
深度學(xué)習(xí)時代的人臉聚類,一般采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)中提取出來的特征。人臉識別的CNN通常把人臉圖片映射(Embedding)到一個高維的向量,然后使用一個線性分類器,加Softmax激活函數(shù)和交叉熵?fù)p失(Cross Entropy Loss)來訓(xùn)練。
紫色的向量即為人臉特征(圖片來自商湯公眾號)
這種方式?jīng)Q定了這些經(jīng)過映射(Embedding)后的人臉在特征空間里分布在不同的錐形(Cone)中(下左圖),因而可以使用余弦相似度(Cosine Similarity)來度量相似度。或者如果對人臉特征做二范數(shù)(L2)歸一化,那么人臉特征則會分布在一個球面上(下右圖),這樣可以使用L2距離來度量。
圖示為2維,實際在高維空間(圖片來自商湯公眾號)
有了特征和度量標(biāo)準(zhǔn)之后就是如何選擇一個聚類算法了?,F(xiàn)成的聚類算法包括K-Means、Spectral、DBSCAN、 Hierarchical Agglomerative Clustering (HAC)、Rank Order等以及它們的變種。利用這些方法聚類之后將每一類中的樣本分配相同的標(biāo)簽,不同的類分配不同的標(biāo)簽,就可以用來充當(dāng)訓(xùn)練集了。
使用20萬張圖提取特征之后來測試一下這些聚類算法,K-Means花了10分鐘,HAC花了5.7小時,DBSCAN花了6.9小時, Spectral花了12小時。若使用60萬張圖片提取的特征來做聚類,K-Means超內(nèi)存了,HAC花了61小時,DBSCAN花了80小時,Spectral跑到天荒地老之后也甩了一句超內(nèi)存。當(dāng)圖片數(shù)量增加到140萬的時候,幾乎所有的聚類算法都掛了。
K-Means, Spectral, HAC等傳統(tǒng)聚類方法的問題依然存在各種各樣的問題:聚類算法具有較高的時間復(fù)雜度、通常認(rèn)為數(shù)據(jù)分布服從某些簡單的假設(shè)、通常使用某種特定的Metric、缺乏較好的離群值(Outliers)控制機制。商湯提出了一種有監(jiān)督的Metric用于人臉聚類,來部分解決無標(biāo)注數(shù)據(jù)內(nèi)部結(jié)構(gòu)復(fù)雜、依賴特定Metric、缺乏Outlier控制的問題,順便還解決了一下時間復(fù)雜度的問題(CDP做到了線性復(fù)雜度),當(dāng)然性能也提升了一大截。
CDP本質(zhì)是學(xué)習(xí)一個Metric,也就是對樣本對(Pairs)進(jìn)行判斷。如下圖,CDP首先使用多個人臉識別模型構(gòu)建成一個委員會(Committee), Committee中每個成員對基礎(chǔ)模型中相連的Pairs提供包括關(guān)系(是否是Neighbor)、相似度、局部結(jié)構(gòu)等信息,然后使用一個多層感知機(MLP)來整合這些信息并作出預(yù)測(即這個Pair是否是同一個人)。
圖片來自商湯公眾號
這個過程可以類比成一個投票的過程,Committee負(fù)責(zé)考察一個候選人(Pair)的各方面信息,將信息匯總給MLP進(jìn)行決定。最后將所有的Positive Pairs組成一個新的Graph稱為Consensus-driven Graph。在此Graph上使用簡單的連通域搜索并動態(tài)剪枝即可快速得到聚類。由于MLP需要使用一部分有標(biāo)簽的數(shù)據(jù)來訓(xùn)練得到,所以CDP是一種基于有監(jiān)督的Metric的聚類方法。
在復(fù)雜度上,CDP由于只需要探索局部結(jié)構(gòu),因此除了KNN搜索之外,聚類部分的復(fù)雜度是接近線性的。在20萬數(shù)據(jù)上,不計入KNN搜索(依賴別的庫)的時間的話,CDP單模型的耗時是7.7秒,多模型的耗時是100秒。在140萬數(shù)據(jù)上,CDP單模型的耗時是48秒,多模型的耗時是585秒。試驗結(jié)果上看時間復(fù)雜度甚至低于線性(小于7倍)。
商湯在實驗中使用CDP聚類后的數(shù)據(jù)加入人臉識別模型的訓(xùn)練之后,可以讓模型達(dá)到接近全監(jiān)督(使用Ground Truth標(biāo)簽)的結(jié)果。如下圖所示:
圖片來自商湯公眾號
在兩個測試集(Benchmark)上,隨著數(shù)據(jù)的增多,用CDP聚類結(jié)果訓(xùn)練的人臉模型性能的增長接近全監(jiān)督模型(所有數(shù)據(jù)都使用Groundtruth標(biāo)注)。有趣的是在IJB-A上商湯的結(jié)果超過了全監(jiān)督模型,原因可能是訓(xùn)練集的Ground Truth標(biāo)簽會有一些噪聲(Noise),例如誤標(biāo)注,導(dǎo)致全監(jiān)督模型在IJB-A的某些測試樣例上表現(xiàn)不佳。
聚類后的部分結(jié)果如下圖所示:
每一組代表聚完類后屬于同一類(圖片來自商湯公眾號)
CDP屬于一種自下而上(Bottomup)的方法,因此只能感知局部的數(shù)據(jù)結(jié)構(gòu)。然而感知全局的數(shù)據(jù)結(jié)構(gòu)對于聚類更為重要,為此,我們最近提出了一種自上而下(Top Down)的有監(jiān)督聚類方法,能自動學(xué)習(xí)根據(jù)數(shù)據(jù)的結(jié)構(gòu)進(jìn)行聚類,更加充分地解決上述傳統(tǒng)聚類的問題。聊得再多就涉及商業(yè)機密了,有興趣請關(guān)注他們的公眾號。
B.依圖人臉聚類
依圖認(rèn)為AI有個創(chuàng)新曲線,從2015年的10萬人人臉認(rèn)證到16年的1000萬人臉大庫識別,2017年發(fā)展到20億人臉大庫的識別,這是一個質(zhì)的飛躍,預(yù)期未來能夠?qū)崿F(xiàn)千億人臉大庫的識別,這是一個美好的未來。那么再如此之多的人臉庫中找到同一個人,都繞不過人臉聚類這個功能。
依圖把人臉識別分為3個時代:
?1.0監(jiān)控時代:弱智能
?2.0識別智能時代:攝像機具有超越人臉的識別能力,代表技術(shù)包括靜態(tài)比對、動態(tài)布控,代表應(yīng)用包括陳年舊案破獲、逃犯抓捕等
?3.0數(shù)據(jù)智能時代:通過分析人在物理世界的活動規(guī)律從而識別精度進(jìn)一步提高、智能化的發(fā)現(xiàn)異常情況;其次就是實現(xiàn)市(?。┘壢讼窬垲?,以依圖目前的技術(shù)水平,可以實現(xiàn)1萬路、1億人/天、1年數(shù)據(jù)、1秒返回,并形成三大基礎(chǔ)技戰(zhàn)法及各種專用技戰(zhàn)法,除了人臉之外還能夠?qū)崿F(xiàn)多維數(shù)據(jù)碰撞。
依圖的觀點“數(shù)據(jù)智能”已經(jīng)得到業(yè)界的主流認(rèn)可,無疑“數(shù)據(jù)”是人工智能的三要素之一(另外兩個是算法和算力)。PS領(lǐng)域極致的算法能力和大數(shù)據(jù)分析能力是依圖的兩大當(dāng)家法寶。盡管如此,依圖公司依然可以克服目前監(jiān)控中廣泛存在的陰影、模糊、遮擋、低像素、墨鏡等多種情況,通過歸檔技術(shù),實現(xiàn)高難度照片聚類。
紐豪斯了解到依圖的人臉聚類已經(jīng)在湖南某時落地案例,該項目擁有3000路攝像機、數(shù)據(jù)保存100天、常口庫+抓拍聚類檔案總數(shù)800+萬人、抓拍國人數(shù)量2000+萬張,助力刑事案件破獲占比約35%。
考慮到人臉識別的爭議性,在計算機視覺領(lǐng)域紐豪斯更加關(guān)注非人臉識別,典型應(yīng)用包括:圖像二次識別、ReID和骨骼檢測系統(tǒng),雖然也有很多其它類型的應(yīng)用,但最有希望在2019年實現(xiàn)落地的應(yīng)該集中在這三個方面。
圖像二次識別
AI對人類最大的價值來自于兩個方面:減少人工節(jié)約人力和降低成本。如果AI擁有比“人”更加強大的能力,效果更高的話,相信會得到快速的普及。以典型違章數(shù)據(jù)處理為例,目前的交通違章均需要通過人工進(jìn)行二次識別,如果能夠采用AI技術(shù)進(jìn)行二次識別,事先將模糊、非違章的照片去除,就可以大大降低人力水平,同樣如果把這些技術(shù)也用于行人闖紅燈警示,而可以大大減少交通事故的發(fā)生。
ReID行人再識別
之前的公眾號文章我們曾經(jīng)探討過ReID,后續(xù)還會有一篇專題文章來進(jìn)一步探討。ReID是近2年得到迅速發(fā)展的非人臉識別技術(shù),華云智能、云從科技和千視通都取得了技術(shù)上的突破,并能夠?qū)崿F(xiàn)商用。對與ReID而言最實用的當(dāng)屬以圖搜圖功能了,有望在2019年得到較大規(guī)模的落地。
ReID(Person Re-identification),也稱為行人重識別、行人再識別、跨鏡追蹤,是利用計算機視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù),廣泛被認(rèn)為是一個圖像檢索的子問題,目前主要應(yīng)用于安防領(lǐng)域,未來與人臉識別相結(jié)合能夠應(yīng)用于更多更豐富的場景。
ReID的優(yōu)勢在于實時分析,對攝像機沒有太高的技術(shù)要求,我們可以假定一個場景,春運過程中當(dāng)一位媽媽攜帶一名子女在購買車票的過程中發(fā)生小孩走失的情形,警察在接到媽媽的報警后,通過給媽媽拍照采集人臉,通過同行人找到小孩的人臉照片,再通過小孩的照片用ReID技術(shù)進(jìn)行跨鏡追蹤,就可能找到小朋友的軌跡,這具有極大的實用價值,避免報案人口頭描述不清、無法準(zhǔn)確掌握小孩外貌/衣服特征的情況下,尤為管用。
骨骼檢測系統(tǒng)
骨骼檢測技術(shù)和ReID技術(shù)有異曲同工之妙,差異在骨骼檢測僅檢測“骨骼”和衣服的顏色不相關(guān),就可以大大減少顏色特征帶來的誤報,通過身高、步態(tài)、姿勢來判斷一個人來實現(xiàn)分析,從目前的技術(shù)發(fā)展來看,已經(jīng)具備在2019年實現(xiàn)小范圍落地的可能性。
人體骨骼關(guān)鍵點對于描述人體姿態(tài),預(yù)測人體行為至關(guān)重要。因此人體骨骼關(guān)鍵點檢測是諸多計算機視覺任務(wù)的基礎(chǔ),例如動作分類,異常行為檢測,以及自動駕駛等等。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,人體骨骼關(guān)鍵點檢測效果不斷提升,已經(jīng)開始廣泛應(yīng)用于計算機視覺的相關(guān)領(lǐng)域。
趨勢二、聚焦垂直行業(yè)
主流企業(yè)采用矩陣式管理已經(jīng)非常常見,尤其是在AI圈,既要布局全國市場,設(shè)立分公司、辦事處,也要布局垂直市場。紐豪斯曾經(jīng)在公眾號(AI智道)發(fā)布《城市級大安防項目市場分析報告》,典型的垂直市場包括公共安全(PS,Public Security)和交通(涵蓋交通管控和智慧交通),這里不在贅述,對于AI企業(yè)落地大安防市場而言,這兩大市場是必爭之地。
趨勢三、聚焦平臺級應(yīng)用
紐豪斯多次和讀者探討城市級大安防應(yīng)用,這是典型的2G市場,而2C和2B的市場相對分散而不成熟。對于SI而言,只有擁有平臺級應(yīng)用(殺手锏)才能立于不敗之地,對于AI企業(yè)而言,如果不能擁有自己的大安防平臺很難和大型SI擁有討價還價的能力。尤其是漫天蓋地的新聞?wù)f,某某城市又建設(shè)了一個大腦、一個平臺的時候,發(fā)現(xiàn)市場機會又被友商撬走了,心里確實很著急。
那么城市級大安防市場的平臺應(yīng)用有哪些?
?平安城市:聯(lián)網(wǎng)平臺、運維平臺、一機一檔
?雪亮工程:除了平安城市的平臺,再增加一個網(wǎng)格化平臺(一標(biāo)三實)
?智感社區(qū):居民信息登記系統(tǒng)、社區(qū)綜合信息查詢系統(tǒng)、社區(qū)警務(wù)管理服務(wù)系統(tǒng)、社區(qū)警務(wù)管理服務(wù)APP、社區(qū)綜治平臺、警務(wù)平臺、一標(biāo)三實平臺等,目前BATH、東方網(wǎng)力、佳都科技、科達(dá)、商湯、曠視、力維等企業(yè)均有積極布局
?交通大腦:城市交通大腦平臺,主流廠商包括阿里巴巴、高德、滴滴、方緯科技等
?城市大腦:城市大腦平臺,影響力最大的廠商當(dāng)屬阿里巴巴,大約有10個城市的落地
?視頻云:AI賦能安防最高級的應(yīng)用當(dāng)屬視頻大數(shù)據(jù)和視頻云建設(shè),只有足夠多的數(shù)據(jù)才能夠產(chǎn)生更多的應(yīng)用和技戰(zhàn)法,未來的視頻監(jiān)控當(dāng)屬于市級甚至是省級的視頻云平臺,在2018年已經(jīng)有較多的落地案例,相信在2019年會出現(xiàn)更多的視頻云和大數(shù)據(jù)平臺
?智慧警務(wù):涉及的平臺最多,也最復(fù)雜,各警種都涉及多種平臺,典型應(yīng)用包括治安、管控、指揮、偵查、監(jiān)管等
應(yīng)用參考:阿里城市大腦3.0
來自雷鋒網(wǎng)的報道,城市大腦是技術(shù)進(jìn)步的產(chǎn)物,也是城市發(fā)展的產(chǎn)物。綜合來說,云數(shù)物智技術(shù)積累、國家政策支持、本地政府配合、后期龐大城市訂單等等因素,促成了天時地利人和的形成。AI、IoT、云計算、數(shù)據(jù)挖掘、知識管理、深度學(xué)習(xí)等技術(shù)迅速進(jìn)入爬坡期,互聯(lián)網(wǎng)科技公司、運營商、硬件廠商參與城市建設(shè)有了便捷的通道,但由于智慧城市是一個跨系統(tǒng)交互的大系統(tǒng),是“系統(tǒng)的系統(tǒng)”,不是硬件的堆疊與軟件的重復(fù)建設(shè),而是需要有一個中樞神經(jīng)式的城市指揮系統(tǒng),這個系統(tǒng)必須具備全面、實時、全量的決策能力——這成為“ET城市大腦”誕生的基礎(chǔ)。
2016年10月,云棲大會城市大腦首次亮相,由王堅發(fā)布;
2017年4月,城市大腦落地蘇州;2017年8月,城市大腦落地澳門;
2017年10月,杭州城市大腦1.0正式發(fā)布;
2017年11月,城市大腦入選新一代人工智能開放創(chuàng)新平臺;
2018年10月,杭州城市大腦2.0正式發(fā)布;
2018年12月29日,杭州城市大腦綜合版發(fā)布,將進(jìn)入3.0時代。
雷鋒網(wǎng)注意到,城市大腦1.0版本到2.0版本用了整整一年,而2.0版本到3.0版本只花了不到3個月的時間。2013年,閔萬里加入阿里任職阿里云機器智能首席科學(xué)家,先后打造了ET城市大腦 、ET工業(yè)大腦、ET農(nóng)業(yè)大腦等。加入阿里之前,閔萬里在Google和IBM工作過,而IBM還是智慧地球的倡導(dǎo)者。
雷鋒網(wǎng)注意到,阿里城市大腦團(tuán)隊的重點在公共安全、城市管理、交通治理3大領(lǐng)域。在2018年10月,該團(tuán)隊還在社招一些在自然語言處理(NLP)、知識圖譜、機器學(xué)習(xí)、深度學(xué)習(xí)、大規(guī)模分布式機器學(xué)習(xí)領(lǐng)域有3-5年研發(fā)經(jīng)驗的人才。隨著2018年11月阿里云事業(yè)群升級為阿里云智能事業(yè)群??茖W(xué)家出身的閔萬里在阿里云內(nèi)部繼續(xù)承擔(dān)著打通各個行業(yè)大腦數(shù)據(jù)的使命,用數(shù)據(jù)智能推動城市大腦的商用。
此外,在阿里達(dá)摩院,北京大學(xué)應(yīng)用數(shù)學(xué)博士,IEEE Fellow華先勝領(lǐng)導(dǎo)城市大腦實驗室,主抓城市大腦在視覺方面的技術(shù)研究。華先勝的職位是阿里巴巴副總裁、達(dá)摩院城市大腦實驗室負(fù)責(zé)人。在城市大腦項目上,閔萬里和華先勝的團(tuán)隊緊密合作。
阿里云想的很明白,做好行業(yè)大腦必須把握好3個能力:AI能力、云計算大數(shù)據(jù)能力、垂直行業(yè)整合能力。在城市大腦背后的技術(shù)架構(gòu)上,分布著4大平臺,涉及與城市交通、醫(yī)療、城管、環(huán)境、旅游、城規(guī)、平安、民生八大領(lǐng)域有關(guān)的計算能力、數(shù)據(jù)算法、管理模型等。在城市大腦視覺AI的項目組成上(這部分由華先勝團(tuán)隊主導(dǎo)),目前分為天曜、天鷹、天機、天擎四個部分。前三部分比較偏應(yīng)用,最后一部分是平臺。
在杭州,杭州城市大腦塑造了經(jīng)典的案例。作為長江三角洲城市群中心城市之一的杭州,曾經(jīng)上下班高峰期堵車非常嚴(yán)重,而目前,受益于“城市大腦”,杭州交通效率不斷提高。依據(jù)公開的城市季度報告,在全國最擁堵城市排行榜上,杭州從2016年的第5名下降到今年第二季度的第57名。2018年9月,杭州云棲大會上,浙江省公安廳副廳長金志在現(xiàn)場宣布:杭州市“城市數(shù)據(jù)大腦”交通V2.0正式發(fā)布。金志表示,杭州城市大腦2.0將覆蓋主城區(qū)、余杭區(qū)、蕭山區(qū)共420平方公里,一年擴大28倍。接管1300個路口信號燈、接入4500路視頻,通過7大生命體征全面感知城市交通,并通過移動終端直接指揮杭州200余名交警。
截止到今天,阿里城市大腦已成為全球最大規(guī)模的人工智能公共系統(tǒng)之一,已覆蓋交通、安防、醫(yī)療、旅游、市政建設(shè)、城市規(guī)劃、工業(yè)、環(huán)境、政務(wù)民生等領(lǐng)域,為阿里也為產(chǎn)業(yè)界帶來了巨大的經(jīng)濟(jì)效益。這些場景中,交通、城市治理、政務(wù)民生是最具吸引力的場景。
阿里想緊緊抓住的是智慧城市領(lǐng)域的第一波創(chuàng)業(yè)者和研究者,而這種想法在其他廠商中間似乎不多見。雷鋒網(wǎng)注意到京東智能城市研究院的成立,引入在計算機、AI、自動化、仿真技術(shù)、城鄉(xiāng)規(guī)劃、視覺感知等方面的6位中國工程院院士,其城市計算平臺也在逐漸匯聚產(chǎn)業(yè)鏈上下游的垂直企業(yè)。同時,阿里云緊密與專業(yè)廠商進(jìn)行積極合作,對外宣布的包括浙大中控、銀江科技、浙江大華、圖盟科技等公司,以期望能夠?qū)⑵渥钚录夹g(shù)注入到傳統(tǒng)廠商的方案當(dāng)中。
趨勢四、了解客戶的需求才能夠有效落地
只有最切近用戶需求的應(yīng)用才能夠更有效的落地,任何不落地的AI技術(shù)和產(chǎn)品都是沒有辦法產(chǎn)生利潤的。2019年是70周年大慶之年,而2020年正是十三五的收官之年也是十四五的規(guī)劃之年,也許十四五的規(guī)劃在2019年就要開始了,對趨勢的準(zhǔn)確判斷將決定未來7年AI企業(yè)的命運,所謂運籌帷幄之中,決勝千里之外。
最近參加的論壇、演講、聚會、年會很多,也多了一些和用戶面對面的交流機會。以公共安全市場為例,傳統(tǒng)的視頻監(jiān)控系統(tǒng)解決了人盯人的問題,減少了現(xiàn)場的巡邏人員,解放了一部分警力。之后視頻監(jiān)控系統(tǒng)越來越智能,逐漸可以解答“車去了哪里了?”“你是誰?”諸如此類的問題,最早提出來智能應(yīng)用的起始年應(yīng)在2013年,大規(guī)模進(jìn)入試用的年份當(dāng)從2016年開始算起。
雖然人工智能技術(shù)、人臉識別技術(shù)最近顯得火熱,但實際上很早已經(jīng)得到廣泛應(yīng)用,卡口和電子警察是最早實現(xiàn)智能應(yīng)用的,第一個解決的就是車牌抓拍(典型的人工智能)。2011年之后各省市區(qū)逐漸建立了人臉靜態(tài)大庫,開啟了人臉識別的算法應(yīng)用,逐漸試水動態(tài)人臉識別算法,不過這個時候四大人臉獨角獸企業(yè)SKYY還沒有誕生或者剛剛起步,一些人臉識別的先驅(qū)企業(yè)推動了AI技術(shù)的應(yīng)用,不過比較令人失望的是大部分這些企業(yè)并沒有在AI熱浪中崛起,前期的巨額投資在現(xiàn)在看來肯定是要打折扣了。
新的AI企業(yè)崛起之后,更多的告訴用戶的是實驗室的數(shù)據(jù)、識別率,或者是世界大賽又拿了幾個世界第一,過度的宣傳或者鼓吹,造成用戶期望值的巨大落差,為什么我找了四家、五家世界第一的AI公司還是不能解決我的問題?這是一個誤區(qū),企業(yè)說的很好做的很差,2019年建議企業(yè)還是務(wù)實比較好,盡可能做出來的效果就像說出來的效果那般。其次數(shù)據(jù)安全、網(wǎng)絡(luò)安全也很重要,這個需要進(jìn)一步的探索和解決,需要重視,尤其是當(dāng)視頻專網(wǎng)延伸到社區(qū)之后,更加需要重視這個問題。
應(yīng)該怎么做?用戶有幾個建議。
首先就是平臺異構(gòu)?,F(xiàn)在的企業(yè),老死不相往來,排他性很強,總想獨霸一個市場。其次就是產(chǎn)品軟硬件一體化,把軟件固化在硬件中,列硬件參數(shù)控標(biāo),這樣導(dǎo)致用戶的機會成本很高,及時第二家公司免費提供產(chǎn)品和服務(wù),客戶依然要付出巨大的代價。尤其是大型項目的預(yù)算、決算流程涉及多個部門,這些因素都要考慮,即使是最終用戶也需要被監(jiān)督、被審核。最好的方法就是實現(xiàn)平臺異構(gòu)、互相兼容,多算法融合,共榮共生。
其次就是深挖行業(yè)深度應(yīng)用。目前大多數(shù)的應(yīng)用都屬于比較淺層次的、容易被滿足的需求。因地域性、環(huán)境、文化多從因素造成客戶的需求千差萬別,及時同一個廠家通過定制開發(fā)也會形成多個軟件版本,最終就出現(xiàn)了難共享、難擴容、難兼容的問題,即使采用了共同的國標(biāo)進(jìn)行系統(tǒng)設(shè)計,但最終的互聯(lián)互通只有親身經(jīng)理才能夠感同身受?;诖撕芏嗫蛻籼岢隽艘曨l云的解決方案,要求引入競爭機制,所有的廠商不管是硬件、算法、算力、數(shù)據(jù)都放在云端,每家都分配一定的比例,按照共同的標(biāo)準(zhǔn)建視頻云,由最終使用者決定用哪家的服務(wù)。以算法為例,引入競爭機制,如果平臺同時支持SKYY(商曠依云)、HDT(海大天)、云天勵飛的算法,每種算法都給推薦結(jié)果(TOP 3),由用戶決定采用哪種算法,久而久之,競爭機制出現(xiàn),優(yōu)勝劣汰,也有助于算法廠商提高自己的算法水平,這實際上也是一個平臺異構(gòu)的問題,也是深挖客戶需要的一個應(yīng)用場景。
數(shù)據(jù)共享和開放是趨勢。做過公共安全市場的讀者都知道,現(xiàn)實情況是AI領(lǐng)域應(yīng)用存在著多個專網(wǎng)(比如視頻專網(wǎng)、政務(wù)網(wǎng))和公網(wǎng)(比如互聯(lián)網(wǎng)),每個網(wǎng)中的數(shù)據(jù)都不同,網(wǎng)和網(wǎng)之間可能是隔離的、有邊界的,故而需要將硬件、軟件、數(shù)據(jù)實現(xiàn)三解耦,把原先錯綜復(fù)雜的數(shù)據(jù)進(jìn)行剝離、梳理清楚,之后再推進(jìn)數(shù)據(jù)共享,不管現(xiàn)狀如何,相信2-3年內(nèi)這種共享的障礙必將逐漸消除,對企業(yè)而言必須實現(xiàn)規(guī)劃好一旦數(shù)據(jù)打通后的系統(tǒng)架構(gòu)問題。
通過云化解決區(qū)域發(fā)展不均衡的問題。地域經(jīng)濟(jì)發(fā)展不均衡是普遍存在的,即使是在廣東省這樣經(jīng)濟(jì)發(fā)達(dá)省份,也存在粵東西北發(fā)展比較落后的情況。按照經(jīng)驗,城市級安防項目的建設(shè)通常由所在的地市區(qū)縣財政承擔(dān),那么如果統(tǒng)一規(guī)劃,勢必會有部分區(qū)域因為資金問題沒法建設(shè)最新的AI系統(tǒng)或引入最新的AI技術(shù),那么云化就是一種比較好的解決方案。通過建立數(shù)據(jù)服務(wù)器集群、GPU群,多個縣、市、區(qū)可以供用一個視頻云,按需申請、按需使用,如果全省、全市一片云的話,就可以由上級部門統(tǒng)一建設(shè)。順便補充說明的是市縣的財政決定視頻系統(tǒng)建設(shè)的規(guī)模,尤其是AI的投入,畢竟屬地責(zé)任在財政。目前來看廣州市、深圳市、杭州市、上海市都走在視頻云建設(shè)的前列。
用戶需求逐漸轉(zhuǎn)向精細(xì)化管控。比如發(fā)生群體性事件,有關(guān)部門希望能夠通過AI技術(shù)來識別到底是誰在表達(dá)訴求?是不是本地人?如果不是,背后是誰?第一時間要掌握,也可以同樣適用于醫(yī)鬧。另一類的精細(xì)化管控需求包括特定外籍人員精細(xì)化管控,我們都知道人臉識別技術(shù)在對有色人種識別的時候有著比較低的識別率,到底如何解決?造成了落地困難的問題。其它的精細(xì)化管控包括城市到底需要安裝多少只AI攝像機?如何布點更有效?安裝高度如何?財政支撐的上限在哪里?投資的盡頭在哪里?這些都需要精細(xì)化考量。
人防、物防、技防,那個更合適?以發(fā)達(dá)城市平安建設(shè)為例,每路攝像機平均投資7-8萬元,多采用5-6年BT模式建設(shè),算下來1.2+萬元/年/路,1000元/月/路,那么請一個安保人員一個月按5000元工資計算,那個更劃算?按照最新的AI投資測算,僅考慮算法每路視頻監(jiān)控的投資大約在1萬元,如果建設(shè)3萬路視頻監(jiān)控AI部分就要投資3億,如果同時考慮算法+服務(wù)器+后臺應(yīng)用,則投資成本可能高度3+萬元/路,這還是在新增深度應(yīng)用不足的情況下,如果引入更多的AI應(yīng)用,也許需要更多的錢。
好消息是2019年是PS行業(yè)信息化建設(shè)的關(guān)建年,AI企業(yè)還有很大的機會。2019年是視頻云大規(guī)模建設(shè)的一年,2018年之前已大量建設(shè)了基礎(chǔ)設(shè)施,之后就要充分挖掘視頻系統(tǒng)的潛力。
那么針對用戶的需求,推進(jìn)AI安防工程化落地有什么更好的解決方法嗎。合理的控制成本、確保交付的質(zhì)量、全面整合數(shù)據(jù)、精細(xì)化的深挖客戶的需求。多了解需求的場景,比如重點關(guān)注的晝伏夜出、同行人、特定區(qū)域/時間的計算等。構(gòu)建高效的計算框架,提供系統(tǒng)的識別率,了解當(dāng)前客戶的現(xiàn)狀解決系統(tǒng)的落地,否則都是空話。
趨勢五、大數(shù)據(jù)的開放和整合
在AI賦能安防的大背景下,主要應(yīng)用在計算機視覺,那么毫不夸張的講,未來的格局得攝像機者得天下、得攝像機的得數(shù)據(jù),這是對AI而言。我們都知道公共安全領(lǐng)域的有四偵:圖、刑、技、網(wǎng),四偵合一一直是努力的方向,并向合成作戰(zhàn)方向邁進(jìn)。制約數(shù)據(jù)共享和開放的因素一直都存在,故而警務(wù)大腦的商機若隱若現(xiàn),但機會只留給準(zhǔn)別好的人。最早看到商機的當(dāng)屬Huawei安平BG,他們的戰(zhàn)略就是“長期戰(zhàn)略投入,做深做透PS行業(yè)”。
城市級的視頻大數(shù)據(jù)一旦被充分挖掘,再整合多個維度的開放數(shù)據(jù),其潛力和前景都是值得提前布局的。
趨勢六、兩種模式取其一
在AI企業(yè)如何落地這個問題上,有兩個模式可以參考。
A模式:系統(tǒng)做大了就得做總包,做中標(biāo)人,這是阿里模式。以城市大腦為例,在2018年多采用單一來源方式招標(biāo),系統(tǒng)技術(shù)實在是太新了、太復(fù)雜了,很難找到第二家供應(yīng)商。
H模式:自己供設(shè)備、軟件和系統(tǒng),讓生態(tài)鏈企業(yè)去做,這是Huawei模式。這個前提是企業(yè)的產(chǎn)品要足夠好,可以被集成,也將是未來競爭最激烈的、多方博弈的市場。
還有第三種模式嗎?A+H模式,我們期待這樣的企業(yè)出現(xiàn),在傳統(tǒng)安防市場上曾經(jīng)出現(xiàn)過像Tyco、Siemens、Honeywell、JCI這樣的企業(yè),確實走的A+H模式,但貌似在中國都不太成功。
2019,未來市場預(yù)判
2019其實就是為2020年做準(zhǔn)備的。未來市場會出現(xiàn)各種的變局,這篇文章里我們僅探討幾個。
數(shù)字視網(wǎng)膜
中國工程院院士、中國計算機學(xué)會理事長高文早在2018年(或者更早)就提出了數(shù)字視網(wǎng)膜的概念,紐豪斯在雷鋒網(wǎng)舉辦的首屆中國人工智能安防峰會上聆聽了高文院士的演講,其后在多個場所多次聽到數(shù)字視網(wǎng)膜,其獨特的觀點和技術(shù)領(lǐng)先性值得深思和參考,而且數(shù)字視網(wǎng)膜和鵬程實驗室、深圳龍崗智能視聽研究院也有關(guān)聯(lián),這也是紐豪斯感興趣的。
根據(jù)雷鋒網(wǎng)的整理報告,數(shù)字視網(wǎng)膜分為傳統(tǒng)的高效視頻編碼和實時特征提取兩部分。高院士認(rèn)為現(xiàn)在的視頻監(jiān)控系統(tǒng),從一開始就面臨數(shù)據(jù)量太大、存儲量太大,查找數(shù)據(jù)不易等一系列挑戰(zhàn),這些挑戰(zhàn)可以歸納成三個問題:難存儲、難檢索、難識別。這種新型的數(shù)字視網(wǎng)膜可以被稱為慧眼,這種慧眼不僅能看,還能夠感知。如果整個社會均由這種慧眼構(gòu)造成,那系統(tǒng)會非常強大,智慧城市和公安公共視頻的處理也會變得更加得心應(yīng)手。
實際上承載數(shù)字視網(wǎng)膜的攝像頭能做兩件事:做好編碼,為后面的識別提取出需要的信息。如果把識別算法直接放在攝像機里,會存在問題。攝像機做的事應(yīng)該是提取特征,把后面可能用到的模式識別的特征提取出來。當(dāng)然,也不能用一個攝像機把人臉和汽車等所使用的具體系統(tǒng)的私用特征全部提取和傳輸,因為這些特征加在一起可能比原來的一個碼流還大,相當(dāng)于傳兩個碼流。
如何解決這個問題?用數(shù)字視網(wǎng)膜。實際上人的眼睛原理和數(shù)字視網(wǎng)膜很相似,我們看東西時傳給大腦的信息,實際上并不是具體地實打?qū)嵉奈矬w影像,而是視網(wǎng)膜給后腦傳輸了生物特征,在后腦完成。
數(shù)字視網(wǎng)膜與人的眼睛既具有影像重構(gòu)(精細(xì)編碼視覺內(nèi)容),又具備特征提?。嫦蜃R別理解)的功能。原則上這一部分把高效、監(jiān)控視頻編碼(視頻特征的緊湊表達(dá)),把這些特征集合起來變成緊湊地給它表達(dá)出來就叫做“緊湊表達(dá)”。它用了原來同一個碼流解決了兩件事,但前提是視頻編碼略微會有點損失,但它對識別結(jié)果的提升比不用這種方式要高很多倍。
數(shù)字視網(wǎng)膜包含了四項核心技術(shù):
?基于背景模型的場景視頻編碼
?視頻同步描述整個表達(dá)的記錄
?在保證性能的時候,用同一個碼流把視頻和特征原有編碼都傳出去
?云端的檢索,對視頻進(jìn)行更加合理的描述,以便用于搜索
數(shù)字視網(wǎng)膜的創(chuàng)新之處就是在傳統(tǒng)的視頻傳輸信號之上疊加了特征編碼信號,不管企業(yè)是否接受,這都是未來不可逆的發(fā)展趨勢,數(shù)字視網(wǎng)膜的落地需要標(biāo)準(zhǔn)化,而標(biāo)準(zhǔn)化和兩個機構(gòu)有關(guān):鵬程實驗室、深圳龍崗智能視聽研究院。
2017年12月22日,廣東省正式啟動建設(shè)首批4家廣東省實驗室,深圳網(wǎng)絡(luò)空間科學(xué)與技術(shù)廣東省實驗室就是其中之一。2018年1月19日,深圳市舉辦了實驗室籌備工作會議,召集國內(nèi)相關(guān)領(lǐng)域的權(quán)威專家院士開始籌建實驗室。3月31日,實驗室啟動大會在深圳市召開,中國工程院院士高文被聘為實驗室主任,鵬城實驗室正式對外公開亮相。實驗室整體規(guī)劃土地使用面積134萬平方米(即2000畝),建筑面積150萬平方米,一期建設(shè)用地規(guī)劃在南山區(qū)石壁龍片區(qū)。建設(shè)期間,實驗室啟動過渡場地位于大沙河創(chuàng)新走廊的核心發(fā)展片區(qū)——留仙洞戰(zhàn)略性新興產(chǎn)業(yè)基地萬科云城一期8棟,建筑面積5.3萬平方米。
紐豪斯通過官網(wǎng)了解到,鵬城實驗室以哈爾濱工業(yè)大學(xué)(深圳)為合作單位,協(xié)同北京大學(xué)深圳研究生院、清華大學(xué)深圳研究生院、南方科技大學(xué)、香港中文大學(xué)(深圳)、深圳大學(xué)、中國科學(xué)院深圳先進(jìn)技術(shù)研究院、華為、中興、騰訊、中國電子、國家超級計算深圳中心深圳云計算中心、中國航天、中國移動、中國電信、中國聯(lián)通等十余家高校、科研院所、企業(yè)等優(yōu)勢單位共建。目前設(shè)有網(wǎng)絡(luò)通信、先進(jìn)計算和網(wǎng)絡(luò)安全三個研究方向,分別由中國工程院劉韻潔院士、高文院士、方濱興院士任方向責(zé)任院士。
高文院士擔(dān)任主任,那就很有可能催成數(shù)字視網(wǎng)膜在鵬程實驗室的落地。根據(jù)最新消息2019 年 1 月 23 日下午,鵬城實驗室人工智能國際研發(fā)中心揭牌儀式在深圳市福田區(qū)深港協(xié)同創(chuàng)新中心舉行。作為鵬城實驗室參與全球人工智能研發(fā)的橋頭堡,首批3個高水平國際化項目已全面入駐。項目分別涉及智慧金融理論研究(沈向洋負(fù)責(zé))、智慧金融應(yīng)用研究(楊強負(fù)責(zé))以及自主健康研究(Ramesh Jain負(fù)責(zé))。
在鵬程實驗室成立之前的2017年7月26日,深圳市龍崗區(qū)政府與北京大學(xué)數(shù)字視頻編解碼技術(shù)國家工程實驗室、中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟,在深圳市舉行深圳龍崗智能視聽研究院簽約暨揭牌儀式。北京大學(xué)數(shù)字視頻編解碼技術(shù)國家工程實驗室和中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟由高文院士牽頭組建,是自主創(chuàng)新的AVS標(biāo)準(zhǔn)的核心推動力量,也是新一代人工智能規(guī)劃的積極參與者之一。而這個試聽實驗室也和高文院士有關(guān)。
兩大機構(gòu)的聯(lián)系人是李革博士,國家特聘專家,北京大學(xué)數(shù)字視頻編碼技術(shù)國家工程實驗室深圳分室負(fù)責(zé)人、鵬城實驗室人工智能研究中心主任。美國奧本大學(xué)電子工程博士學(xué)位、美國加州大學(xué)戴維斯分校電子工程博士后。相信在李博士的聯(lián)系下,數(shù)字視網(wǎng)膜的標(biāo)準(zhǔn)有可能在兩大機構(gòu)的助推下實現(xiàn)落地。另據(jù)悉深圳龍崗智能視聽研究院投資設(shè)立深圳龍崗智能視聽技術(shù)有限公司,副院長是安欣賞,領(lǐng)英資料顯示安畢業(yè)于大連理工大學(xué),畢業(yè)后加入華為公司,服務(wù)超過16年。
多維數(shù)據(jù)融合
數(shù)字視網(wǎng)膜解決了視頻流的傳輸和特征結(jié)構(gòu)化問題,獲取了如此之多的結(jié)構(gòu)化視頻數(shù)據(jù)之后,就需要將視頻數(shù)據(jù)和其它數(shù)據(jù)進(jìn)行碰撞,也就是多維數(shù)據(jù)融合。
以人臉識別為例,如果攝像機采集到了一個人臉,但是系統(tǒng)是無法告知“他是誰?”,這需要一個龐大的基礎(chǔ)人臉庫(比如身份證大庫)進(jìn)行1:N的比對,這個人臉庫就屬于多維數(shù)據(jù)融合的典型應(yīng)用。又好比說,系統(tǒng)采集到一個手機的MAC地址需要和一張人臉進(jìn)行匹配,也是一種數(shù)據(jù)的融合。又好比將一條門禁刷卡記錄和人臉照片結(jié)合起來。
現(xiàn)實的情況將會更為復(fù)雜,城市治理的核心就是人的動態(tài),捕捉人動態(tài)最好的方法就是利用遍布城市的攝像機。那么未來如何打破壁壘,將攝像機采集的數(shù)據(jù)和其它多維數(shù)據(jù)進(jìn)行碰撞、融合,就很有必要成立一個大數(shù)據(jù)協(xié)調(diào)機構(gòu)來完成,也可能需要一網(wǎng)多域的管理方式進(jìn)行管理。
其它落地因素
影響2019年AI項目落地的因素很多,還有幾個因素是需要考慮的。
?根據(jù)主流觀點,攝像機視頻前端預(yù)計1-2年(2019-20)內(nèi)不會大規(guī)模增長,這是財政負(fù)擔(dān)越來越重,好鋼用在刀刃上,但AI攝像機在整個攝像機中的占比將會有較大幅度的提升
?大規(guī)模的建設(shè)需要等待視頻監(jiān)控十四五規(guī)劃,相信2021-25期間肯定會有大規(guī)模突破
?廣大的鄉(xiāng)村和鄉(xiāng)鎮(zhèn),偷雞摸狗的依然存在,隨著城市化進(jìn)程的推進(jìn),鄉(xiāng)村的空心化、老齡化日趨嚴(yán)重,人防越來越難了,而利用AI技術(shù)提高鄉(xiāng)村和鄉(xiāng)鎮(zhèn)的安全性已經(jīng)迫在眉睫
?盡管財政負(fù)擔(dān)很重,2019年AI依然會保持大規(guī)模投入
?市場整合力度會越來越強,互聯(lián)網(wǎng)+停車場、互聯(lián)網(wǎng)+門禁、智慧社區(qū)的標(biāo)準(zhǔn)都在推進(jìn)制定中
以上并不全是紐豪斯的觀點,部分觀點也是來自于第三方的溝通。
2019,AI企業(yè)一定不會一家獨大、獨占區(qū)域市場,一切才剛剛開始。