杭電自動化學(xué)院博一學(xué)生鄭錦凱的一項(xiàng)研究成果,通過可遷移鄰域發(fā)現(xiàn)算法,在跨域場景下的步態(tài)識別精度上,大大超過了目前普遍使用的聚類賦偽標(biāo)簽識別方法,有望在刑偵破案、尋找丟失兒童等領(lǐng)域一顯身手。
鄭錦凱的論文名為《TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain Gait Recognition》,發(fā)表在不久前召開的ISCAS(IEEE International Symposium on Circuits and Systems)這一國際學(xué)術(shù)會議上,并在IEEE 多媒體系統(tǒng)與應(yīng)用技術(shù)專委會(IEEE MSA-TC)年度會議上做口頭報(bào)告,榮獲2021年度IEEE MSA-TC最佳論文提名獎(2021 MSA-TC Best Paper Award - Honorable Mention)。
據(jù)了解,目前普遍使用的深度學(xué)習(xí)算法依賴數(shù)據(jù)標(biāo)注,換言之,通過步態(tài)識別誰是誰,首先得在數(shù)據(jù)庫里知道具體的步態(tài)是怎樣的。這意味著,標(biāo)注的準(zhǔn)確性和數(shù)量直接影響著最終的識別精度。在實(shí)際應(yīng)用中,人們往往受限于這種既昂貴又費(fèi)時(shí)費(fèi)力的數(shù)據(jù)標(biāo)注上。如果數(shù)據(jù)庫里沒有具體人的標(biāo)注數(shù)據(jù),那怎么辦?
為此,鄭錦凱提出可遷移鄰域發(fā)現(xiàn)算法,首先找出高置信度樣本,并通過最近鄰算法找出這些樣本的領(lǐng)域樣本,之后通過損失函數(shù)拉近高置信度樣本與其領(lǐng)域樣本在特征空間中的距離,采用從易到難、循序漸進(jìn)的方式更新深度學(xué)習(xí)模型。整個(gè)過程由近到遠(yuǎn)、由易到難、由已知到未知,逐漸識別“哪些步態(tài)是誰的”,從而鎖定目標(biāo)人物。
什么是可遷移鄰域發(fā)現(xiàn)算法?鄭錦凱打了個(gè)比方:“如果想讓一個(gè)小孩識別國內(nèi)的動物種類,你會給他一些動物圖片和對應(yīng)的動物名字。通過學(xué)習(xí),小孩能認(rèn)出許多動物。你可能覺得還不夠,希望小孩能識別國外的動物,于是給小孩一些國外動物的圖片,讓他把屬于同一物種的圖片都放到一起進(jìn)行分類。”
鄭錦凱進(jìn)一步解釋道,由于小孩之前學(xué)習(xí)了很多國內(nèi)的動物,一開始會比較順利,能夠挑選出一張或者幾張長得最像老虎的放一組、像獅子的放一組,等等。接著,小孩可能會繼續(xù)尋找那些還長得比較像老虎、獅子等的圖片,直到他再也找不到自己學(xué)過的圖片之后,他發(fā)現(xiàn)剩余那些之前沒見過的圖片里,有好幾張長得很類似,于是猜測它們屬于一個(gè)新物種。小孩可能同時(shí)發(fā)現(xiàn)好幾個(gè)新物種,把它們分別放一組,接著繼續(xù)尋找和這些新物種長得很像的圖片。
“可遷移鄰域發(fā)現(xiàn)算法模擬了上述一過程,直到所有圖片都被找完為止。”鄭錦凱說,“可遷移鄰域發(fā)現(xiàn)算法與傳統(tǒng)聚類賦偽標(biāo)簽識別不一樣,有望在步態(tài)識別領(lǐng)域拓展新的應(yīng)用。
鄭錦凱來自杭電自動化學(xué)院智能信息處理實(shí)驗(yàn)室,該實(shí)驗(yàn)室由顏成鋼教授領(lǐng)銜,與美國北卡羅來納大學(xué)教堂山分校、中國科學(xué)院、清華大學(xué)、京東AI研究院等國內(nèi)外多家科研院所有長期密切的合作,近年來培養(yǎng)出多名優(yōu)秀學(xué)生,多人多次在國際重要學(xué)術(shù)會議上獲得最佳論文獎。鄭錦凱是智能信息處理實(shí)驗(yàn)室培養(yǎng)的第四位碩博連讀研究生,導(dǎo)師為張繼勇教授。