根據(jù)“中科院之聲”的消息,近日,中國(guó)科學(xué)院自動(dòng)化研究所智能感知與計(jì)算研究中心在生成對(duì)抗網(wǎng)絡(luò)基礎(chǔ)上,提出高保真度的姿態(tài)不變模型(High Fidelity Pose Invariant Model,HF-PIM)來(lái)克服人臉識(shí)別任務(wù)中最為經(jīng)典的姿態(tài)不一致問(wèn)題。
為解決先前工作中的某些限制,論文作者在實(shí)驗(yàn)中引入了一種能反映三維人臉模型和二維的人臉圖像之間點(diǎn)到點(diǎn)的關(guān)聯(lián)稠密關(guān)聯(lián)場(chǎng),讓網(wǎng)絡(luò)能夠在二維圖像的指導(dǎo)下學(xué)習(xí)到隱含的三維人臉信息;并設(shè)計(jì)了一種全新的紋理扭曲(warping)過(guò)程,可以有效地把人臉紋理映射到圖像域,同時(shí)又可以最大程度地保持輸入的語(yǔ)義信息;以及提出了一種對(duì)抗殘差字典學(xué)習(xí)過(guò)程,從而可以在不依賴(lài)三維數(shù)據(jù)的情況下更有效地學(xué)習(xí)人臉紋理特征。
實(shí)驗(yàn)結(jié)果表明,該方法在基準(zhǔn)數(shù)據(jù)集上的表現(xiàn)的視覺(jué)效果和定量性能指標(biāo)都優(yōu)于目前最好的基于對(duì)抗生成網(wǎng)絡(luò)的方法。此外,HF-PIM所支持的生成圖像分辨率也在原有方法的基礎(chǔ)上提升了一倍。該論文被神經(jīng)信息處理系統(tǒng)大會(huì)(NIPS)所收錄。
據(jù)了解,生成對(duì)抗網(wǎng)絡(luò)的提出是繼深度神經(jīng)網(wǎng)絡(luò)之后的一大革命性新進(jìn)展,已被《麻省理工科技評(píng)論》評(píng)為2018年“全球十大突破性技術(shù)”,通過(guò)兩個(gè)AI系統(tǒng)的競(jìng)爭(zhēng)對(duì)抗,極大化加速機(jī)器學(xué)習(xí)的過(guò)程,進(jìn)而賦予機(jī)器智能過(guò)去從未企及的想像力。