人臉交換是一種深度偽裝技術(shù),利用人工智能和機(jī)器學(xué)習(xí),它可以將現(xiàn)有媒體中的人臉提取出來(lái), 并將其替換為其他人的臉部特征,目前其已被MixBooth和SnapChat之類(lèi)的應(yīng)用程序推廣開(kāi)來(lái),盡管其底層技術(shù)使復(fù)雜的圖像編輯成為可能,但它同時(shí)也引起了人們對(duì)潛在誤用或?yàn)E用的擔(dān)憂。
不同的組織已經(jīng)編譯了可操縱的媒體來(lái)支持人臉交換檢測(cè)方法的發(fā)展,但截止目前,以發(fā)布的樣本數(shù)量相對(duì)較少或者過(guò)于人工化,基于此,SenseTime 研究院的研究人員與新加坡南洋理工大學(xué)達(dá)成合作,共同開(kāi)發(fā)了一種大規(guī)模人臉檢測(cè)數(shù)據(jù)集——“DeeperForensics-1.0”,研究人員表示該數(shù)據(jù)集是同類(lèi)數(shù)據(jù)集中最大的一個(gè),擁有超過(guò)6萬(wàn)個(gè)視頻,,其中包含大約1,760萬(wàn)幀。
根據(jù)研究人員的說(shuō)法,“DeeperForensics-1.0”中所有的源視頻都經(jīng)過(guò)精挑細(xì)選,它們的質(zhì)量和多樣性都很好。從表面來(lái)看,由于它們更接近現(xiàn)實(shí)世界中真實(shí)的檢測(cè)場(chǎng)景,所以它們比其他數(shù)據(jù)集更為真實(shí)。而且它們還包含壓縮、模糊和傳輸偽像,這些偽影與野外環(huán)境發(fā)現(xiàn)的是一致的。
為了構(gòu)建“DeeperForensics-1.0”,研究人員收集了來(lái)自26個(gè)不同國(guó)家的100名男女演員的面部數(shù)據(jù),他們的年齡20歲到45歲不等,所有人都被要求在9種燈光條件下轉(zhuǎn)動(dòng)頭,自然地用53種以上的表情進(jìn)行表達(dá)。他們通過(guò)AI框架(DeepFake Variational AutoEncoder簡(jiǎn)稱DF-VAE)來(lái)運(yùn)行這些視頻,并使用1,000個(gè)YouTube視頻作為目標(biāo)視頻,100個(gè)演員的每一個(gè)面孔都被交換到10個(gè)目標(biāo)上。他們故意用35種不同的方式扭曲每個(gè)視頻來(lái)模擬真實(shí)世界的場(chǎng)景,從而使得最終的數(shù)據(jù)集包含了5萬(wàn)個(gè)未經(jīng)處理的視頻和1萬(wàn)個(gè)經(jīng)過(guò)處理的視頻。
“我們發(fā)現(xiàn),在建立高質(zhì)量數(shù)據(jù)集的過(guò)程中,源人臉比目標(biāo)人臉扮演著更為關(guān)鍵的角色,”研究人員在一份預(yù)先打印的論文中詳細(xì)介紹了他們的工作。“特別是源面部的表情、姿勢(shì)和光照條件應(yīng)該更加豐富,以實(shí)現(xiàn)可靠的面部交換?!?/p>
研究人員還在“DeeperForensics-1.0”中創(chuàng)建了他們所謂的“隱藏”測(cè)試集——一組精心挑選的400個(gè)視頻,以便更好地模擬真實(shí)場(chǎng)景中的假視頻。策劃這組視頻的過(guò)程包括收集由未知的換臉?lè)椒ㄉ傻膫卧煲曨l,然后用真實(shí)場(chǎng)景中常見(jiàn)的失真掩蓋它們,最后只選擇在100個(gè)用戶研究中選擇至少欺騙了50個(gè)人類(lèi)觀察者的50個(gè)視頻。
為了評(píng)估“DeeperForensics-1.0”與其他公開(kāi)數(shù)據(jù)集的質(zhì)量,研究人員讓100名計(jì)算機(jī)視覺(jué)專(zhuān)家對(duì)其中包含的視頻子集的質(zhì)量進(jìn)行排名。報(bào)告稱,與FaceForensics++、Celeb-DF等其他流行的Deepfake檢測(cè)語(yǔ)料相比,“DeeperForensics-1.0”在真實(shí)性方面領(lǐng)先。
在未來(lái)的工作中,研究團(tuán)隊(duì)打算逐步擴(kuò)展DeeperForensics,并與研究界合作,共同確定面部偽造檢測(cè)方法的評(píng)估指標(biāo)。
從全球范圍來(lái)看,全球與深度偽造的斗爭(zhēng)似乎正在加劇。去年夏天,DARPA的Media Forensics計(jì)劃的成員測(cè)試了一種原型系統(tǒng),該系統(tǒng)可以通過(guò)查找不自然的閃爍等提示來(lái)自動(dòng)檢測(cè)AI生成的視頻;初創(chuàng)公司Truepic在去年7月融資了800萬(wàn)美元,正在嘗試使用深度偽造的“檢測(cè)即服務(wù)”業(yè)務(wù)模型; 在2019年12月,F(xiàn)acebook與微軟、學(xué)者合作伙伴共同發(fā)起了Deepfake檢測(cè)挑戰(zhàn)賽,該挑戰(zhàn)賽將提供數(shù)百萬(wàn)美元的贈(zèng)款和獎(jiǎng)勵(lì),以刺激Deepfake檢測(cè)系統(tǒng)的開(kāi)發(fā)。
(本文編譯自外網(wǎng),內(nèi)容尚有增減)