深度合成技術(shù)是進步還是危害?

發(fā)布日期:2022-03-04 11:39


近年來,視頻換臉、合成語音、修復影像、虛擬數(shù)字人等越來越頻繁地出現(xiàn)在社交娛樂、影視制作、教育、廣告營銷等領(lǐng)域,發(fā)展出多元化的商業(yè)應用。這些應用的背后,是深度合成技術(shù)的廣泛應用。據(jù)統(tǒng)計,2021年新發(fā)布的深度合成視頻的數(shù)量較2017年已增長10倍以上。而“元宇宙”等新商業(yè)思維的提出,也為深度合成提供了更廣闊的應用場景。

在此環(huán)境下,國內(nèi)相關(guān)技術(shù)領(lǐng)域公司是否迎來了一個全新的發(fā)展機遇?然而在技術(shù)和應用發(fā)展的同時,從深度合成技術(shù)產(chǎn)生之初就如影隨形的負面新聞與爭議卻從未停止。在深度合成激發(fā)創(chuàng)新內(nèi)容的同時,也帶來了新的威脅。早在2017年,就是一位名叫“deepfakes”的用戶在美國reddit網(wǎng)站上分享了篡改人臉的色情視頻,將深度合成技術(shù)帶到了大眾面前。近日,美國聯(lián)邦調(diào)查局警告企業(yè)小心不法人士利用虛擬會議工具,發(fā)動俗稱變臉詐騙的商業(yè)電郵詐騙。行業(yè)內(nèi)應如何治理“深度偽造”問題?AI反“深度偽造”檢測技術(shù)的發(fā)展前景如何?


近年來由于深度學習等人工智能技術(shù)的迅猛發(fā)展,催生了類似deepfake的一系列技術(shù),能夠以假亂真地制造各種視頻,正面的效應毋庸多說,負面的影響更是劇烈,除了為不法分子的詐騙帶來新的手段,更難處理的是倫理沖擊,例如話題中提到的換臉色情視頻,滿足了一部分人的需求,又似乎對當事人形成說不清道不明的負面形象。人們普遍認為需要對此類技術(shù)進行應對,不管是基于技術(shù)層面進行反向檢測還是基于法律法規(guī)以及社會道德。尷尬的是,相比之下AI反“深度偽造”檢測技術(shù)則呈現(xiàn)“魔高一丈道高一尺”的局面。目前的深度偽造問題并不在于無法在技術(shù)上完美檢測。因此問題的實質(zhì),是社會如何形成對此類生成物的規(guī)制。


DeepFake又稱作AI換臉技術(shù)

可是有一個不好的消息,目前相當比例的學者普遍形成技術(shù)宿命論的共識,其大致意思是技術(shù)其實是有自己獨立生命和繁衍機制的“類生命”。表面上技術(shù)都是源自人類的需求,由人類研究開發(fā)而成 ,屬于人類文明的附屬品。但事實上一項技術(shù)的誕生、采納、普及、落后到滅亡 ,反過來對人類社會進行著深刻的塑造——僅舉一例,我們現(xiàn)在日常說的話、行為模式、作息、價值觀點等等與現(xiàn)代互聯(lián)網(wǎng)、手機等技術(shù)早就脫不開干系。在這個意義上,技術(shù)和人類其實是共生關(guān)系。


當代互聯(lián)網(wǎng)現(xiàn)狀

所以對于“行業(yè)內(nèi)應如何治理‘深度偽造’”這個問題,它其實是無解的。近幾十年來,互聯(lián)網(wǎng)、手機乃至很多社交平臺不可避免地介入人們的生活,少數(shù)早期抵制的人除了自己堅決不采納而成為離群點之外,人類社會作為整體,對于新技術(shù)并沒有抵抗能力。放到“深度偽造”技術(shù)也是一樣,它會和“聲音合成”、“人臉識別”、“基因檢測”問題一樣,一起構(gòu)成新人類的生活模式。

當然,悲觀的遠景并不意味著我們不可以主動出擊做一些事情。例如,在社交媒體上出現(xiàn)的類似內(nèi)容,要求做標注,與現(xiàn)在的盜版內(nèi)容在網(wǎng)絡(luò)上的治理類似。另外,內(nèi)容偽造本身基于技術(shù)創(chuàng)新,對等地引入?yún)^(qū)塊鏈等技術(shù)手段進行群體驗證也有機會一定程度上對偽造內(nèi)容進行制衡。當然我說的是在承認新技術(shù)的“類生命”基礎(chǔ)上,塑造新的人類生存生活模式,而不是“消滅”,或者“治理”。


對于相關(guān)技術(shù)公司是否迎來機遇,這個答案是肯定的,因為有應用需求驅(qū)動因素的存在。現(xiàn)在元宇宙當中肯定有很多人對人臉等內(nèi)容合成有著很大的需求。如今也有人也在做相關(guān)技術(shù)研究,因為需求大,那么就會有更多人去投入這一塊的研究,所以這肯定是個機會。


 深度合成技術(shù)也稱作“深度偽造技術(shù)”


從技術(shù)本身來說,這個是沒有問題的。包括自己也在做一些人臉合成的研究,因為這個研究是很有意義的。首先從技術(shù)的進步來說,我們主要是研究如何讓合成的東西更高分辨率、更逼真,畢竟真實的人臉反應變化是很難分析的。在技術(shù)本身來說是沒有任何問題,但關(guān)鍵在于,有人把這些技術(shù)應用在欺騙上和去篡改色情視頻。所以,我認為問題不是出在技術(shù)身上,而是如何去使用。未來可能需要通過制定相關(guān)的法律去解決這個問題,明確規(guī)定哪些使用是違法的。當然,行業(yè)內(nèi)也是可以有一些準則。比如基因編輯,單純技術(shù)上來講是沒有任何問題的,但是如果利用在人類身上,那就是違反了倫理。因此,我覺得還是需要相應的行業(yè)規(guī)范甚至法律的規(guī)范去約束這些技術(shù)的應用,這個是比較重要的。


深度偽造檢測產(chǎn)品應運而生

有人研究如何合成篡改,相應地,也會有人研究如何去檢測這個篡改。他們兩者的關(guān)系如矛和盾一般,所謂道高一尺,魔高一丈。但總體而言,檢測深度合成技術(shù)可能相對滯后于深度合成技術(shù)的發(fā)展。畢竟一個處在被動地位,一個處在主動地位。如同黑客攻擊與反攻擊一樣,總是先出現(xiàn)了某種新的深度合成技術(shù),然后我們才會去思考如何去檢測這種新的篡改技術(shù)。但是這兩種技術(shù)總是相輔相成、互相促進的,合成技術(shù)的繁榮發(fā)展肯定也會促進檢測技術(shù)的發(fā)展。


和任何金融創(chuàng)新一樣,新技術(shù)的監(jiān)管是一場永恒的攻防對抗博弈,往往是道高一尺魔高一丈,如這個深度合成技術(shù)在提供服務(wù)的同時,也會產(chǎn)生多方面的風險。除了深度偽造的風險外,還包括自動生成內(nèi)容文本、圖像或者視頻帶來的版權(quán)和著作權(quán)的侵權(quán)風險,信息安全和隱私泄漏風險以及敏感內(nèi)容的風險。
因“深度合成”衍生出各種風險

簡單提一下,對于技術(shù)提供方而言,應從底層技術(shù)開始推進相關(guān)標準的建立,在算法上保證計算模型的公平性;并建議在未來出臺的相關(guān)法規(guī)中,則應強制要求服務(wù)提供方對那些深度合成的內(nèi)容進行標注。

“彈科技”是廣東省人工智能產(chǎn)業(yè)協(xié)會與廣東衛(wèi)視《財經(jīng)郎眼》圍繞科技熱點、行業(yè)趨勢,邀請各領(lǐng)域的意見領(lǐng)袖進行點評的互動欄目。本欄目致力于為推動科技創(chuàng)新、科技向善提出真知灼見。