AI檢測AI：“矛”更利還是“盾”更堅(jiān)

2024-08-16 18:35:23來源：科技日報

近年來，人工智能（AI）技術(shù)推動生產(chǎn)力快速發(fā)展，但同時也因技術(shù)濫用導(dǎo)致各種問題。

為監(jiān)督AI技術(shù)使用，如今市面上不乏各類用于檢測AI生成內(nèi)容（AIGC）的工具，如普林斯頓大學(xué)學(xué)生開發(fā)的GPTZero、斯坦福大學(xué)研究團(tuán)隊(duì)推出的DetectGPT等。我國一些研究團(tuán)隊(duì)也陸續(xù)發(fā)布各類檢測工具，如西湖大學(xué)文本智能實(shí)驗(yàn)室研發(fā)的Fast-DetectGPT。

人類的創(chuàng)作與AIGC之間存在哪些差異？AI檢測工具如何根據(jù)差異進(jìn)行識別？AI檢測工具如何應(yīng)對越來越聰明的大模型？帶著這些問題，記者采訪了有關(guān)專家。

2024世界人工智能大會暨人工智能全球治理高級別會議上，觀眾在參觀由人工智能生成的圖片

AI創(chuàng)作套路化明顯

“雖然大模型在不斷發(fā)展迭代，但到目前為止，AIGC與人類的創(chuàng)作在用詞用語、邏輯語法等方面依舊存在明顯區(qū)別。”Fast-DetectGPT研發(fā)者之一、西湖大學(xué)文本智能實(shí)驗(yàn)室博士生鮑光勝說。

在用詞用語上，AIGC有相對固定的偏好。“不難發(fā)現(xiàn)，一些詞語會反復(fù)在語段中出現(xiàn)。”鮑光勝舉例說，有研究發(fā)現(xiàn)，大模型應(yīng)用于英語學(xué)術(shù)論文寫作時，“delve”（深入研究）一詞的使用頻率大大提高，這是因?yàn)榇竽Ｐ土?xí)慣用這個詞對語句進(jìn)行潤色修改。

在邏輯語法上，AIGC慣常使用的一些語法搭配方式，在人類創(chuàng)作中可能并不常見。“受模型建模的影響，AIGC有相對固定的行文邏輯和表述模式，且這些模式會不斷地被重復(fù)。人類在行文上則更為靈活，沒有固定套路。”鮑光勝說。

北京大學(xué)信息管理系師生比較了AI生成與學(xué)者撰寫的中文論文摘要。研究結(jié)果同樣顯示，AI生成的摘要具有較高同質(zhì)性和較強(qiáng)寫作邏輯性，并慣用歸納總結(jié)等學(xué)術(shù)話語體系；學(xué)者撰寫的摘要則具有顯著個性化差異，使用凸顯實(shí)際含義的搭配較多，并常用與國家政策密切相關(guān)的詞語。

哈爾濱工業(yè)大學(xué)一名研究生向記者講述了他使用大模型的實(shí)際感受：“當(dāng)我給大模型提供一些材料讓它擴(kuò)寫，它每次都用相同的套路——把給定的材料拆解開，分為若干點(diǎn)論述。總體來說感覺它寫得比較‘僵’。”

AIGC相對套路化的創(chuàng)作，可能會影響人類的用語習(xí)慣。“隨著越來越多人用AI創(chuàng)作或潤色文字，人類會受到潛移默化的影響，這或?qū)⒂绊懻麄€社會對語言的使用。”鮑光勝說。

三種路徑識別文本

如何準(zhǔn)確識別AI生成內(nèi)容？鮑光勝介紹，目前主要有三種技術(shù)路徑進(jìn)行檢測，分別是模型訓(xùn)練分類器法（也被稱為監(jiān)督分類器法）、零樣本分類器法、文本水印法。“三種檢測方法本質(zhì)上都是利用AI檢測AI，且各有優(yōu)劣。”鮑光勝說。

模型訓(xùn)練分類器法，首先要收集大量人類創(chuàng)作內(nèi)容與AIGC，然后以此為基礎(chǔ)訓(xùn)練一個能區(qū)分兩類內(nèi)容的分類器。“這是目前被廣泛使用的一種方法，但缺點(diǎn)較為明顯。”鮑光勝解釋，用于訓(xùn)練分類器的數(shù)據(jù)有限，很難覆蓋所有類型和語言的文本。分類器在訓(xùn)練數(shù)據(jù)覆蓋的文本領(lǐng)域或語言上檢測準(zhǔn)確率較高，反之準(zhǔn)確率則較低。而且，模型訓(xùn)練往往需要較高成本，數(shù)據(jù)規(guī)模越大，訓(xùn)練成本越高。

相比之下，零樣本分類器法不需要對機(jī)器進(jìn)行訓(xùn)練，也無需收集數(shù)據(jù)。它利用已訓(xùn)練好的大模型，抽取語言模型生成文本的特征，據(jù)此來區(qū)別人類與機(jī)器。“似然函數(shù)是零樣本檢測法中比較常用的基準(zhǔn)之一，它可以簡單理解為一段文本在某個模型的建模分布中出現(xiàn)的概率。概率是一種特征，不同的概率體現(xiàn)了人類創(chuàng)作內(nèi)容與AIGC的差異。”鮑光勝進(jìn)一步解釋，“零樣本分類通過綜合考慮多種函數(shù)特征來區(qū)分人類創(chuàng)作內(nèi)容與AIGC。”

如今，很多大語言模型幾乎覆蓋了互聯(lián)網(wǎng)上的全部數(shù)據(jù)。因此，相比于模型訓(xùn)練分類器，零樣本分類器在不同領(lǐng)域、不同語言的文本上表現(xiàn)較為一致。

不過，零樣本分類器也存在明顯缺點(diǎn)。一方面，現(xiàn)有零樣本分類器依賴生成文本的源語言模型進(jìn)行檢測，這意味著如果是未知源模型生成的文本，分類器就無法準(zhǔn)確檢測。另一方面，為提高檢測準(zhǔn)確率，零樣本分類器往往需要多次調(diào)用模型，這增加了模型的使用成本和計算時間。

“文本水印法則是一類‘主動方法’。區(qū)別于前兩類方法，它不是檢測已生成的文本，而是在AI生成文本時加入水印。人類雖然看不出這些水印，但卻能通過技術(shù)手段檢測出來。”鮑光勝說，文本水印法的準(zhǔn)確率較高，但缺點(diǎn)在于水印可能被人為弱化甚至移除。此外，對于無法訪問模型內(nèi)部結(jié)構(gòu)的大語言模型，技術(shù)人員可能無法在生成內(nèi)容時成功加入水印。

檢測技術(shù)需不斷改進(jìn)

“未來，我們要不斷更新、完善現(xiàn)有技術(shù)，力爭實(shí)現(xiàn)快速、準(zhǔn)確、低成本檢測，在大模型這把‘矛’越來越鋒利的同時，讓檢測技術(shù)這面‘盾’更為堅(jiān)固。”鮑光勝說。

記者了解到，為提升檢測準(zhǔn)確性，目前市面上的商用AI檢測軟件大多融合了多種技術(shù)手段。國內(nèi)外研究團(tuán)隊(duì)也在進(jìn)一步完善相關(guān)技術(shù)。

例如，西湖大學(xué)文本智能實(shí)驗(yàn)室團(tuán)隊(duì)在DetectGPT基礎(chǔ)上研發(fā)的Fast-DetectGPT模型，可提升AI檢測準(zhǔn)確性，縮短檢測時間。“Fast-DetectGPT與其他零樣本分類器原理一致。其中一個創(chuàng)新點(diǎn)在于，我們提出通過條件概率曲率指標(biāo)進(jìn)行檢測。”鮑光勝說，“與DetectGPT相比，F(xiàn)ast-DetectGPT在速度上提升340倍，在檢測準(zhǔn)確率上相對提升約75%。”

對AI檢測AI的前景，有兩種截然不同的觀點(diǎn)。一種觀點(diǎn)認(rèn)為，未來AIGC將會與人類創(chuàng)作極為相似，以至于檢測工具無法判別。還有一種觀點(diǎn)認(rèn)為，隨著技術(shù)發(fā)展，檢測技術(shù)或?qū)②s超大模型技術(shù)，實(shí)現(xiàn)對AIGC的有效識別。

“目前，無論是AI生成的文字、圖片還是視頻，都在技術(shù)可識別的范疇之內(nèi)。相較于文字，圖片和視頻甚至可以直接被專業(yè)人士肉眼識別。期待未來通過大模型技術(shù)的不斷進(jìn)步，推動檢測技術(shù)發(fā)展。”鮑光勝說。

關(guān)鍵詞：

責(zé)任編輯：孫知兵

免責(zé)聲明：本文僅代表作者個人觀點(diǎn)，與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實(shí)相關(guān)內(nèi)容。
如有問題，請聯(lián)系我們！

AI檢測AI：“矛”更利還是“盾”更堅(jiān)2024-08-16
第三屆世界元宇宙大會將在武漢舉行2024-08-16
國家統(tǒng)計局：數(shù)字消費(fèi)、綠色消費(fèi)、健康消費(fèi)2024-08-16
星空有約｜我國科研人員發(fā)現(xiàn)：星系中心黑洞2024-08-16
你好！新職業(yè)｜工業(yè)互聯(lián)網(wǎng)運(yùn)維員：為企業(yè)“2024-08-16
孔鳳春再續(xù)華章：躍居美麗修行品牌榜第6，2024-08-16
國內(nèi)單體規(guī)模最大的XPO工藝丙烷脫氫裝置開2024-08-16
傲風(fēng)A4電競椅重磅上市，一桌滿足你的所有需2024-08-16
三百年信譽(yù)加持！ATFX聯(lián)手保險巨擘倫敦勞合2024-08-16
大眾汽車集團(tuán)移動出行業(yè)務(wù)2024年上半年實(shí)現(xiàn)2024-08-16
火到國外！KIDNOW凱蒂諾“真科技&甄成2024-08-16
軍地電視臺攜手國內(nèi)外新媒體，共謀國際傳播2024-08-16
專業(yè)票據(jù)大品牌深度數(shù)科：依托商業(yè)承兌匯票2024-08-16
專業(yè)票據(jù)大品牌深度數(shù)科解讀：當(dāng)企業(yè)破產(chǎn)時2024-08-16
游資風(fēng)云：劉喬航三周后再度亮劍，精準(zhǔn)出擊2024-08-16
淘寶運(yùn)動會：不止有奧運(yùn)同款，更有同款奧運(yùn)2024-08-16
恒榮匯彬：AI眼鏡引領(lǐng)未來智能生活2024-08-16
京沈高鐵穿越“中華5000年文明曙光”2024-08-16
洪水退去吉林“鳥叔”重整“鳥類天堂”2024-08-16
美中宜和&禧月閣攜手藝術(shù)家賈偉在蟹島2024-08-16
上海自貿(mào)區(qū)“聯(lián)動創(chuàng)新區(qū)”方案出爐2024-08-16
海外人才寧德行：以僑為“橋” 拓展馬來西2024-08-16
財政部公布關(guān)于新會計法施行時間的說明2024-08-16
第二屆京津冀綠色發(fā)展大會在河北崇禮開幕2024-08-16
知名設(shè)計師澳門COCO榮獲2024年第十八屆中國2024-08-16
粵北樂昌“致富果”黃金柰李促農(nóng)戶增收助2024-08-16
瓊臺青少年乒乓球交流研學(xué)活動在海口啟動2024-08-16
廣西重點(diǎn)面向東盟等打造跨境旅游線路2024-08-16
西寧草莓榮獲“中國氣候好產(chǎn)品”認(rèn)證2024-08-16
中國變速抽水蓄能機(jī)組自主研制取得重大突破2024-08-16

精彩推薦

從烏魯木齊到阿斯塔納中國姑娘2000公里的跨國騎行

閱讀排行

第三屆世界元宇宙大會將在武漢舉行
上一篇2024-08-16 18:32:31

關(guān)于我們　-　聯(lián)系方式　-　版權(quán)聲明　-　招聘信息　-　友鏈交換　-　網(wǎng)站統(tǒng)計

未經(jīng)過本站允許請勿將本站內(nèi)容傳播或復(fù)制業(yè)務(wù)QQ：3 31 986 683

AI檢測AI：“矛”更利還是“盾”更堅(jiān)

精彩推薦

從烏魯木齊到阿斯塔納 中國姑娘2000公里的跨國騎行

閱讀排行

推薦閱讀

從烏魯木齊到阿斯塔納中國姑娘2000公里的跨國騎行