AI檢測AI:“矛”更利還是“盾”更堅
為監督AI技術使用,如今市面上不乏各類用于檢測AI生成內容(AIGC)的工具,如普林斯頓大學學生開發的GPTZero、斯坦福大學研究團隊推出的DetectGPT等。我國一些研究團隊也陸續發布各類檢測工具,如西湖大學文本智能實驗室研發的Fast-DetectGPT。
人類的創作與AIGC之間存在哪些差異?AI檢測工具如何根據差異進行識別?AI檢測工具如何應對越來越聰明的大模型?帶著這些問題,記者采訪了有關專家。
2024世界人工智能大會暨人工智能全球治理高級別會議上,觀眾在參觀由人工智能生成的圖片
AI創作套路化明顯
“雖然大模型在不斷發展迭代,但到目前為止,AIGC與人類的創作在用詞用語、邏輯語法等方面依舊存在明顯區別。”Fast-DetectGPT研發者之一、西湖大學文本智能實驗室博士生鮑光勝說。
在用詞用語上,AIGC有相對固定的偏好。“不難發現,一些詞語會反復在語段中出現。”鮑光勝舉例說,有研究發現,大模型應用于英語學術論文寫作時,“delve”(深入研究)一詞的使用頻率大大提高,這是因為大模型習慣用這個詞對語句進行潤色修改。
在邏輯語法上,AIGC慣常使用的一些語法搭配方式,在人類創作中可能并不常見。“受模型建模的影響,AIGC有相對固定的行文邏輯和表述模式,且這些模式會不斷地被重復。人類在行文上則更為靈活,沒有固定套路。”鮑光勝說。
北京大學信息管理系師生比較了AI生成與學者撰寫的中文論文摘要。研究結果同樣顯示,AI生成的摘要具有較高同質性和較強寫作邏輯性,并慣用歸納總結等學術話語體系;學者撰寫的摘要則具有顯著個性化差異,使用凸顯實際含義的搭配較多,并常用與國家政策密切相關的詞語。
哈爾濱工業大學一名研究生向記者講述了他使用大模型的實際感受:“當我給大模型提供一些材料讓它擴寫,它每次都用相同的套路——把給定的材料拆解開,分為若干點論述。總體來說感覺它寫得比較‘僵’。”
AIGC相對套路化的創作,可能會影響人類的用語習慣。“隨著越來越多人用AI創作或潤色文字,人類會受到潛移默化的影響,這或將影響整個社會對語言的使用。”鮑光勝說。
三種路徑識別文本
如何準確識別AI生成內容?鮑光勝介紹,目前主要有三種技術路徑進行檢測,分別是模型訓練分類器法(也被稱為監督分類器法)、零樣本分類器法、文本水印法。“三種檢測方法本質上都是利用AI檢測AI,且各有優劣。”鮑光勝說。
模型訓練分類器法,首先要收集大量人類創作內容與AIGC,然后以此為基礎訓練一個能區分兩類內容的分類器。“這是目前被廣泛使用的一種方法,但缺點較為明顯。”鮑光勝解釋,用于訓練分類器的數據有限,很難覆蓋所有類型和語言的文本。分類器在訓練數據覆蓋的文本領域或語言上檢測準確率較高,反之準確率則較低。而且,模型訓練往往需要較高成本,數據規模越大,訓練成本越高。
相比之下,零樣本分類器法不需要對機器進行訓練,也無需收集數據。它利用已訓練好的大模型,抽取語言模型生成文本的特征,據此來區別人類與機器。“似然函數是零樣本檢測法中比較常用的基準之一,它可以簡單理解為一段文本在某個模型的建模分布中出現的概率。概率是一種特征,不同的概率體現了人類創作內容與AIGC的差異。”鮑光勝進一步解釋,“零樣本分類通過綜合考慮多種函數特征來區分人類創作內容與AIGC。”
如今,很多大語言模型幾乎覆蓋了互聯網上的全部數據。因此,相比于模型訓練分類器,零樣本分類器在不同領域、不同語言的文本上表現較為一致。
不過,零樣本分類器也存在明顯缺點。一方面,現有零樣本分類器依賴生成文本的源語言模型進行檢測,這意味著如果是未知源模型生成的文本,分類器就無法準確檢測。另一方面,為提高檢測準確率,零樣本分類器往往需要多次調用模型,這增加了模型的使用成本和計算時間。
“文本水印法則是一類‘主動方法’。區別于前兩類方法,它不是檢測已生成的文本,而是在AI生成文本時加入水印。人類雖然看不出這些水印,但卻能通過技術手段檢測出來。”鮑光勝說,文本水印法的準確率較高,但缺點在于水印可能被人為弱化甚至移除。此外,對于無法訪問模型內部結構的大語言模型,技術人員可能無法在生成內容時成功加入水印。
檢測技術需不斷改進
“未來,我們要不斷更新、完善現有技術,力爭實現快速、準確、低成本檢測,在大模型這把‘矛’越來越鋒利的同時,讓檢測技術這面‘盾’更為堅固。”鮑光勝說。
記者了解到,為提升檢測準確性,目前市面上的商用AI檢測軟件大多融合了多種技術手段。國內外研究團隊也在進一步完善相關技術。
例如,西湖大學文本智能實驗室團隊在DetectGPT基礎上研發的Fast-DetectGPT模型,可提升AI檢測準確性,縮短檢測時間。“Fast-DetectGPT與其他零樣本分類器原理一致。其中一個創新點在于,我們提出通過條件概率曲率指標進行檢測。”鮑光勝說,“與DetectGPT相比,Fast-DetectGPT在速度上提升340倍,在檢測準確率上相對提升約75%。”
對AI檢測AI的前景,有兩種截然不同的觀點。一種觀點認為,未來AIGC將會與人類創作極為相似,以至于檢測工具無法判別。還有一種觀點認為,隨著技術發展,檢測技術或將趕超大模型技術,實現對AIGC的有效識別。
“目前,無論是AI生成的文字、圖片還是視頻,都在技術可識別的范疇之內。相較于文字,圖片和視頻甚至可以直接被專業人士肉眼識別。期待未來通過大模型技術的不斷進步,推動檢測技術發展。”鮑光勝說。
關鍵詞:
責任編輯:孫知兵
免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!
- AI檢測AI:“矛”更利還是“盾”更堅2024-08-16
- 第三屆世界元宇宙大會將在武漢舉行2024-08-16
- 國家統計局:數字消費、綠色消費、健康消費2024-08-16
- 星空有約|我國科研人員發現:星系中心黑洞2024-08-16
- 你好!新職業|工業互聯網運維員:為企業“2024-08-16
- 孔鳳春再續華章:躍居美麗修行品牌榜第6,2024-08-16
- 國內單體規模最大的XPO工藝丙烷脫氫裝置開2024-08-16
- 傲風A4電競椅重磅上市,一桌滿足你的所有需2024-08-16
- 三百年信譽加持!ATFX聯手保險巨擘倫敦勞合2024-08-16
- 大眾汽車集團移動出行業務2024年上半年實現2024-08-16
- 火到國外!KIDNOW凱蒂諾“真科技&甄成2024-08-16
- 軍地電視臺攜手國內外新媒體,共謀國際傳播2024-08-16
- 專業票據大品牌深度數科:依托商業承兌匯票2024-08-16
- 專業票據大品牌深度數科解讀:當企業破產時2024-08-16
- 游資風云:劉喬航三周后再度亮劍,精準出擊2024-08-16
- 淘寶運動會:不止有奧運同款,更有同款奧運2024-08-16
- 恒榮匯彬:AI眼鏡引領未來智能生活2024-08-16
- 京沈高鐵穿越“中華5000年文明曙光”2024-08-16
- 洪水退去吉林“鳥叔”重整“鳥類天堂”2024-08-16
- 美中宜和&禧月閣攜手藝術家賈偉在蟹島2024-08-16
- 上海自貿區“聯動創新區”方案出爐2024-08-16
- 海外人才寧德行:以僑為“橋” 拓展馬來西2024-08-16
- 財政部公布關于新會計法施行時間的說明2024-08-16
- 第二屆京津冀綠色發展大會在河北崇禮開幕2024-08-16
- 知名設計師澳門COCO榮獲2024年第十八屆中國2024-08-16
- 粵北樂昌“致富果”黃金柰李促農戶增收 助2024-08-16
- 瓊臺青少年乒乓球交流研學活動在海口啟動2024-08-16
- 廣西重點面向東盟等打造跨境旅游線路2024-08-16
- 西寧草莓榮獲“中國氣候好產品”認證2024-08-16
- 中國變速抽水蓄能機組自主研制取得重大突破2024-08-16
精彩推薦
- 上半年出貨量增長13.2% 手機市場保持增長態勢
- 電力統一大市場建設取得新成效 新能源...
- 從烏魯木齊到阿斯塔納 中國姑娘2000公...
- eπ007增程版上市交付 全系13.16萬起
- 8月末社會融資規模存量為368.61萬億元,...
- 貸款平穩增長,“組合拳”持續發力——8...
- Mysteel早讀:黑色期貨夜盤飄紅,寶武10...
- 招商蛇口更換掌舵人:“老將”蔣鐵峰升任...
- 搭檔超20年合伙人反目,董事長把副董事長...
- 中國探月工程首任首席科學家:下一步我...
- 好消息!奉賢4座口袋公園改造提升工程即...
- cf體驗服資格是永久的嗎(cf體驗版)
- 李家超昨日下午視察災情,稱香港特區政...
- 存內控獨立性不足等問題,證監會對華西...
- 美網決賽對陣出爐!2號種子拒絕爆冷,2-...