婷婷免费高清视频在线观看,亚洲午夜在线一区,免费高清日本中文,精品一区久久,久久不射影院,玖玖国产精品,性感大胸美女比基尼

寫稿能“查重” 西湖大學團隊研發(fā)AI生成文本檢測模型

  • 中國新聞網(wǎng)
  • 2025-03-13 17:48:10
“你的稿子是不是由AI創(chuàng)作的,通過我們的大模型就可以判斷出來。”近日,西湖大學終身教授、自然語言處理實驗室負責人張岳接受中新網(wǎng)專訪時表示,在人工智能大模型應用熱潮下,他們團隊設計了一種“無監(jiān)督算法”,將實現(xiàn)開放領域的AI生成文本檢測。

近日,張岳接受中新網(wǎng)專訪?!〔艿?攝

隨著科技創(chuàng)新的不斷推進,AI正成為新生創(chuàng)作力量。

張岳也試著用不同的人工智能大模型搜索并整理部分工作素材,這之中他也時常遇到“AI幻覺”問題,“我需要一篇文獻,在搜索時,AI給出了相關推薦,里面標注了作者、標題,甚至是摘要,但當我上網(wǎng)查找時,卻發(fā)現(xiàn)文章并不存在,這就是典型的幻覺問題”。

這種“虛構(gòu)”現(xiàn)象被稱為“AI幻覺”,即AI在遇到不熟悉或超出其知識范圍的問題時,會編造出難以辨明真假的細節(jié),生成與事實相悖的答案。

這也是近期用戶與大模型交互時可能遇到的問題。

張岳注意到,在教育領域,若本科生的畢業(yè)設計大量使用AI撰寫,可能會出現(xiàn)“AI幻覺”問題,引用不存在的參考文獻,“這不僅無法真實反映學生的水平,還會傳播錯誤知識”。

而在新聞領域,如果AI生成的虛假新聞被發(fā)表,可能對輿情造成負面影響。

“因此,檢測文本是否由AI生成至關重要。”張岳解釋道,如何確保AI生成內(nèi)容的可控性,首先需要解決一個基礎問題——準確判斷一個文本是否由AI撰寫,這被稱為AI生成文本的自動檢測。

如何對AI生成文本進行檢測?

在張岳看來,傳統(tǒng)方法,如有監(jiān)督的機器學習算法,存在顯著局限。它們依賴于收集的人寫和機器寫的訓練數(shù)據(jù),但只能準確判斷訓練數(shù)據(jù)中包含的模型或領域文本。對于新的模型或領域,如生物醫(yī)藥論文,其性能會大幅下降。

為了克服這一局限,張岳團隊研究并設計了一種無監(jiān)督的算法模型。

無監(jiān)督算法是機器學習中的一種方法,它不需要預先標記的數(shù)據(jù),而是通過算法自動發(fā)現(xiàn)數(shù)據(jù)中的模式、結(jié)構(gòu)和關聯(lián)。

張岳說:“AI在遣詞造句時,會根據(jù)已出現(xiàn)的詞匯選擇概率較高或經(jīng)驗風險較低的詞。而人類則先確定想表達的內(nèi)容,再將其翻譯成句子,不受統(tǒng)計分布的限制。”

利用這一本質(zhì)差別,這一研發(fā)模型可以對任何文本進行概率判斷和估算,從而判斷其是否由AI撰寫。

目前,張岳團隊已經(jīng)展示了Demo版本,并吸引了大量用戶。同時,他們也在與一些實際應用場景合作,進行簡單部署。

“請寫一篇描寫西湖的文章。”在現(xiàn)場,張岳團隊成員鮑光勝在一個人工智能大模型中輸入了這個請求。在生成文本后,他將內(nèi)容拷貝在Demo版本的應用中。作者注意到“AI創(chuàng)作率”結(jié)果顯示為“90%”。

未來,隨著該模型的推廣,它將有助于解決教育領域、新聞領域等實際問題。

關鍵詞:

分享到:
?
  • 至少輸入5個字符
  • 表情

熱門資訊

 

聯(lián)系郵箱:317 493 128 @qq.com 法律支持:廣東海新律師事務所 劉海濤 律師

粵ICP備2022077823號未經(jīng)授權不得鏡像、轉(zhuǎn)載、摘抄本站內(nèi)容,違者必究!Copyright 2016 IGDZC. All Rights Reserved

廣東之窗 版權所有