TA已推薦 69 款游戲
TA已推薦 59 款游戲
AIGC相對(duì)套路化的創(chuàng)作,可能會(huì)影響人類(lèi)的用語(yǔ)習(xí)慣?!半S著越來(lái)越多人用AI創(chuàng)作或潤(rùn)色文字,人類(lèi)會(huì)受到潛移默化的影響,這或?qū)⒂绊懻麄€(gè)社會(huì)對(duì)語(yǔ)言的使用?!滨U光勝說(shuō)。
模型訓(xùn)練分類(lèi)器法,首先要收集大量人類(lèi)創(chuàng)作內(nèi)容與AIGC,然后以此為基礎(chǔ)訓(xùn)練一個(gè)能區(qū)分兩類(lèi)內(nèi)容的分類(lèi)器。“這是目前被廣泛使用的一種方法,但缺點(diǎn)較為明顯?!滨U光勝解釋?zhuān)糜谟?xùn)練分類(lèi)器的數(shù)據(jù)有限,很難覆蓋所有類(lèi)型和語(yǔ)言的文本。分類(lèi)器在訓(xùn)練數(shù)據(jù)覆蓋的文本領(lǐng)域或語(yǔ)言上檢測(cè)準(zhǔn)確率較高,反之準(zhǔn)確率則較低。而且,模型訓(xùn)練往往需要較高成本,數(shù)據(jù)規(guī)模越大,訓(xùn)練成本越高。
例如,西湖大學(xué)文本智能實(shí)驗(yàn)室團(tuán)隊(duì)在DetectGPT基礎(chǔ)上研發(fā)的Fast-DetectGPT模型,可提升AI檢測(cè)準(zhǔn)確性,縮短檢測(cè)時(shí)間?!癋ast-DetectGPT與其他零樣本分類(lèi)器原理一致。其中一個(gè)創(chuàng)新點(diǎn)在于,我們提出通過(guò)條件概率曲率指標(biāo)進(jìn)行檢測(cè)?!滨U光勝說(shuō),“與DetectGPT相比,F(xiàn)ast-DetectGPT在速度上提升340倍,在檢測(cè)準(zhǔn)確率上相對(duì)提升約75%?!?/p>
哈爾濱工業(yè)大學(xué)一名研究生向記者講述了他使用大模型的實(shí)際感受:“當(dāng)我給大模型提供一些材料讓它擴(kuò)寫(xiě),它每次都用相同的套路——把給定的材料拆解開(kāi),分為若干點(diǎn)論述??傮w來(lái)說(shuō)感覺(jué)它寫(xiě)得比較‘僵’?!?/p>
相比之下,零樣本分類(lèi)器法不需要對(duì)機(jī)器進(jìn)行訓(xùn)練,也無(wú)需收集數(shù)據(jù)。它利用已訓(xùn)練好的大模型,抽取語(yǔ)言模型生成文本的特征,據(jù)此來(lái)區(qū)別人類(lèi)與機(jī)器?!八迫缓瘮?shù)是零樣本檢測(cè)法中比較常用的基準(zhǔn)之一,它可以簡(jiǎn)單理解為一段文本在某個(gè)模型的建模分布中出現(xiàn)的概率。概率是一種特征,不同的概率體現(xiàn)了人類(lèi)創(chuàng)作內(nèi)容與AIGC的差異?!滨U光勝進(jìn)一步解釋?zhuān)傲銟颖痉诸?lèi)通過(guò)綜合考慮多種函數(shù)特征來(lái)區(qū)分人類(lèi)創(chuàng)作內(nèi)容與AIGC?!?/p>
北京大學(xué)信息管理系師生比較了AI生成與學(xué)者撰寫(xiě)的中文論文摘要。研究結(jié)果同樣顯示,AI生成的摘要具有較高同質(zhì)性和較強(qiáng)寫(xiě)作邏輯性,并慣用歸納總結(jié)等學(xué)術(shù)話語(yǔ)體系;學(xué)者撰寫(xiě)的摘要?jiǎng)t具有顯著個(gè)性化差異,使用凸顯實(shí)際含義的搭配較多,并常用與國(guó)家政策密切相關(guān)的詞語(yǔ)。
“文本水印法則是一類(lèi)‘主動(dòng)方法’。區(qū)別于前兩類(lèi)方法,它不是檢測(cè)已生成的文本,而是在AI生成文本時(shí)加入水印。人類(lèi)雖然看不出這些水印,但卻能通過(guò)技術(shù)手段檢測(cè)出來(lái)。”鮑光勝說(shuō),文本水印法的準(zhǔn)確率較高,但缺點(diǎn)在于水印可能被人為弱化甚至移除。此外,對(duì)于無(wú)法訪問(wèn)模型內(nèi)部結(jié)構(gòu)的大語(yǔ)言模型,技術(shù)人員可能無(wú)法在生成內(nèi)容時(shí)成功加入水印。
如今,很多大語(yǔ)言模型幾乎覆蓋了互聯(lián)網(wǎng)上的全部數(shù)據(jù)。因此,相比于模型訓(xùn)練分類(lèi)器,零樣本分類(lèi)器在不同領(lǐng)域、不同語(yǔ)言的文本上表現(xiàn)較為一致。
博奥官方网站人類(lèi)的創(chuàng)作與AIGC之間存在哪些差異?AI檢測(cè)工具如何根據(jù)差異進(jìn)行識(shí)別?AI檢測(cè)工具如何應(yīng)對(duì)越來(lái)越聰明的大模型?帶著這些問(wèn)題,記者采訪了有關(guān)專(zhuān)家。
“雖然大模型在不斷發(fā)展迭代,但到目前為止,AIGC與人類(lèi)的創(chuàng)作在用詞用語(yǔ)、邏輯語(yǔ)法等方面依舊存在明顯區(qū)別?!盕ast-DetectGPT研發(fā)者之一、西湖大學(xué)文本智能實(shí)驗(yàn)室博士生鮑光勝說(shuō)。
記者了解到,為提升檢測(cè)準(zhǔn)確性,目前市面上的商用AI檢測(cè)軟件大多融合了多種技術(shù)手段。國(guó)內(nèi)外研究團(tuán)隊(duì)也在進(jìn)一步完善相關(guān)技術(shù)。
對(duì)AI檢測(cè)AI的前景,有兩種截然不同的觀點(diǎn)。一種觀點(diǎn)認(rèn)為,未來(lái)AIGC將會(huì)與人類(lèi)創(chuàng)作極為相似,以至于檢測(cè)工具無(wú)法判別。還有一種觀點(diǎn)認(rèn)為,隨著技術(shù)發(fā)展,檢測(cè)技術(shù)或?qū)②s超大模型技術(shù),實(shí)現(xiàn)對(duì)AIGC的有效識(shí)別。
不過(guò),零樣本分類(lèi)器也存在明顯缺點(diǎn)。一方面,現(xiàn)有零樣本分類(lèi)器依賴(lài)生成文本的源語(yǔ)言模型進(jìn)行檢測(cè),這意味著如果是未知源模型生成的文本,分類(lèi)器就無(wú)法準(zhǔn)確檢測(cè)。另一方面,為提高檢測(cè)準(zhǔn)確率,零樣本分類(lèi)器往往需要多次調(diào)用模型,這增加了模型的使用成本和計(jì)算時(shí)間。
在用詞用語(yǔ)上,AIGC有相對(duì)固定的偏好。“不難發(fā)現(xiàn),一些詞語(yǔ)會(huì)反復(fù)在語(yǔ)段中出現(xiàn)?!滨U光勝舉例說(shuō),有研究發(fā)現(xiàn),大模型應(yīng)用于英語(yǔ)學(xué)術(shù)論文寫(xiě)作時(shí),“delve”(深入研究)一詞的使用頻率大大提高,這是因?yàn)榇竽P土?xí)慣用這個(gè)詞對(duì)語(yǔ)句進(jìn)行潤(rùn)色修改。
在邏輯語(yǔ)法上,AIGC慣常使用的一些語(yǔ)法搭配方式,在人類(lèi)創(chuàng)作中可能并不常見(jiàn)?!笆苣P徒5挠绊?,AIGC有相對(duì)固定的行文邏輯和表述模式,且這些模式會(huì)不斷地被重復(fù)。人類(lèi)在行文上則更為靈活,沒(méi)有固定套路。”鮑光勝說(shuō)。
“未來(lái),我們要不斷更新、完善現(xiàn)有技術(shù),力爭(zhēng)實(shí)現(xiàn)快速、準(zhǔn)確、低成本檢測(cè),在大模型這把‘矛’越來(lái)越鋒利的同時(shí),讓檢測(cè)技術(shù)這面‘盾’更為堅(jiān)固?!滨U光勝說(shuō)。
如何準(zhǔn)確識(shí)別AI生成內(nèi)容?鮑光勝介紹,目前主要有三種技術(shù)路徑進(jìn)行檢測(cè),分別是模型訓(xùn)練分類(lèi)器法(也被稱(chēng)為監(jiān)督分類(lèi)器法)、零樣本分類(lèi)器法、文本水印法?!叭N檢測(cè)方法本質(zhì)上都是利用AI檢測(cè)AI,且各有優(yōu)劣?!滨U光勝說(shuō)。
...TA已推薦 589 款游戲
游戲版本 V7.4.6 | 大小 26.97M |
系統(tǒng)要求 安卓8.9 | 更新時(shí)間 2024-09-24 04:17:45 |
語(yǔ)言 中文 | 開(kāi)發(fā)商 |
適齡范圍 12+ |
修復(fù)bug
9.7
5.1
7.3
1.2
7.5
5.2
不一樣的好游清單
帶你發(fā)現(xiàn)更多有意思的新游戲
聯(lián)系我們意見(jiàn)反饋隱私政策侵權(quán)投訴防沉迷須知
本公司產(chǎn)品適合10周歲以上玩家使用未成年人家長(zhǎng)監(jiān)護(hù)
抵制不良游戲 拒絕盜版游戲 注意自我保護(hù) 謹(jǐn)防受騙上當(dāng)
適度游戲益腦 沉迷游戲傷身 合理安排時(shí)間 享受健康生活
ICP證:ICP備65911906號(hào)-1網(wǎng)站地圖
? 2009 - 2024 http://pbpjfwe.cn All Rights Reserved.
1.27W人評(píng)價(jià)