您的位置:首頁 >科技 >

AI“模型崩潰”風險需警惕

2024-09-25 17:55:54    來源:科技日報

從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。

“模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出。

多家外媒報道稱,這不僅是數據科學家需要擔心的技術問題,如果不加控制,“模型崩潰”可能會對企業、技術和整個數字生態系統產生深遠影響。天津大學自然語言處理實驗室負責人熊德意教授在接受記者采訪時,從專業角度對“模型崩潰”進行了解讀。

“模型崩潰”是怎么回事

大多數AI模型,比如GPT-4,都是通過大量數據進行訓練的,其中大部分數據來自互聯網。最初,這些數據是由人類生成的,反映了人類語言、行為和文化的多樣性和復雜性。AI從這些數據中學習,并用它來生成新內容。

然而,當AI在網絡上搜索新數據來訓練下一代模型時,AI很可能會吸收一些自己生成的內容,從而形成反饋循環,其中一個AI的輸出成為另一個AI的輸入。當生成式AI用自己的內容進行訓練時,其輸出也會偏離現實。這就像多次復制一份文件,每個版本都會丟失一些原始細節,最終得到的是一個模糊的、不那么準確的結果。

美國《紐約時報》報道稱,當AI脫離人類輸入內容時,其輸出的質量和多樣性會下降。

熊德意解讀稱:“真實的人類語言數據,其分布通常符合齊普夫定律,即詞頻與詞的排序成反比關系。齊普夫定律揭示了人類語言數據存在長尾現象,即存在大量的低頻且多樣化的內容。”

熊德意進一步解釋道,由于存在近似采樣等錯誤,在模型生成的數據中,真實分布的長尾現象逐漸消失,模型生成數據的分布逐漸收斂至與真實分布不一致的分布,多樣性降低,導致“模型崩潰”。

AI自我“蠶食”是壞事嗎

對于“模型崩潰”,美國《The Week》雜志近日刊文評論稱,這意味著AI正在自我“蠶食”。

熊德意認為,伴隨著這一現象的出現,模型生成數據在后續模型迭代訓練中占比越高,后續模型丟失真實數據的信息就會越多,模型訓練就更加困難。

乍一看,“模型崩潰”在當前似乎還是一個僅需要AI研究人員在實驗室中擔心的小眾問題,但其影響將是深遠而長久的。

美國《大西洋月刊》刊文指出,為了開發更先進的AI產品,科技巨頭可能不得不向程序提供合成數據,即AI系統生成的模擬數據。然而,由于一些生成式AI的輸出充斥著偏見、虛假信息和荒謬內容,這些會傳遞到AI模型的下一版本中。

美國《福布斯》雜志報道稱,“模型崩潰”還可能會加劇AI中的偏見和不平等問題。

不過,這并不意味著所有合成數據都是不好的。《紐約時報》表示,在某些情況下,合成數據可以幫助AI學習。例如,當使用大型AI模型的輸出訓練較小的模型時,或者當可以驗證正確答案時,比如數學問題的解決方案或國際象棋、圍棋等游戲的最佳策略。

AI正在占領互聯網嗎

訓練新AI模型的問題可能凸顯出一個更大的挑戰。《科學美國人》雜志表示,AI內容正在占領互聯網,大型語言模型生成的文本正充斥著數百個網站。與人工創作的內容相比,AI內容的創作速度更快,數量也更大。

OpenAI首席執行官薩姆·奧特曼今年2月曾表示,該公司每天生成約1000億個單詞,相當于100萬本小說的文本,其中有一大部分會流入互聯網。

互聯網上大量的AI內容,包括機器人發布的推文、荒謬的圖片和虛假評論,引發了一種更為消極的觀念。《福布斯》雜志稱,“死亡互聯網理論”認為,互聯網上的大部分流量、帖子和用戶都已被機器人和AI生成的內容所取代,人類不再能決定互聯網的方向。這一觀念最初只在網絡論壇上流傳,但最近卻獲得了更多關注。

幸運的是,專家們表示,“死亡互聯網理論”尚未成為現實。《福布斯》雜志指出,絕大多數廣為流傳的帖子,包括一些深刻的觀點、犀利的語言、敏銳的觀察,以及在新背景下對新生事物的定義等內容,都不是AI生成的。

不過,熊德意仍強調:“隨著大模型的廣泛應用,AI合成數據在互聯網數據中的占比可能會越來越高,大量低質量的AI合成數據,不僅會使后續采用互聯網數據訓練的模型出現一定程度的‘模型崩潰’,而且也會對社會形成負面影響,比如生成的錯誤信息對部分人群形成誤導等。因此,AI生成內容不僅是一個技術問題,同時也是社會問題,需要從安全治理與AI技術雙重角度進行有效應對。”( 張佳欣)

標簽:

精彩閱讀

城鄉基礎設施網絡越織越密

高水平開放為服務貿易添動力

未來三天南方雨勢減弱 27日起冷空氣入侵我國

全國推廣普通話宣傳周重點活動在喀什舉辦

走進河北正定國家乒乓球訓練基地 一所乒乓球學校的發展足跡

今年黃河上中游重點水庫聯合排沙調度結束 水庫排沙減淤效果顯著

黃河流域兩項國家計量比對項目實施 保障生態監測準確可靠

云南建立干部調研報備電子管理平臺

用歌聲唱響民族復興豪情壯志

江西以需求為導向提升老年人幸福感

合肥市“同心之旅”統戰文化體驗線路發布

湖南株洲加快構建科技、產業、金融協同創新生態

河北廊坊發揮區位優勢,創新消費場景 深挖“文”資源 做足“旅”文章

國家計劃對六家大型商業銀行增加核心一級資本

安徽肥西發展苗木花卉產業 “顏值”變“產值” 花開富農家

從“等風來”到“乘風起” 江蘇文旅消費大省這樣煉成

國家計劃對六家大型商業銀行增資

湖州何以“最江南”

中國人民銀行調降政策利率20個基點

2024查干湖環湖馬拉松鳴槍開賽,中國運動員包攬男女子冠軍

518km真續航 東風風神L7 EV上市售10.99萬起

數字化革新:豐巢洗護如何重塑高品質洗護服務標準

相約絲路巴楚 共享奔跑盛會

曉廬凱悅選酒店啟動發布酒會暨“金秋滿悅”品牌之夜

半導體領域并購持續升溫 有利于產業高質量發展

“智改數轉”賦能制造業 燈塔工廠打造競爭新優勢

聚焦“強人工智能” 加快四大維度升級

數字化如何鍛造特鋼“六最”產品?

半導體行業有望邁入新一輪增長周期

推動超算與人工智能融合發展

精細化監管互聯網廣告

歐盟建立人工智能工廠提升創新競爭力

北斗產業邁入規模應用新階段

互聯網如何讓公益更長久

9月23日外媒科學網站摘要:植物可能具有“智慧”

中外洞穴科學家對貴州雙河洞開展聯合科考

基因分析反駁了復活節島“生態自殺”假說

新技術可快速測出兒童白血病的基因組異常

我國特色航天營養保障體系建立 未來“太空餐桌”更豐富

相當于地球磁場80多萬倍 我國創造世界水冷磁體技術新高峰

“AI+”助力服務業數智化轉型 培育數字經濟發展新動能

北斗導航系統再添雙星,將開展新技術試驗

10家銀行授信萬億助力北京亦莊產業創新發展

兩個亞洲第一“能源重器”攜手上崗(經濟新方位·重大工程一線)

青春華章|“就按這個年輕人的意見辦!”

14國記者參觀全球首個萬噸級鑄造3D打印智能工廠 直呼“沒想到”

我國穩態強磁場刷新水冷磁體世界紀錄

杜氏肌營養不良癥關鍵機制揭示

DNA編碼化學庫新技術助推藥物研發

自制“橡皮泥”可讀取人體電信號

五大極具潛力的太陽能技術突破

到2050年耐藥細菌或致3900萬人喪生

五大極具潛力的太陽能技術突破

到2050年耐藥細菌或致3900萬人喪生

景順長城基金龔麗麗:積極布局新寬基產品 發力特色化服務

紅利主題基金持續回撤 紅利指數觸底企穩

左側布局嘗到甜頭 基金搶灘港股創新藥板塊

私募最新成績單出爐 債券策略業績明顯回落

嘉實基金運用固有資金自購2億元旗下中證A500ETF

農銀匯理基金經理左騰飛:堅守真紅利和優質成長板塊

近一周270只基金分紅

消費電子重歸景氣 基金經理“高看一眼”智能穿戴

重倉股“陣地戰”效果欠佳 有基金輕倉“打游擊”逆襲

興義世界地質公園揭牌 填補三疊紀地質遺跡研究空白

前8月海南對東盟進出口額同比增近八成

國家發改委:“兩新”工作持續激發需求潛力 不斷拉動投資增長

全球24城市長(代表)將聚杭州 探討城市治理與可持續發展

薌潮劇社成立90周年:薌潮澎湃向未來

暴雨籠罩海南島 23日強降水天氣持續

西藏環巴松措國際山地自行車越野賽將于9月29日舉行

研究報告:民營企業研發費用與研發強度持續增長

“以舊換新”帶動消費快速增長 8月新能源汽車零售量環比大增17% 京東平臺五類電器增速...

機器滿屋跑還帶攝像頭 掃地機器人攝像功能引擔憂

加力支持“兩新” 超長期特別國債資金全面下達 相關細則已出臺實施

未經許可經營旅行社業務、“不合理低價游”……文旅部發布10起秩序整治典型案例

從戰國風雨到抗日烽煙 250余公里保定長城“搬進”博物館 尋跡太行龍脊兩千年滄桑

七十五載奮進強國路 中國能源轉型蒸蒸“綠”上彰顯高質量底色

充分利用冬奧遺產 蘇翊鳴、谷愛凌等主場領銜亮相 國際雪上賽事開啟“中國賽季”

月月都有水果“上新” 廣西人如何實現“水果自由”?

2024年中國農民豐收節新疆兵團主場活動舉辦

廣東正值后汛期關鍵階段 加強部署強降雨防御

鄭州—阿拉木圖TIR國際運輸線路9月23日正式開通

昔日鹽堿地今朝“金糧倉”:吉林鎮賚迎多產豐收

進入中國市場3年,瑞典高端香氛品牌LYDEEN的破與立

業績失速,“敏感肌第一股”貝泰妮探路保健食品

“草本精華”有毒?揭開“白發轉黑”產品的真面目

智界R7將于9月24日上市 預售價26.8萬元起

定位中大型車 騰勢Z9將于11月上市并交付

吉利汽車集團近十款電動化汽車亮相法蘭克福

權威專家共聚一堂 2024動力電池發展趨勢論壇圓滿落幕

智界R7華為途靈平臺內測視頻曝光 旗艦黑科技又給對手上了一課

騰勢Z9GT上市33.48萬元起,全系目標月銷5000+

銷量下滑、降本增效,大眾計劃在中國裁員?

升級改造費爾法克斯工廠,通用汽車計劃裁員

試駕深藍L07:有華為乾崑智駕加持,新手秒變老司機

長安啟源E07開啟預售 預售價24.99萬起

布基納法索總統易卜拉欣-特拉奧雷接見了由布基納法索總統特別顧問李玉保率領的中布企業家...

企鏈通:數字時代的產業領航者

首創可分離福祉座椅!傳祺M8宗師科技關愛版暖心上市

永輝超市連續7年蟬聯福建民營企業100強

2024亞太汽車拉力錦標賽“龍游瀫杯”中國(龍游)拉力賽開幕

“農情”消保暖人心,使命擔當縣域行:招行信用卡打通金融教育“最后一公里”

德賽西威定增擴產 全力加碼智能駕駛

廣州中山網約車服務質量納入信用考核

看好中國汽車:電動化為基,智能化/全球化再創奇跡

汽車經銷商:大變局時代何去何從

新能源汽車配件不應盲目求大

抵制"雙輸的保護主義",歡迎"雙贏的綠色競爭"