AI“模型崩潰”風險需警惕
從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。
“模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出。
多家外媒報道稱,這不僅是數據科學家需要擔心的技術問題,如果不加控制,“模型崩潰”可能會對企業、技術和整個數字生態系統產生深遠影響。天津大學自然語言處理實驗室負責人熊德意教授在接受記者采訪時,從專業角度對“模型崩潰”進行了解讀。
“模型崩潰”是怎么回事
大多數AI模型,比如GPT-4,都是通過大量數據進行訓練的,其中大部分數據來自互聯網。最初,這些數據是由人類生成的,反映了人類語言、行為和文化的多樣性和復雜性。AI從這些數據中學習,并用它來生成新內容。
然而,當AI在網絡上搜索新數據來訓練下一代模型時,AI很可能會吸收一些自己生成的內容,從而形成反饋循環,其中一個AI的輸出成為另一個AI的輸入。當生成式AI用自己的內容進行訓練時,其輸出也會偏離現實。這就像多次復制一份文件,每個版本都會丟失一些原始細節,最終得到的是一個模糊的、不那么準確的結果。
美國《紐約時報》報道稱,當AI脫離人類輸入內容時,其輸出的質量和多樣性會下降。
熊德意解讀稱:“真實的人類語言數據,其分布通常符合齊普夫定律,即詞頻與詞的排序成反比關系。齊普夫定律揭示了人類語言數據存在長尾現象,即存在大量的低頻且多樣化的內容。”
熊德意進一步解釋道,由于存在近似采樣等錯誤,在模型生成的數據中,真實分布的長尾現象逐漸消失,模型生成數據的分布逐漸收斂至與真實分布不一致的分布,多樣性降低,導致“模型崩潰”。
AI自我“蠶食”是壞事嗎
對于“模型崩潰”,美國《The Week》雜志近日刊文評論稱,這意味著AI正在自我“蠶食”。
熊德意認為,伴隨著這一現象的出現,模型生成數據在后續模型迭代訓練中占比越高,后續模型丟失真實數據的信息就會越多,模型訓練就更加困難。
乍一看,“模型崩潰”在當前似乎還是一個僅需要AI研究人員在實驗室中擔心的小眾問題,但其影響將是深遠而長久的。
美國《大西洋月刊》刊文指出,為了開發更先進的AI產品,科技巨頭可能不得不向程序提供合成數據,即AI系統生成的模擬數據。然而,由于一些生成式AI的輸出充斥著偏見、虛假信息和荒謬內容,這些會傳遞到AI模型的下一版本中。
美國《福布斯》雜志報道稱,“模型崩潰”還可能會加劇AI中的偏見和不平等問題。
不過,這并不意味著所有合成數據都是不好的。《紐約時報》表示,在某些情況下,合成數據可以幫助AI學習。例如,當使用大型AI模型的輸出訓練較小的模型時,或者當可以驗證正確答案時,比如數學問題的解決方案或國際象棋、圍棋等游戲的最佳策略。
AI正在占領互聯網嗎
訓練新AI模型的問題可能凸顯出一個更大的挑戰。《科學美國人》雜志表示,AI內容正在占領互聯網,大型語言模型生成的文本正充斥著數百個網站。與人工創作的內容相比,AI內容的創作速度更快,數量也更大。
OpenAI首席執行官薩姆·奧特曼今年2月曾表示,該公司每天生成約1000億個單詞,相當于100萬本小說的文本,其中有一大部分會流入互聯網。
互聯網上大量的AI內容,包括機器人發布的推文、荒謬的圖片和虛假評論,引發了一種更為消極的觀念。《福布斯》雜志稱,“死亡互聯網理論”認為,互聯網上的大部分流量、帖子和用戶都已被機器人和AI生成的內容所取代,人類不再能決定互聯網的方向。這一觀念最初只在網絡論壇上流傳,但最近卻獲得了更多關注。
幸運的是,專家們表示,“死亡互聯網理論”尚未成為現實。《福布斯》雜志指出,絕大多數廣為流傳的帖子,包括一些深刻的觀點、犀利的語言、敏銳的觀察,以及在新背景下對新生事物的定義等內容,都不是AI生成的。
不過,熊德意仍強調:“隨著大模型的廣泛應用,AI合成數據在互聯網數據中的占比可能會越來越高,大量低質量的AI合成數據,不僅會使后續采用互聯網數據訓練的模型出現一定程度的‘模型崩潰’,而且也會對社會形成負面影響,比如生成的錯誤信息對部分人群形成誤導等。因此,AI生成內容不僅是一個技術問題,同時也是社會問題,需要從安全治理與AI技術雙重角度進行有效應對。”( 張佳欣)
標簽:
精彩閱讀
-
AI“模型崩潰”風險需警惕
從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,... -
世界計算大會開幕
24日上午,以智算萬物 湘約未來——算出新質生產力為主題的2024世... -
一箭八星“太空拼車”!捷龍三號火箭海...
9月24日,我國太原衛星發射中心在山東海陽附近海域使用捷龍三號運載... -
智造世界 創造美好——2024世界制造業...
9月20日至23日,以智造世界·創造美好為主題的2024世界制造業大會在... -
我國綠色智能計算產業“井噴”發展
截至目前,我國算力總規模在全球處于第二位,綠色智能計算技術加速... -
數字里的新質生產力|“數字大腦”如何...
《經濟參考報》9月25日刊發記者陳涵旸采寫的文章《數字里的新質生產... -
一箭五星!力箭一號火箭發射看點解析
9月25日,力箭一號遙四商業運載火箭在我國酒泉衛星發射中心發射升空... -
一臺"數字大腦"如何"指揮"30000多個機器人?
請點擊開門選項領取您的外賣。下午5點30分,服務機器人UP已準時將外... -
打通數字技術創新突破堵點 賦能新質生...
黨的二十屆三中全會強調發展以高技術、高效能、高質量為特征的生產... -
杭州“直播電商第一區”:大流量匯聚正能量
一個小隔間,一部手機,一盞補光燈,組合在一起就是一個新世界。作... -
打造芯片“鐵幕”?美國這一套行不通
據報道,在美國不斷施壓下,美國和日本接近達成限制向中國出口芯片... -
網紅主播應當拼什么
合肥市市場監管部門宣布成立聯合調查組,對某頂流主播所在的企業立... -
中國汽研推出新能源汽車安全新質測評認...
隨著新能源電動汽車銷量的爆發式增長,相關的安全隱患和挑戰也逐漸... -
阿維塔 07獲新能源汽車安全新質測評電...
在 9 月 20 日的汽車新質生產力發展論壇上,中國汽車工程研究院... -
夏曉川:未來整車與供應商之間將重塑“...
9月24-26日,2024中國汽車供應鏈大會暨第三屆中國智能網聯新能源汽... -
樂道來了,蔚來離自己的理想更近了
阿爾卑斯,這個很多用戶期盼已久的蔚來第二品牌,終于以樂道的身份... -
英力士擲彈兵中國上市,三款配置/80.8萬...
9月25日,英力士汽車公司在北京宣布,英力士擲彈兵5座越野車正式登... -
國內售價80.80萬起,英力士擲彈兵真的不...
9月25日,英力士擲彈兵越野車在國內正式上市,新車共推出3款車型,... -
加速SUV新能源變革 海獅05DM-i、第二代...
海獅05DM-i與第二代宋Pro DM-i所在的A級SUV市場,是競爭最為激烈的... -
強鏈補鏈 鋰電材料上市公司加速“出海”
9月23日,鋰電產業鏈公司萬潤新能、恩捷股份同日宣布,擬于海外投資... -
數智化賦能交通業轉型
9月22日至9月24日,第十六屆國際交通技術與設備展覽會在北京舉行,... -
美國擬禁止聯網汽車使用中國軟硬件引擔憂
美國商務部23日提議,禁止美國道路上的聯網汽車和自動駕駛汽車使用... -
西藏金融企業創新服務 助力新市民解決...
從貸款業務到手機銀行藏語服務,近段時間,西藏金融企業創新服務頻... -
杭州“直播電商第一區”:大流量匯聚正能量
一個小隔間,一部手機,一盞補光燈,組合在一起就是一個新世界。作... -
上海亮出國資國企數字化轉型場景需求
記者9月23日獲悉,2024上海國資國企數字化轉型應用場景于近日發布,... -
安徽公布低空經濟應用場景清單
記者9月23日從安徽省蕪湖市近日召開的2024低空經濟發展大會上獲悉,... -
南京圍繞“新質城建”推動場景創新
道路由機器人24小時巡檢、工地用上旁站監護機器人、路燈更換了可降... -
采收加工僅需3小時 黑龍江青岡玉米一路...
近日,黑龍江省綏化市青岡縣迎來鮮食玉米最佳采收時節。伴隨大型收... -
河南延津:復合種植實現“一地雙收”
近日,科技日報記者在河南省新鄉市延津縣僧固鄉沙莊村采訪時了解到... -
北京踐行“三水統籌” 水生態環境質量...
美麗河湖是美麗中國在水生態環境領域的集中體現和載體。在9月24日舉... -
遼寧構建“一體兩翼”新型農技推廣服務體系
玉米起收進入倒計時。近幾日,阜新市彰武縣先達萬和農業服務有限公... -
推動制造業質量變革效率變革動力變革 ...
9月23日,2024世界制造業大會在安徽合肥落下帷幕。5年前,習近平總... -
央行新政四連增信心!新鴻基地產峻鑾以...
9月24日,央行官宣“降準”“降首付比例”等多項樓市新政——近期將... -
“為愛前行,讓愛無缺”預防出生缺陷公...
為普及出生缺陷防治知識,推進出生缺陷防治工作,9月20日,北京斯利 -
文旅部推出鄉村游重點線路
近年來,文化和旅游部大力推進鄉村旅游提質升級。開展鄉村旅游藝術... -
國慶假期去哪玩?請收到這份特色生態旅...
近日,文化和旅游部資源開發司副司長魏立忠在文化和旅游部新聞發布... -
“做好金融五篇大文章 支持鄉村全面振...
近日,做好金融五篇大文章 支持鄉村全面振興主題研討會暨中國銀行... -
推動經濟向“新”而行 險資加大力度支...
資本市場對金融穩定和經濟發展無疑都具有重要作用。金融監管總局一... -
崇尚英雄 爭做先鋒
來源標題:崇尚英雄 爭做先鋒近日,全國各大媒體陸續刊發了國家勛... -
打造交旅融合新業態 首列中老鐵路跨境...
9月24日,以中老鐵路旅游線路和云南省核心旅游線路為起點的中國首列... -
第五屆中國(潛江)曹禺文化周開幕
由中國文聯、湖北省政府共同主辦的第五屆中國(潛江)曹禺文化周,24... -
當“洋弟子”遇見高陽:共繪中外文化交...
體驗高陽草木染、參觀毛巾工廠、制作豆腐、唱北方昆曲、打太極拳…... -
海外華文媒體海南行:“我要把海南黎陶...
一看到黎陶制品,我就想把它們帶回意大利羅馬,用它們做中國菜,向... -
“渝港澳律所聯營”成為重慶律師行業涉...
近日,作為一家重慶老字號律所,重慶合縱律師事務所迎來了涉外法律... -
澳龍“入住”江南古鎮 “稻蝦共作”開...
斜風斜雨過斜橋,運河悠悠映水鄉。浙江省海寧市斜橋鎮是一座原汁原... -
全國資源型地區轉型發展現場會在棗莊舉...
9月24日,全國資源型地區轉型發展暨采煤沉陷區綜合治理經驗交流現場... -
山西開展聯合檢查 防控危險化學品重大...
山西省應急管理廳24日發布消息,該廳在196家重大危險源企業全面自查... -
【高質量發展調研行】重慶民主村:老社...
來源標題:【高質量發展調研行】重慶民主村:老社區蝶變新網紅9月23... -
開啟“空間站領航員”研修之旅 2024年...
記者9月24日從中國科學院空間應用工程與技術中心(空間應用中心)獲悉... -
買不到直達票 也可乘坐直達列車
原標題:買不到直達票 也可乘坐直達列車鐵路12306推出車內換座購票... -
黃山放繩工李培生 收到回信之后自己也...
【開欄語】字里行間,紙短情長。在新中國成立75周年之際,我們回訪... -
人社部:支持城鄉勞動者在就業地享受就...
原標題:人社部:始終把高校畢業生等青年就業作為重中之重,完善財... -
央行穩樓市“組合拳”釋放積極信號
原標題:央行穩樓市組合拳釋放積極信號專家及業內人士表示,多項重... -
降準降息降存量房貸利率 央行推出多項...
來源標題:降準降息降存量房貸利率 央行推出多項重磅政策支持樓市... -
人社部:將制定彈性退休具體辦法
來源標題:人社部:將制定彈性退休具體辦法昨天(24日),國新辦舉行... -
重磅政策呵護 A股全線大漲
來源標題:重磅政策呵護 A股全線大漲在一系列重磅政策的呵護之下,... -
智造世界 創造美好——2024世界制造業...
9月20日至23日,以智造世界·創造美好為主題的2024世界制造業大會在... -
堅守初心,不斷實現人民對美好生活的向往
來源標題:堅守初心,不斷實現人民對美好生活的向往歲月流轉,時空... -
秋染田野遍地金黃 勾勒出希望的田野上...
在山東省濟寧市兗州區,32萬畝玉米迎來了收獲期,當地積極調動農機... -
聯通·合作·開放——從第八屆絲博會看...
金秋九月,灞水之濱。以深化互聯互通·拓展經貿合作為主題的第八屆... -
奮進強國路 闊步新征程丨法治中國根基...
來源標題:法治中國根基不斷筑牢近日,一場別開生面的古村征地拆遷... -
文化中國行丨歡迎“回家”!這些新晉世...
今年7月26日,在印度首都新德里舉行的聯合國教科文組織第46屆世界遺... -
完善就業優先政策 健全社會保障體系(...
來源標題:完善就業優先政策 健全社會保障體系(推動高質量發展·權... -
文化中國行|走進巴丹吉林沙漠,感受秘...
巴丹吉林沙漠位于阿拉善高原,是中國第三大沙漠、第二大流動沙漠,... -
十個維度看中國|挑戰用一百塊錢打卡上...
city不city啊~是在滬外國博主創作的熱梗city作為描述城市化、時尚... -
WisdomTree推動金融科技新時代,WTAI平...
在當今快速變化的金融科技世界,WisdomTree正通過其創新的區塊鏈和人 -
2024年中國—東盟產業合作區退役軍人暨...
投身軍旅榮耀無限,戎歸八桂續寫輝煌。9月23日,2024年中國—東盟產 -
公募基金破局三問
近年來,公募基金規模穩步增長,截至7月底達到31 49萬億元,再創歷... -
金價高處不勝寒?資金仍在跑步進場
美聯儲降息之后,國際黃金價格持續突破歷史新高。而23日紐約COMEX黃... -
博時基金:央行政策“大禮包”既有政策...
博時基金宏觀策略部當前國內需求仍然較弱,新房市場是較為重要的拖... -
華安基金:貨幣政策釋放重磅利好,有哪...
9月24日上午,國務院新聞辦公室舉行新聞發布會,中國人民銀行行長潘... -
永贏基金:央行一系列政策有利變化有望...
永贏基金市場點評市場點評:2024年9月24日,上證指數上漲4 15%,創... -
浦銀安盛基金:重磅政策集中釋放 寬基...
9月24日,人民銀行宣布同時推出多項重磅舉措,加大貨幣政策調控,支... -
公募基金解讀央行政策“大禮包”:有利...
今日(9月24日)上午,國務院新聞辦公室舉行新聞發布會,中國人民銀行... -
傳遞積極信號 年內136家上市公司公告“...
9月份以來,已有上海港灣、恒帥股份、上海艾錄、貴州三力等多家上市... -
秋分已至豐收在望 多家上市公司推動農...
2024年9月22日秋分,也是第七個中國農民豐收節。今年,多地克服較為... -
北交所并購重組嶄露頭角 產業協同不斷提速
今年以來,A股市場并購重組持續升溫,北交所公司也在并購重組市場中... -
網絡安全概念爆發 關注三大投資主線
9月23日,網絡安全概念板塊再度迎來大漲,電科網安、國華網安漲停,... -
Telegram創始人“服軟”:將向政府提供...
當地時間周一(9月23日),電報(Telegram)創始人兼CEO杜羅夫表示,Tel... -
微軟再次出手“囤電”,人工智能掀起核...
隨著人工智能技術的迅速發展,其巨大的用電量已經引起了廣泛關注。... -
OpenAI CEO奧特曼:超級AI或將在未來數...
9月24日消息,OpenAI首席執行官薩姆·奧特曼(Sam Altman)堅信智能... -
讓“標配”更適配 兒童智能手表如何守...
回答問題離譜、播放不適宜未成年人觀看內容、誘導學生充值游戲……... -
人形機器人的“生長”需要軟硬件協同發展
近日,在浙江省杭州市舉辦的2024云棲大會上,前沿應用展館里有一位... -
第十四屆中國國際數字出版博覽會閉幕
為期3天的第十四屆中國國際數字出版博覽會23日在海南省海口市閉幕。... -
治理大數據“殺熟”頑疾
前不久,有關單位公布了2024年上半年消費維權輿情熱點,平臺經濟大... -
國產游戲廠商發力探尋3A游戲“真經” ...
國產游戲廠商發力探尋3A游戲真經回歸產品本質,專注提升內容和玩法... -
微信小程序多舉措優化境外產品體驗 助...
9月23日,微信公開課在新加坡舉行。中國游客出境游熱潮下,海外商家... -
江蘇濱海:強化網絡安全宣傳 筑牢網絡...
為營造清朗的網絡信息安全環境,提高群眾應對網絡風險的能力,連日... -
“《哥德巴赫猜想》之后 科幻科普作家...
9月23日,由中國作家協會和中國科學技術協會主辦的《哥德巴赫猜想》... -
中國已對全球53次重大自然災害進行數據救援
地球觀測組織(GEO)中國秘書處數據顯示,自2016年來,中國在地球觀測... -
產業迅猛發展 3D打印如何闖出“新天地”
上半年我國3D打印設備產品產量同比增長超50%產業迅猛發展 3D打印如... -
世界數字科學院計劃建立AI安全與倫理標準
9月22日,聯合國未來峰會行動日邊會線上舉辦。邊會主題是人工智能時... -
衰老研究“風華正茂” 健康老去愿景可期
我們為何會衰老?我們究竟有多老?如何健康地老去?這是近日召開的香山... -
快手可靈AI攜手東方衛視中秋晚會打造文...
9月17日晚,東方衛視中秋晚會《朤月東方·中秋奇妙夜》精彩上演,AI... -
分布式光伏發電在軌道領域應用有新突破
來源標題:分布式光伏發電在軌道領域應用有新突破近日,隨著滁寧城... -
CSEE新型電力系統標準算例發布
來源標題:CSEE新型電力系統標準算例發布9月21日,CSEE(中國電機工... -
中科云谷提出智慧倉儲整體解決方案
來源標題:中科云谷提出智慧倉儲整體解決方案近日,2024互聯網岳麓... -
科技賦能,雪域高原繪就產業興盛新圖景
來源標題:科技賦能,雪域高原繪就產業興盛新圖景全國單品種植面積... -
第32屆深圳禮品家居展聯袂1688,10月巔峰...
2024年10月20-23日,國內知名展覽主辦機構勵展華博展覽(深圳)有限公 -
14億多人從“用上電”到“用好電”
來源標題:14億多人從用上電到用好電翻越崇山峻嶺,一張張電網銜接...