您的位置:首頁 >科技 >

極致性能背后的算力邏輯:DeepSeek如何重構AI研發的底層敘事

2025-02-13 15:03:18    來源:人民郵電報

2025年伊始,來自中國的開源AI模型DeepSeek爆火。隨后,美國總統特朗普、OpenAI首席執行官奧特曼紛紛發聲,承認其給AI行業帶來的“震撼”?!都~約時報》評價稱,DeepSeek能與OpenAI的ChatGPT媲美,“僅此一點就已經是一個里程碑”。DeepSeek是如何在AI競賽中脫穎而出的?它是否走出了大模型發展的一條新路?

算力困局:

AI競賽的“不可能三角”

在DeepSeek突圍之前,AI領域普遍存在一種固化的技術認知,即大模型性能與算力投入呈嚴格正相關。這一觀點幾乎成了業界的共識。美國人工智能初創公司Anthropic首席執行官達里奧·阿莫迪曾透露,GPT-4o的模型訓練成本約為1億美元。OpenAI為了訓練GPT-4,使用了數萬塊英偉達A100GPU,而微軟則為其提供了名為“星際之門(Starship)”的超級計算機集群支持。同時,谷歌也投入了其龐大的TPU(Tensor Processing Unit)資源來訓練諸如PaLM 2等模型。這些行業巨頭通過巨額的投入,不斷強化“算力即權力”的行業法則。

這種算力霸權形成了嚴酷的“不可能三角”困境——模型性能、訓練成本、硬件規模這三者難以兼得。面對這一困境,許多初創公司要么選擇輕量化模型犧牲性能,要么在沉重的算力開支重壓下艱難前行,最終耗盡資金。

令人欣喜的是,DeepSeek打破了這一僵局。數據顯示,Deep-Seek-V3模型訓練成本僅為557.6萬美元,而且僅用2048塊H800顯卡,耗時不到兩個月。這一成就無疑是對傳統算力霸權的一次有力挑戰。DeepSeek-V3發布后,360集團創始人周鴻祎發文稱贊“Deep-Seek的進步對推動中國AI產業發展是極大利好”,其用2000塊卡做到了萬卡集群才能做到的事。

架構革命:

DeepSeek重構AI底層邏輯

DeepSeek的技術路徑展現了對AI研發底層邏輯的顛覆性理解。其核心突破不在于單純壓縮模型規模,而是通過架構創新重構了“算力—性能”的價值函數。

在長文本方面,DeepSeek-V3引入了一種稱為多頭潛在注意力的機制。這種機制將Key(K)和Value(V)聯合映射到低維潛空間,從而有效地減小了KV Cache的大小,提高了模型處理長文本的能力。在資源調度方面,通過采用混合專家模型(MoE)架構,Deep-Seek-V3能夠根據輸入動態選擇最合適的神經網絡路徑進行計算,而不是每次都激活整個網絡。這種方法可以在不顯著增加計算成本的前提下擴展模型容量,并且只在需要時使用更多的計算資源。

為了進一步提升MoE架構的效率,DeepSeek-V3設計了一個動態調整的偏置項(Bias Term),它影響路由決策,避免了傳統負載均衡策略帶來的性能損失。它通過調節更新速度(γ)和序列級平衡損失因子(α)來優化模型訓練。

在內存優化方面,Deep-Seek-V3采用了新興的低精度訓練方法——FP8混合精度訓練。使用低精度浮點數(如FP8格式)進行計算可以減少內存占用和計算需求,同時保持較高的準確性。這意味著DeepSeek-V3能夠在相同的硬件上運行更大規模的模型或在更少的硬件上完成相同的任務。

簡單來說,模型壓縮、專家并行訓練、FP8混合精度訓練、推測性解碼等一系列創新共同促成了Deep-Seek-V3模型的低成本和高性能。

打破桎梏:

算力不應成為認知革命的絆腳石

斯坦福HAI《2024年人工智能指數報告》指出,AI模型在醫療、材料科學等領域的應用增速是基礎研究的3倍以上。站在技術演進的時間軸上回望,DeepSeek的突破在AI領域堪稱重大里程碑。此前,算力效率一直是限制AI發展的瓶頸,而如今,隨著這一桎梏被打破,創新能量開始呈指數級釋放。

DeepSeek的火爆出圈揭示了一個更深層的技術哲學:當行業沉迷于堆砌算力的“暴力美學”時,真正的突破往往來自對計算本質的重新理解。就像量子力學顛覆經典物理的認知框架,這場架構革命證明,智能的進化不完全依賴物理算力的線性增長,而在于發現更“優雅”的算法表達。

或許在不遠的未來,我們會看到更多輕量化、小而美的AI模型,在邊緣設備、在移動終端、在每個人的口袋里,持續釋放著超越物理限制的認知潛能。這場始于算力邏輯重構的技術革命,最終指向的是對人類智能邊界的重新丈量。( 吳雙)

標簽:

精彩閱讀

DeepSeek來了!人工智能知識產權法律保護須強化

2024年我國規上電子信息制造業增加值同比增長11.8%

從助力登山到服務生活 養老機器人規?;瘧眠€有多遠

人工智能助力研制出自愈瀝青

新型鈣鈦礦疊層電池能效創新高

如何煮出熟度均勻的雞蛋

健康干細胞轉為口腔癌細胞機制揭示

低空經濟時代無人機飛手如何“高飛”

科技賦能國防動員提質增效

山東探索“氫進萬家”示范樣板

杭州打造高水平創新活力之城

2024年我國規上電子信息制造業 增加值同比增長11.8%

人形機器人產業發展提速 多家公司透露相關布局

DeepSeek有望激發新一波人工智能創新浪潮

英媒: DeepSeek打破美對AI話語權壟斷

國產大模型破局啟示:DeepSeek顛覆了什么?

家用市場期待機器人來“敲門”

應用為先 深圳打造人工智能先鋒城市

現象級的科技飛躍:相信光 追逐光

人工智能體產業風口已至

運營商“二次號碼”一鍵解綁上線 覆蓋150款互聯網應用

政策與市場雙重驅動 多家消費電子公司去年業績預增

AI眼鏡賽道火熱 “百鏡大戰”一觸即發?

戲曲成頂流,年輕人越品越有味!

15套神仙睡衣!又甜又撩顏值巨高!穿出門也超洋氣!

今年流行衛衣+半身裙,超百搭,時尚溫柔不挑身材,誰穿誰好看

新春走基層丨“中式戰袍”點燃春節服飾消費熱潮

金價超850元/克 春節優惠、小克重產品帶動黃金消費熱

18道工序打磨 西湖綢傘美出圈

縣域消費市場供銷兩旺

從春晚李子柒的彩裙 聊聊傳統的五色之美

披上“奧運戰袍”李寧能否實現新突破

文化潮起來 消費旺起來

本田日產合并失敗后,日產尋找新合作伙伴,富士康有戲?

拒絕“兄弟”變“父子” 日產本田合并談判中止

豐田在華設新公司水到渠成

上市公司競逐低空飛行器固態電池 誰將勇奪先機?

福特汽車2025年業績指引不如預期

能源“機器人”應對充電激增壓力

新能源車“上路”三大難點怎么破

豐田第三財季營業利潤降28%,仍上調2025財年預期

2024年成績單揭曉,博世:2025年進一步提升業績

“示界”競逐第五“界” 東風汽車戰略急轉

錨定硬科技 科技主題基金有望大擴容

醫療股開工首日崛起!熱門賽道基金悄然布局 復蘇真的來了?

春節假期后權益類基金新發熱度再攀升

財經深一度|春節假期后權益類基金新發熱度再攀升

DeepSeek“火出圈” 績優基金提前布局AI產業鏈

超30只公募基金蛇年開啟認購 市場將迎增量資金

股票型ETF相繼上市 增量資金持續入場

1月份75%QDII基金正收益 易方達11只基金漲超6%

重大突破,機器人再掀漲停潮!方正富邦這只基金布局機器人賽道

蛇年開市科技股全面走強 一線私募研判積極

新春走基層·走筆丨趕集!打開手機就有“巴扎”

關注糧食浪費丨如何避免節日盛宴變“剩宴”?

各地“新春第一會”都聚焦什么?一起來看新變化

全國超過1.8億人參加長期護理保險 這些短板仍需補齊

油氣地質儲量超1.5億噸!渤海億噸級油田渤中26-6投產

“爾濱”準備好了!熱“雪”之約待你來

冰雪經濟激活發展動能

快收藏!哈爾濱亞冬會金牌賽程來了

夯實節后返崗就業,助力務工人員逐夢新程

哈爾濱冰雪大世界有多火熱?美國小伙埃文也來打過卡了

亞冬會|閑記:“爾濱”的Hā Há Hǎ Hà

瞧!亞冬會的“科技范兒”

整點“small 芭比Q”!爾濱的哥猛學英語迎接亞冬會來的“且”

亞冬會|何以“爾濱”

南國熱雪:湖北冰雪運動“滑出”經濟增長新動力

新聞分析:登頂我國影史票房榜,《哪吒之魔童鬧?!窞楹稳绱嘶馃??

“AI老中醫”,把脈準不準?用戶體驗如何?

從護工到醫療護理員,“辛苦活”變成了“技術活”

2024年中國手機產量16.7億臺 同比增長7.8%

2月5日全社會跨區域人員流動量完成23153.8萬人次

DeepSeek如何攪動AI產業?

DeepSeek大放異彩 AI迎來“破圈時刻”

逾2萬億元逆回購到期 央行多舉措調節流動性

DeepSeek顛覆了什么?——大模型“國產之光”破局的啟示

DeepSeek有望激發 新一波人工智能創新浪潮

樓市止跌回穩態勢延續 核心城市“小陽春”行情可期

今日視點:中長期資金入市總量持續提升可期

銀行紛紛啟動首季“開門紅”活動 貸款項目儲備充足投放良好

AI眼鏡賽道火熱 “百鏡大戰”一觸即發?

工業和信息化部:2024年我國手機產量16.7億臺

信銀理財財富管理事業部專戶投資條線副總經理秦慶剛:當下權益類資產的性價比更為突出

時間復利,能為投資者帶來“穩穩的信服”么?

“手”護完整匠心再造為花季少女再豎“十指完整”信心

暖心護航春節返程,順豐確保每一份滿滿當當的心意與牽掛新鮮抵達!

怪不得刷屏!看完這支賀歲片,我的文化DNA動了

以十方融海職教新范式為例,看數字化如何重塑職業在線教育領域

永康中泰全國醫療器械供應鏈服務平臺發布會圓滿落幕

北京大衛中醫院院長張占宗向全國人民拜年!致以新春問候!

中國汽車跑出“加速度”

推動更多新能源汽車駛向全球

定位豪華電混越野,捷途發布“縱橫”產品序列

年終講|比亞迪向左,吉利向右

中國電動汽車走俏新加坡市場

2024年全國電動汽車充換電基礎設施數量增長49.1%

2025年豪車市場:格局將如何演變?

特斯拉新一輪全球漲價要來了?

德國汽車業:歐洲應歡迎中國電動車企投資

年終講|東風干大事,以人為本

2.7億人次、2.5億人次、3.21億張……透過數據看“流動的中國”活力奔涌

鏟冰除雪、壓速帶道、“人工+機械”……各地積極應對寒潮 保通保暢保安全

多地年度住房計劃關注“人房地錢”聯動 土地成交活躍提信心、“暖意”濃

歡歡喜喜過大年!新春“氛圍組”就位 “民俗+”點亮春節“儀式感”

預防春季食源性疾病需防范兩類風險因素 專家作出詳細解讀

為了一份責任和擔當 “鋼軌醫生”默默守護春運安全

1.74萬億元、比上年增3.2% 電信業務乘“數”而上向“新”行穩步增長