您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

深度求索(DeepSeek):中國AI初創(chuàng)企業(yè)如何在芯片封鎖下實(shí)現(xiàn)“低成本突圍”的?

2025-01-27 09:32 性質(zhì):原創(chuàng) 作者:litong
免責(zé)聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權(quán),反對侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要刪除,敬請來電商榷?。?/div>
深度求索(DeepSeek):中國AI初創(chuàng)企業(yè)如何在芯片封鎖下實(shí)現(xiàn)“低成本突圍”2024年12月26日,中國杭州的一家初創(chuàng)公司——深度求索(DeepSeek)發(fā)布了一款名為Deep...

深度求索(DeepSeek):中國AI初創(chuàng)企業(yè)如何在芯片封鎖下實(shí)現(xiàn)“低成本突圍”

2024年12月26日,中國杭州的一家初創(chuàng)公司——深度求索(DeepSeek)發(fā)布了一款名為DeepSeek-V3的人工智能模型。這一系統(tǒng)不僅能夠回答復(fù)雜問題、編寫計算機(jī)程序,甚至在多項(xiàng)基準(zhǔn)測試中與硅谷巨頭OpenAI、谷歌的頂尖產(chǎn)品比肩。但真正引發(fā)全球關(guān)注的,是其訓(xùn)練成本僅為600萬美元,使用的英偉達(dá)芯片數(shù)量不足行業(yè)龍頭企業(yè)的八分之一。這一突破不僅挑戰(zhàn)了“AI研發(fā)必須依賴天量資金與算力”的傳統(tǒng)認(rèn)知,更在美國對華芯片出口管制的背景下,揭示了中國科技企業(yè)在逆境中“另辟蹊徑”的創(chuàng)新潛力。

深度求索成立于2023年7月,由中國量化投資公司幻方量化孵化,創(chuàng)始人梁文鋒是浙江大學(xué)信息與電子工程專業(yè)校友。公司核心團(tuán)隊(duì)以中國頂尖高校畢業(yè)生為主,平均年齡不足30歲,卻已在全球AI領(lǐng)域掀起波瀾。與多數(shù)依賴外部融資的初創(chuàng)企業(yè)不同,深度求索的資金主要來源于幻方量化的自有資金,其早期囤積的數(shù)萬枚英偉達(dá)A100芯片(現(xiàn)已被美國列入禁售名單)為其技術(shù)突破奠定了基礎(chǔ)。

DeepSeek-V3的核心突破在于其高效的訓(xùn)練方法。該模型擁有6710億參數(shù),但通過獨(dú)創(chuàng)的“多專家稀疏激活”架構(gòu),僅需激活其中370億參數(shù)即可完成推理任務(wù),內(nèi)存占用降至傳統(tǒng)模型的5%-13%。此外,團(tuán)隊(duì)開發(fā)的多頭潛在注意力機(jī)制大幅優(yōu)化了計算效率,使得模型在僅使用2000枚英偉達(dá)H800芯片的情況下,以兩個月時間完成訓(xùn)練,成本低至560萬美元。相比之下,Meta訓(xùn)練同類模型的成本高達(dá)數(shù)億美元,芯片用量超過1.6萬枚。

這一技術(shù)路徑的背后,是美國出口管制的倒逼效應(yīng)。喬治華盛頓大學(xué)助理教授杰弗里·丁指出:“芯片限制迫使中國工程師更高效地利用有限資源,從而催生了新的創(chuàng)新模式?!鄙疃惹笏鲃?chuàng)始人梁文鋒在采訪中坦言,中國企業(yè)的硬件使用效率曾落后于美國同行,“我們需要消耗兩倍算力才能達(dá)到同等效果”,但通過算法優(yōu)化,這一差距正在快速縮小。

與OpenAI、Anthropic等美國企業(yè)的閉源策略不同,深度求索選擇將DeepSeek-V3及后續(xù)模型完全開源。這一決策迅速引發(fā)全球開發(fā)者社區(qū)的響應(yīng):加州大學(xué)伯克利分校、香港科技大學(xué)等機(jī)構(gòu)在數(shù)日內(nèi)完成模型復(fù)現(xiàn),成本最低僅需數(shù)十美元。開源生態(tài)的壯大,不僅降低了技術(shù)門檻,更使中國在AI標(biāo)準(zhǔn)制定中占據(jù)主動。例如,R1在AIME 2024數(shù)學(xué)基準(zhǔn)測試中以79.8%的準(zhǔn)確率超越OpenAI o1,而其代碼和訓(xùn)練細(xì)節(jié)均公開可查。

Meta首席AI科學(xué)家楊立昆評價稱:“這不是中國追趕美國的問題,而是開源追趕閉源的問題?!鄙疃惹笏鞯拈_源實(shí)踐,與阿里巴巴、百度等中國科技企業(yè)的集體行動形成共振——后者已累計發(fā)布超百款開源模型,覆蓋29種語言。這種“技術(shù)共享+生態(tài)共建”的模式,正在重構(gòu)全球AI競爭格局。

盡管成果顯著,深度求索仍面臨多重挑戰(zhàn)。研發(fā)投入占比僅3%,遠(yuǎn)低于國際頭部企業(yè),長期技術(shù)壁壘的構(gòu)建存在隱憂。開源模式雖擴(kuò)大影響力,但也可能削弱商業(yè)變現(xiàn)能力。目前,公司主要通過API服務(wù)收費(fèi),價格僅為OpenAI的十分之一,但如何平衡開源與盈利仍需探索。

北京郵電大學(xué)教授劉偉指出,深度求索的成功證明“創(chuàng)新不必依賴巨額規(guī)劃性投入,市場驅(qū)動的技術(shù)微創(chuàng)新同樣關(guān)鍵”。而美國卡內(nèi)基國際和平基金會研究員馬特·希恩則警示:“出口管制正迫使中國企業(yè)變得更高效,這種‘封鎖反促創(chuàng)新’的悖論可能重塑全球技術(shù)權(quán)力平衡?!?/p>

在全球AI競賽進(jìn)入“深水區(qū)”的當(dāng)下,深度求索的突圍不僅是一場技術(shù)革命,更是一次關(guān)于創(chuàng)新范式的深刻啟示:當(dāng)硬件霸權(quán)遭遇算法韌性,低成本、高協(xié)同的開源生態(tài)或?qū)⒊蔀槠凭种€。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞