DeepSeek突破科技封鎖 美國AI領先中國只剩3至6個月

摘要:

DeepSeek不僅開源、免費下載,還公開訓練方法,允許任何人進行數據蒸餾並商業化。在美國對中國高科技封鎖日趨嚴格的背景下,DeepSeek成功證明中國國產AI仍能突破限制。白宮AI與加密貨幣負責人塞克斯直言,美國AI領先中國僅3至6個月。

xxxDeepSeek在中國春節期間掀起全球波瀾。圖源:網路圖片

1月20日,在世界經濟論壇2025年年會開幕當天,中國AI公司DeepSeek(深度求索)發布最新開源模型R1,一個具有推理功能的最新大模型,用純深度學習的方法讓AI自發湧出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,甚至偶爾超過o1的水平,是除了OpenAI以外,目前唯一一個做到這點的模型。

令人吃驚的是,DeepSeek R1模型的訓練成本僅為560萬美元,僅用十分之一的成本就達到了GPT-o1級別的表現,遠低於美國OpenAI、Google、Meta公司等科技巨頭在人工智能技術上投入的數億美元乃至數十億美元。且DeepSeek R1完全開源,DeepSeek公司甚至發布論文,詳細介紹訓練的所有步驟和竅門。重點是,DeepSeek公司是一家純粹的中國公司,公司裡的工程師、研發人員全是中國教育自主培育出來的人才。

DeepSeek在中國春節掀起的全球波瀾


DeepSeek於1月20日發布R1以來,短短一周下載量暴漲375%,取代競爭對手OpenAI的ChatGPT,成為中美App Store下載量最大、排名第一的免費應用程序,碾壓ChatGPT、Google Gemini等老牌AI霸主,成為全球AI用戶的新寵兒。

xxx1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。圖源:網路圖片

1月27日,美股開盤即大幅下跌,科技股哀鴻遍野,納指暴跌3%,NVIDIA當日股價暴跌約17%,一天蒸發近2000億美元,創下美股歷史最大單日市值蒸發紀錄,博通公司股價下跌17%,超威半導體公司(AMD)股價下跌6%,微軟股價下跌2%。市場分析認為,核心原因是DeepSeek的最新突破,動搖了美國科技行業的「無敵」地位。

xxx1月27日,NVIDIA股價暴跌約17%,一天蒸發近2000億美元,創下美股歷史最大單日市值蒸發紀錄。圖源:央視網

此前,全球普遍認為美國在AI技術上領先中國2至3年。去年12月前Google CEO艾瑞克·施密特(Eric Schmidt)受訪時,曾表示美國的AI優勢已縮減至不到1年。此次DeepSeek R1追趕上OpenAI o1模型,更讓白宮AI與加密貨幣負責人塞克斯(David Sacks)直言,美國AI領先中國僅3至6個月。

早在2024年12月26日,DeepSeek發布並同步開源的DeepSeek V3模型,就已在全球AI領域掀起話題。DeepSeek V3的總訓練成本只有557.6萬美元,以1/11的算力、僅2000個GPU晶片訓練出性能超越GPT-4o的大模型。而GPT-4o的訓練成本約1億美元,使用25,000個GPU晶片。雙方的成本至少是10倍的差距。

DeepSeek,全稱為「杭州深度求索人工智能基礎技術研究有限公司」,成立於2023年7月17日,是一家創新型科技公司,專注於開發先進的大語言模型(LLM)和相關技術。在矽谷,DeepSeek很早就被稱作「來自東方的神秘力量」。

DeepSeek為什麼掀起這麼大的波瀾


DeepSeek不僅開源、免費下載,還公開訓練方法,允許任何人進行數據蒸餾並商業化。在美國對中國高科技封鎖不斷升高的背景下,DeepSeek成功證明中國國產AI仍能突破限制。透過技術優化、開源策略及成本控制,重新定義AI市場規則,讓高性能AI變得觸手可及,徹底改變產業生態。

DeepSeek R1在數學、編程、邏輯推理領域表現卓越,僅憑極少標註數據,大幅提升推理能力,與OpenAI o1正式版不相上下。DeepSeek R1擁有6710億參數,透過混合專家模型(Mixture of Experts),每次推理調用的參數僅370億,使其速度快且成本極低。

DeepSeek R1的訓練成本僅為ChatGPT的1/10至1/20,API調用費用為每百萬tokens 16元,遠低於ChatGPT的438元,相差27倍。而在提供服務方面,DeepSeek官方免費提供,API的價格為每百萬tokens 2.19美元,相較於OpenAI o1的60美元,僅為其4%。

xxxDeepSeek R1模型與o1類推理模型輸入輸出價格對比,圖源:DeepSeek

xxxDeepSeek R1 API價格。圖源:DeepSeek

DeepSeek R1的推出,大幅降低企業、開發者及個人使用AI的門檻,使企業能更低成本接入AI,開發者無須擔憂昂貴費用,個人用戶則可免費使用。目前DeepSeek已用阿里Qwen和Meta Llama等開源模型蒸餾出六款小型模型,其中一款320億參數的模型在數學與編程性能上超越了o1-mini,而15億參數的迷你模型則超越了GPT-4o與Claude 3.5 Sonnet,甚至可在個人電腦或手機上運行。

xxx傳統的模型訓練路徑。圖源:騰訊科技

DeepSeek R1的論文也首度公開推理模型的內部機制。DeepSeek採用無人工干預的強化學習方式,類似AlphaZero自我對弈學習棋藝,透過獎勵機制自行摸索推理能力。模型自發學會:

- 解數學題時寫下步驟並自動檢查

- 發現錯誤後中止思考並重新推導

- 解題後反思步驟,嘗試不同方法找出最優解

- 自動生成詳細解題步驟

- 對較難題目延長推理時間

這些能力皆為模型自主習得,無需工程師手動設定。DeepSeek選擇開源,而ChatGPT則維持封閉生態,收費高昂。開源讓開發者能自由優化模型,企業可自部署,確保數據安全,全球開源社群也能持續優化模型。這種策略類似Android開源模式,對比ChatGPT的封閉生態更具吸引力。

DeepSeek沒那麼厲害?美西方的反應最為真實


面對來自DeepSeek造成的衝擊,OpenAI的CEO山姆·奧特曼(Sam Altman)最開始在「X」上感嘆:「DeepSeek的表現令人印像深刻!」然而,當白宮人工智能顧問大衛·薩克斯受訪表示DeepSeek「有可能」竊取美國的知識產權才得以崛起後,OpenAI又跟微軟一同表示要調查DeepSeek是否偷取OpenAI的數據,是否用GPT來幫助訓練DeepSeek自己的模型(也就是「蒸餾」)。直到2月3日,OpenAI總執行長奧特曼才在東京表示,「我們目前沒計畫控告DeepSeek,我們只會繼續打造優異的產品,以模型實力引領世界。」

此外,義大利直接以不合規為由下架DeepSeek,並要求其提供關於個人數據使用情況的解釋。愛爾蘭向DeepSeek發送信函,要求其提供如何處理用戶數據的報告。澳大利亞呼籲民眾要謹慎使用DeepSeek。美國海軍基於「潛在安全和道德問題」,要求相關人員「不得以任何形式下載、安裝或使用DeepSeek模型」。

DeepSeek在爆紅後,也持續遭受網路攻擊,中國網路安全公司奇安信安全專家透露,攻擊IP全部來自美國,監測發現,DeepSeek近一個月來一直遭受大量海外攻擊,1月27日起手段不斷升級,除了DDoS(分布式阻斷服務)攻擊,還包括大量密碼爆破攻擊、HTTP代理攻擊、僵屍網絡等多種攻擊技術和手段。

xxx1月28日凌晨,DeepSeek官網公告遭受大規模惡意攻擊。圖源:DeepSeek官網

政治或許能影響科技的發展,但政治語言撼動不了科技技術的現實。川普在共和黨會議上公開喊話:「DeepSeek的崛起,是對美國科技界的警鐘!」矽谷創投家兼川普顧問馬克·安德森(Marc Andreessen),將DeepSeek R1稱為「人工智能的斯普特尼克時刻」。

輝達高級研究科學家Jim Fan在個人社交平台上公開發文表示:「在我們所處的這條時間線上,一家非美國公司正在維持 OpenAI 最初的使命——真正開放的、前沿的研究,讓所有人受益。這完全說不通。但最具娛樂性的結果往往也是最有可能的。」他不但讚美DeepSeek的開放,也諷刺了OpenAI不透明的封閉。

xxx輝達GEAR Lab項目負責人Jim Fan對DeepSeek R1的評價。圖源:「X」截圖

xxx前Meta AI工作人員、知名AI論文作者Elvis對DeepSeek R1的評價。圖源:「X」截圖

xxxAI圈知名人物Yuchen Jin對DeepSeek R1的評價。圖源:「X」截圖

◎兩岸犇報綜合微信公眾號「羅輯思維」、「AI應用官」、「中央廣電總台中國之聲」、「禾刀愛AI」、「騰訊科技」、「央視網」
◎編輯|山那編

【您可能有興趣】
《中國製造2025》讓美國迎來新的「斯普特尼克時刻」
《黑神話:悟空》創造歷史 獲TGA 2024年度最佳動作遊戲與玩家之聲!
成吉鹿|中國帶動新一輪清潔新能源的工業革命
科技強則國家強!中國科技快速崛起令美國擔憂
美智庫專家:忘掉晶片吧—中國是衝著船隻來的

0 Comments