DeepSeek突破科技封鎖美國AI領先中國只剩3至6個月

分類「當代中國」 / 「科技 IN TOUCH」

DeepSeek突破科技封鎖美國AI領先中國只剩3至6個月

By 犇報綜合 / 2025-02-07 17:19:00 /

摘要：

DeepSeek不僅開源、免費下載，還公開訓練方法，允許任何人進行數據蒸餾並商業化。在美國對中國高科技封鎖日趨嚴格的背景下，DeepSeek成功證明中國國產AI仍能突破限制。白宮AI與加密貨幣負責人塞克斯直言，美國AI領先中國僅3至6個月。

DeepSeek在中國春節期間掀起全球波瀾。圖源：網路圖片

1月20日，在世界經濟論壇2025年年會開幕當天，中國AI公司DeepSeek（深度求索）發布最新開源模型R1，一個具有推理功能的最新大模型，用純深度學習的方法讓AI自發湧出推理能力，在數學、代碼、自然語言推理等任務上，性能比肩美國開放人工智能研究中心（OpenAI）的o1模型正式版，甚至偶爾超過o1的水平，是除了OpenAI以外，目前唯一一個做到這點的模型。

令人吃驚的是，DeepSeek R1模型的訓練成本僅為560萬美元，僅用十分之一的成本就達到了GPT-o1級別的表現，遠低於美國OpenAI、Google、Meta公司等科技巨頭在人工智能技術上投入的數億美元乃至數十億美元。且DeepSeek R1完全開源，DeepSeek公司甚至發布論文，詳細介紹訓練的所有步驟和竅門。重點是，DeepSeek公司是一家純粹的中國公司，公司裡的工程師、研發人員全是中國教育自主培育出來的人才。

DeepSeek在中國春節掀起的全球波瀾

DeepSeek於1月20日發布R1以來，短短一周下載量暴漲375%，取代競爭對手OpenAI的ChatGPT，成為中美App Store下載量最大、排名第一的免費應用程序，碾壓ChatGPT、Google Gemini等老牌AI霸主，成為全球AI用戶的新寵兒。

1月27日，DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜，在美區下載榜上超越了ChatGPT。圖源：網路圖片

1月27日，美股開盤即大幅下跌，科技股哀鴻遍野，納指暴跌3%，NVIDIA當日股價暴跌約17%，一天蒸發近2000億美元，創下美股歷史最大單日市值蒸發紀錄，博通公司股價下跌17%，超威半導體公司（AMD）股價下跌6%，微軟股價下跌2%。市場分析認為，核心原因是DeepSeek的最新突破，動搖了美國科技行業的「無敵」地位。

1月27日，NVIDIA股價暴跌約17%，一天蒸發近2000億美元，創下美股歷史最大單日市值蒸發紀錄。圖源：央視網

此前，全球普遍認為美國在AI技術上領先中國2至3年。去年12月前Google CEO艾瑞克·施密特（Eric Schmidt）受訪時，曾表示美國的AI優勢已縮減至不到1年。此次DeepSeek R1追趕上OpenAI o1模型，更讓白宮AI與加密貨幣負責人塞克斯（David Sacks）直言，美國AI領先中國僅3至6個月。

早在2024年12月26日，DeepSeek發布並同步開源的DeepSeek V3模型，就已在全球AI領域掀起話題。DeepSeek V3的總訓練成本只有557.6萬美元，以1/11的算力、僅2000個GPU晶片訓練出性能超越GPT-4o的大模型。而GPT-4o的訓練成本約1億美元，使用25,000個GPU晶片。雙方的成本至少是10倍的差距。

DeepSeek，全稱為「杭州深度求索人工智能基礎技術研究有限公司」，成立於2023年7月17日，是一家創新型科技公司，專注於開發先進的大語言模型（LLM）和相關技術。在矽谷，DeepSeek很早就被稱作「來自東方的神秘力量」。

DeepSeek為什麼掀起這麼大的波瀾

DeepSeek不僅開源、免費下載，還公開訓練方法，允許任何人進行數據蒸餾並商業化。在美國對中國高科技封鎖不斷升高的背景下，DeepSeek成功證明中國國產AI仍能突破限制。透過技術優化、開源策略及成本控制，重新定義AI市場規則，讓高性能AI變得觸手可及，徹底改變產業生態。

DeepSeek R1在數學、編程、邏輯推理領域表現卓越，僅憑極少標註數據，大幅提升推理能力，與OpenAI o1正式版不相上下。DeepSeek R1擁有6710億參數，透過混合專家模型（Mixture of Experts），每次推理調用的參數僅370億，使其速度快且成本極低。

DeepSeek R1的訓練成本僅為ChatGPT的1/10至1/20，API調用費用為每百萬tokens 16元，遠低於ChatGPT的438元，相差27倍。而在提供服務方面，DeepSeek官方免費提供，API的價格為每百萬tokens 2.19美元，相較於OpenAI o1的60美元，僅為其4%。

DeepSeek R1模型與o1類推理模型輸入輸出價格對比，圖源：DeepSeek

DeepSeek R1 API價格。圖源：DeepSeek

DeepSeek R1的推出，大幅降低企業、開發者及個人使用AI的門檻，使企業能更低成本接入AI，開發者無須擔憂昂貴費用，個人用戶則可免費使用。目前DeepSeek已用阿里Qwen和Meta Llama等開源模型蒸餾出六款小型模型，其中一款320億參數的模型在數學與編程性能上超越了o1-mini，而15億參數的迷你模型則超越了GPT-4o與Claude 3.5 Sonnet，甚至可在個人電腦或手機上運行。

傳統的模型訓練路徑。圖源：騰訊科技

DeepSeek R1的論文也首度公開推理模型的內部機制。DeepSeek採用無人工干預的強化學習方式，類似AlphaZero自我對弈學習棋藝，透過獎勵機制自行摸索推理能力。模型自發學會：

- 解數學題時寫下步驟並自動檢查

- 發現錯誤後中止思考並重新推導

- 解題後反思步驟，嘗試不同方法找出最優解

- 自動生成詳細解題步驟

- 對較難題目延長推理時間

這些能力皆為模型自主習得，無需工程師手動設定。DeepSeek選擇開源，而ChatGPT則維持封閉生態，收費高昂。開源讓開發者能自由優化模型，企業可自部署，確保數據安全，全球開源社群也能持續優化模型。這種策略類似Android開源模式，對比ChatGPT的封閉生態更具吸引力。

DeepSeek沒那麼厲害？美西方的反應最為真實

面對來自DeepSeek造成的衝擊，OpenAI的CEO山姆·奧特曼（Sam Altman）最開始在「X」上感嘆：「DeepSeek的表現令人印像深刻！」然而，當白宮人工智能顧問大衛·薩克斯受訪表示DeepSeek「有可能」竊取美國的知識產權才得以崛起後，OpenAI又跟微軟一同表示要調查DeepSeek是否偷取OpenAI的數據，是否用GPT來幫助訓練DeepSeek自己的模型（也就是「蒸餾」）。直到2月3日，OpenAI總執行長奧特曼才在東京表示，「我們目前沒計畫控告DeepSeek，我們只會繼續打造優異的產品，以模型實力引領世界。」

此外，義大利直接以不合規為由下架DeepSeek，並要求其提供關於個人數據使用情況的解釋。愛爾蘭向DeepSeek發送信函，要求其提供如何處理用戶數據的報告。澳大利亞呼籲民眾要謹慎使用DeepSeek。美國海軍基於「潛在安全和道德問題」，要求相關人員「不得以任何形式下載、安裝或使用DeepSeek模型」。

DeepSeek在爆紅後，也持續遭受網路攻擊，中國網路安全公司奇安信安全專家透露，攻擊IP全部來自美國，監測發現，DeepSeek近一個月來一直遭受大量海外攻擊，1月27日起手段不斷升級，除了DDoS（分布式阻斷服務）攻擊，還包括大量密碼爆破攻擊、HTTP代理攻擊、僵屍網絡等多種攻擊技術和手段。

1月28日凌晨，DeepSeek官網公告遭受大規模惡意攻擊。圖源：DeepSeek官網

政治或許能影響科技的發展，但政治語言撼動不了科技技術的現實。川普在共和黨會議上公開喊話：「DeepSeek的崛起，是對美國科技界的警鐘！」矽谷創投家兼川普顧問馬克·安德森（Marc Andreessen），將DeepSeek R1稱為「人工智能的斯普特尼克時刻」。

輝達高級研究科學家Jim Fan在個人社交平台上公開發文表示：「在我們所處的這條時間線上，一家非美國公司正在維持 OpenAI 最初的使命——真正開放的、前沿的研究，讓所有人受益。這完全說不通。但最具娛樂性的結果往往也是最有可能的。」他不但讚美DeepSeek的開放，也諷刺了OpenAI不透明的封閉。

輝達GEAR Lab項目負責人Jim Fan對DeepSeek R1的評價。圖源：「X」截圖

前Meta AI工作人員、知名AI論文作者Elvis對DeepSeek R1的評價。圖源：「X」截圖

AI圈知名人物Yuchen Jin對DeepSeek R1的評價。圖源：「X」截圖

◎兩岸犇報綜合微信公眾號「羅輯思維」、「AI應用官」、「中央廣電總台中國之聲」、「禾刀愛AI」、「騰訊科技」、「央視網」
◎編輯｜山那編

【您可能有興趣】
‧《中國製造2025》讓美國迎來新的「斯普特尼克時刻」
‧《黑神話：悟空》創造歷史獲TGA 2024年度最佳動作遊戲與玩家之聲！
‧ 成吉鹿｜中國帶動新一輪清潔新能源的工業革命
‧ 科技強則國家強！中國科技快速崛起令美國擔憂
‧ 美智庫專家：忘掉晶片吧—中國是衝著船隻來的

2190

0 Comments

分類 「當代中國」 / 「科技 IN TOUCH」

DeepSeek突破科技封鎖 美國AI領先中國只剩3至6個月

分類「當代中國」 / 「科技 IN TOUCH」

DeepSeek突破科技封鎖美國AI領先中國只剩3至6個月