當地時間1月27日,納斯達克股指出現3%下跌,原因是中國人工智能公司DeepSeek模型引發美國投資者關注。
央視記者在納斯達克交易所現場對納斯達克副主席麥柯奕進行了采訪。麥柯奕表示,他認為,DeepSeek將是人工智能領域革命的重要組成部分。
因受到DeepSeek人工智能模型沖擊,美國芯片巨頭英偉達(NVIDIA)當日股價暴跌約17%,博通公司股價下跌17%,超威半導體公司(AMD)股價下跌6%,微軟股價下跌2%。此外,人工智能領域的衍生品,如電力供應商也受到重創。美國聯合能源公司股價下跌21%,Vistra的股價下跌29%。
版權圖庫圖片,轉載可能引發版權糾紛
01 最新開源模型R1引發關注
本月,DeepSeek在世界經濟論壇2025年年會開幕當天發布了最新開源模型R1,再次引發全球關注。
據介紹,R1模型在技術上實現了重要突破——用純深度學習方法讓AI自發涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩OpenAI的o1模型正式版,且訓練成本僅為560萬美元,遠低于美國科技巨頭的數億美元乃至數十億美元投入。
02 DeepSeek到底是個啥?
DeepSeek是一款由國內人工智能公司研發的大型語言模型,擁有強大的自然語言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復雜的數學問題。
與OpenAI開發的ChatGPT相比,DeepSeek不僅率先實現了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達到了GPT-o1級別的表現,引發海外AI圈的廣泛討論。
北京郵電大學人工智能學院人機交互與認知工程實驗室主任劉偉介紹,DeepSeek最大的優勢在于算法的改進和優化,節省了算力和數據量。以前如果說OpenAI是“大力出奇跡”,如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創造奇跡。
03 更大不再等于更聰明
據深度求索公司官網介紹,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有很少標注數據的情況下極大提升了模型的推理能力,在數學、代碼、自然語言推理等任務上,測評性能與GPT-o1模型正式版接近。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數據質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說,DeepSeek的模型現在低成本優勢突出,與國際知名大模型相比,其成本大約低了一個數量級。
高盛集團也認為,DeepSeek新模型的成本遠低于現有模型,這意味著開發利用大模型的門檻降低,互聯網巨頭將面臨初創公司的潛在競爭。
英國《金融時報》發表的一篇評論文章指出,DeepSeek挑戰了人工智能產業在過去一段時間的核心信念,即認為更強大的硬件才是推動人工智能發展的關鍵。
版權圖庫圖片,轉載可能引發版權糾紛
04 開源:未來的發展方向?
DeepSeek采用了完全開源策略,不僅降低了用戶的使用門檻,還促進了AI開發者社區的協作生態。通過開源,DeepSeek吸引了大量開發者和研究人員的關注,推動了AI技術的發展。英偉達AI科學家Jim Fan稱贊DeepSeek是“真正開放的前沿研究,賦能所有人”。
當然,開源也面臨著保護知識產權和開源社區秩序維護等挑戰。
俞揚表示,開源只是一種商業模式,即便開源項目也擁有版權。開源與閉源之爭,實質上是不同商業模式在特定場景和時代背景下的有效性對比。
DeepSeek的成功被一些人視為中國技術理想主義的體現,甚至被外國人比喻為神秘的東方力量。
但從整個AI大模型產業來看,DeepSeek的成功或許代表了一種全新的發展方向——通過算法優化而非單純依賴算力和數據量來提升模型性能。這一方向也為AI大模型產業的發展提供了新的思路。
歡迎掃碼關注深i科普!
我們將定期推出
公益、免費、優惠的科普活動和科普好物!