當地時(shí)間1月27日,納斯達克股指出現3%下跌,原因是中國人工智能公司DeepSeek模型引發(fā)美國投資者關(guān)注。
央視記者在納斯達克交易所現場(chǎng)對納斯達克副主席麥柯奕進(jìn)行了采訪(fǎng)。麥柯奕表示,他認為,DeepSeek將是人工智能領(lǐng)域革命的重要組成部分。
因受到DeepSeek人工智能模型沖擊,美國芯片巨頭英偉達(NVIDIA)當日股價(jià)暴跌約17%,博通公司股價(jià)下跌17%,超威半導體公司(AMD)股價(jià)下跌6%,微軟股價(jià)下跌2%。此外,人工智能領(lǐng)域的衍生品,如電力供應商也受到重創(chuàng )。美國聯(lián)合能源公司股價(jià)下跌21%,Vistra的股價(jià)下跌29%。
版權圖庫圖片,轉載可能引發(fā)版權糾紛
01 最新開(kāi)源模型R1引發(fā)關(guān)注
本月,DeepSeek在世界經(jīng)濟論壇2025年年會(huì )開(kāi)幕當天發(fā)布了最新開(kāi)源模型R1,再次引發(fā)全球關(guān)注。
據介紹,R1模型在技術(shù)上實(shí)現了重要突破——用純深度學(xué)習方法讓AI自發(fā)涌現出推理能力,在數學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI的o1模型正式版,且訓練成本僅為560萬(wàn)美元,遠低于美國科技巨頭的數億美元乃至數十億美元投入。
02 DeepSeek到底是個(gè)啥?
DeepSeek是一款由國內人工智能公司研發(fā)的大型語(yǔ)言模型,擁有強大的自然語(yǔ)言處理能力,能夠理解并回答問(wèn)題,還能輔助寫(xiě)代碼、整理資料和解決復雜的數學(xué)問(wèn)題。
與OpenAI開(kāi)發(fā)的ChatGPT相比,DeepSeek不僅率先實(shí)現了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達到了GPT-o1級別的表現,引發(fā)海外AI圈的廣泛討論。
北京郵電大學(xué)人工智能學(xué)院人機交互與認知工程實(shí)驗室主任劉偉介紹,DeepSeek最大的優(yōu)勢在于算法的改進(jìn)和優(yōu)化,節省了算力和數據量。以前如果說(shuō)OpenAI是“大力出奇跡”,如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創(chuàng )造奇跡。
03 更大不再等于更聰明
據深度求索公司官網(wǎng)介紹,DeepSeek-R1在后訓練階段大規模使用了強化學(xué)習技術(shù),在僅有很少標注數據的情況下極大提升了模型的推理能力,在數學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,測評性能與GPT-o1模型正式版接近。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過(guò)顯著(zhù)提高數據質(zhì)量和改進(jìn)模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說(shuō),DeepSeek的模型現在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個(gè)數量級。
高盛集團也認為,DeepSeek新模型的成本遠低于現有模型,這意味著(zhù)開(kāi)發(fā)利用大模型的門(mén)檻降低,互聯(lián)網(wǎng)巨頭將面臨初創(chuàng )公司的潛在競爭。
英國《金融時(shí)報》發(fā)表的一篇評論文章指出,DeepSeek挑戰了人工智能產(chǎn)業(yè)在過(guò)去一段時(shí)間的核心信念,即認為更強大的硬件才是推動(dòng)人工智能發(fā)展的關(guān)鍵。
版權圖庫圖片,轉載可能引發(fā)版權糾紛
04 開(kāi)源:未來(lái)的發(fā)展方向?
DeepSeek采用了完全開(kāi)源策略,不僅降低了用戶(hù)的使用門(mén)檻,還促進(jìn)了AI開(kāi)發(fā)者社區的協(xié)作生態(tài)。通過(guò)開(kāi)源,DeepSeek吸引了大量開(kāi)發(fā)者和研究人員的關(guān)注,推動(dòng)了AI技術(shù)的發(fā)展。英偉達AI科學(xué)家Jim Fan稱(chēng)贊DeepSeek是“真正開(kāi)放的前沿研究,賦能所有人”。
當然,開(kāi)源也面臨著(zhù)保護知識產(chǎn)權和開(kāi)源社區秩序維護等挑戰。
俞揚表示,開(kāi)源只是一種商業(yè)模式,即便開(kāi)源項目也擁有版權。開(kāi)源與閉源之爭,實(shí)質(zhì)上是不同商業(yè)模式在特定場(chǎng)景和時(shí)代背景下的有效性對比。
DeepSeek的成功被一些人視為中國技術(shù)理想主義的體現,甚至被外國人比喻為神秘的東方力量。
但從整個(gè)AI大模型產(chǎn)業(yè)來(lái)看,DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過(guò)算法優(yōu)化而非單純依賴(lài)算力和數據量來(lái)提升模型性能。這一方向也為AI大模型產(chǎn)業(yè)的發(fā)展提供了新的思路。
歡迎掃碼關(guān)注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動(dòng)和科普好物!