最近幾個月,一家名為DeepSeek 的中國人工智慧新創公司透過挑戰矽谷在人工智慧領域的主導地位引起了全球關注。這家新創公司的創新方法震驚了科技業(和股票市場),展示了其以比OpenAI 和谷歌 等老牌美國公司更低的成本製作人工智慧模型的能力。
DeepSeek 的革命性 AI 模型
DeepSeek 突破的核心是其 R1 模型,這是一個大型語言模型 (LLM),可與其競爭對手開發的領先 AI 系統的能力相媲美。 R1 的與眾不同之處在於它能夠在最少的人為幹預下自主學習和改進——這一特性標誌著向通用人工智慧 (AGI) 的飛躍。
同樣值得注意的是,DeepSeek 聲稱已經使用低成本 CPU 訓練了 R1 模型(據報道,使用售價 10,000 美元的 Nvidia A100 Tensor Core GPU,而美國競爭對手則依賴售價 70,000 美元以上的 Nvidia H800 GPU)。據稱,DeepSeek 花費了相當於 560 萬美元的成本來啟動和運行 R1 模型——與美國科技巨頭花費的數億美元(甚至數十億美元)相比,這只是九牛一毛。這種具有成本效益的策略引發了全球關於人工智慧基礎設施和創新能力未來的爭論,更不用說在此過程中對英偉達和其他科技股的股價產生了負面影響。
...