3分鐘看懂為什么DeepSeek能震驚世界 低成本高效率引發全球關注

北京時間1月28日早上,近期備受關注的DeepSeek(深度求索)傳出兩件大事:遭受大規模惡意攻擊以及其產品在圖像生成基準測試中超越了OpenAI的DALL-E 3模型。這家中國公司再次引起全球矚目。

DeepSeek是一家由量化幻方運營的創新性大模型公司。幻方量化自2016年起推出首個AI模型,并于2023年成立了DeepSeek。2024年12月,DeepSeek發布了最新的AI模型DeepSeek-V3,并同步開源,訓練成本僅為557.6萬美元,整個訓練只需要280萬個GPU小時。這一低成本高性能的特性使其迅速吸引了硅谷的關注,臉書母公司meta甚至為此成立了四個專門研究小組來研究DeepSeek的工作原理,并基于此改進自己的Llama模型。

DeepSeek的產品不僅在技術上表現出色,在市場上也獲得了巨大成功。1月27日和28日,DeepSeek在中國區和美國區蘋果App Store免費榜均位列首位,超越了包括ChatGPT在內的多個知名AI產品。然而,由于用戶訪問量激增,DeepSeek曾出現兩次宕機現象。對此,公司回應稱問題已在數分鐘內得到解決。

面對大規模惡意攻擊,DeepSeek采取了限制非+86手機號注冊的方式以確保服務持續。盡管如此,一些用戶仍然遇到了登錄失敗的問題。記者嘗試通過官網和微信掃碼登錄,但未能成功。

? 版權聲明
評論 搶沙發
加載中~
每日一言
不怕萬人阻擋,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender