2025年1月27日
內地私募巨頭幻方量化旗下開源模型公司DeepSeek(深度求索),上周發布新模型DeepSeek-R1,在數學、代碼、自然語言推理等任務的性能媲美OpenAI o1正式版,引起中美科技界熱議。DeepSeek昨日在美國iOS免費應用下載榜攀上第四位。
內地網民反映DeepSeek服務一度提示「伺服器繁忙」,DeepSeek其後證實出現局部服務波動,問題已在數分鐘內解決,疑似與訪問量激增有關。
周鴻禕指AI爭霸中國必勝
去年12月,DeepSeek發布的開源模型DeepSeek-V3在業界引起轟動,其測評成績不單超越其他開源模型,性能上與OpenAI的GPT-4o及Anthropic的Claude-3.5-Sonnet等閉源模型相當。然而,DeepSeek的訓練僅耗時兩個月,訓練成本只有557萬美元,因此被稱為「AI界拼多多」。
最新發布的DeepSeek-R1則對標OpenAI的首個推理模型OpenAI o1。DeepSeek提到,該模型在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況下,極大提升模型推理能力。
360集團創始人周鴻禕在微博發文稱,中美兩國現在AI競爭日益激烈,但最終一定是中國勝利,每個人都要有信心,「就像中國在製造業領域已經戰勝美國一樣,中國AI公司的創造力已經煞不住車了。」
Meta首席AI科學家、圖靈獎得主楊立昆(Yann LeCun)則在社交平台表示,DeepSeek成功帶來的最大啟示不是中國競爭威脅加大,而是保持AI模型開源的價值,不是中國AI超越美國,而是開源模型超越閉源,DeepSeek正正是受惠於開放式研究和開源社區。
下一篇:舒適堡尖沙咀舖欠債逾六億
上一篇:世貿:關稅戰勢釀災難 籲勿報復