深度求索發布DeepSeek-V3.1模型

中國人工智能(AI)初創企業深度求索(DeepSeek)時隔近5個月再度宣布對V3基座模型進行升級，新發布的DeepSeek-V3.1模型支持混合推理架構，有更高的思考效率和更強的智能體(Agent)能力。

深度求索在微信公眾號發文稱，V3.1將實現一個模型同時支持思考模式與非思考模式；相較於其R1推理模型，V3.1的Think模式能在更短時間內給出答案。此外，通過「後訓練」(Post-Training)優化，新模型在工具使用與智能體任務中的表現有較大提升。

該公司表示，經過思維鏈壓縮訓練後，V3.1-Think在輸出token數減少20%至50%的情況下，各項任務的平均表現與公司的R1-0528持平。此外，在搜索智能體的多項測評中均取得較大提升，超過了R1-0528。

官方App與網頁端模型已同步升級至V3.1，DeepSeek的API(應用程序擴展接口)也同步升級，且上下文均已擴展為128K。這意味着模型現在能夠處理更多的訊息，並擁有更強的記憶能力。

V3.1的Base模型在V3的基礎上重新做了外擴訓練，一共增加訓練了840B大小的tokens。Base模型與後訓練模型均已開源。V3.1使用了UE8M0 FP8 Scale的參數精度。這是當前大模型訓練與推理中的一種高效低精度量化技術。

下一篇：A股開市初段靠穩

上一篇：迷你版Labubu將在速賣通全球發售

信報簡介｜服務條款｜私隱條款｜免責聲明｜廣告查詢｜加入信報｜聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見，本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前，投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素，並適當地尋求獨立的財務及專業意見。

信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均竭力提供準確而可靠的資料，但不能保證資料絕對無誤，且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。

建議瀏覽器： Chrome, Firefox, Safari, IE9或以上