2025年12月2日
DeepSeek宣布同時推出兩個正式版人工智能模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale。V3.2在工具呼叫能力上達到目前開源模型最高水平,大幅縮小開源模型與閉源模型的差距。
大幅縮小開源與閉源模型差距
在推理能力方面,V3.2在數學基準(AIME 2025)測試中達到93.1%的通過率,接近GPT-5的94.6%和Gemini-3.0-Pro的95%。而Gemini-3.0-Pro在2025年國際數學奧林匹克競賽(IMO 2025)等四項國際頂級競賽中斬獲金牌。
V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent任務場景。V3.2-Speciale的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。