MiniMax開源推理模型M1 稱性價比勝DeepSeek

內地「AI六小虎」之一的稀宇科技(MiniMax)發布新款開源大模型MiniMax-M1，稱其性價比優於DeepSeek。

MiniMax表示，M1是全球首個開源的大規模混合架構的推理模型。據介紹，M1在面向生產力的複雜場景中能力是開源模型中的最好一檔，超過國內的閉源模型，接近海外的最領先模型，同時又有業內最高的性價比。

MiniMax披露，M1的優勢是支持目前業內最高的100萬上下文的輸入，和閉源模型裏面的Google Gemini 2.5 Pro一樣，是DeepSeek R1的8倍，以及業內最長的8萬Token推理輸出。MiniMax在標準基準測試集上的對比顯示，在複雜的軟件工程、工具使用和長上下文任務方面，M1優於DeepSeek-R1和Qwen3-235B等開源模型。

此次M1的最大優勢之一體現在成本上。根據M1大模型分析自身的技術優勢顯示，M1採用低成本訓練，僅用512塊H800 GPU及3周時間便完成強化學習訓練階段，成本為53.47萬美元(約417萬港元)，僅為同類模型訓練成本的十分之一。

MiniMax稱，得益於以閃電注意力機制為主的混合架構，從而在計算長的上下文輸入以及深度推理的時候顯著高效。根據推算，在生成長度為10萬tokens的場景下，M1的計算量(FLOPs)為DeepSeek R1的25%，在長文本處理任務中具備顯著優勢。

複雜任務表現接近甚至超越R1

據介紹，M1的核心優勢在於超長上下文處理能力和極低的算力消耗，同時在複雜任務(如工具調用、長文本理解)中表現接近甚至超越DeepSeek R1。其訓練成本僅為R1的十分之一，且提供更靈活的API定價策略，尤其適合需要處理百萬級token的場景(如法律文檔分析、代碼庫理解)。DeepSeek R1則在傳統數學推理和程式設計基準測試中略佔優勢，但受限於上下文長度和計算效率，在長文本任務中明顯落後M1。

價格方面，M1在MiniMax App和Web上支持不限量免費使用。在API方面，第一檔0-32k的輸入長度時，每百萬token輸入為0.8元，輸出8元；第二檔32k-128k的輸入長度時，每百萬token輸入為1.2元，輸出16元；第三檔128k-1M輸入長度時，每百萬token輸入為2.4元，輸出24元。

下一篇：外管局:5月外資進一步增持境內股票

上一篇：胡潤交換禮物換得限量版Labubu 再換百萬自駕車張朝陽後悔了？

回上