You are currently at: stock360.hkej.com
Skip This Ads
  • 恒生指數 26438.28 351.96
  • 國企指數 9394.67 134.42
  • 上證指數 3884.71 9.40

2025年6月17日

MiniMax開源推理模型M1 稱性價比勝DeepSeek

內地「AI六小虎」之一的稀宇科技(MiniMax)發布新款開源大模型MiniMax-M1,稱其性價比優於DeepSeek。

MiniMax表示,M1是全球首個開源的大規模混合架構的推理模型。據介紹,M1在面向生產力的複雜場景中能力是開源模型中的最好一檔,超過國內的閉源模型,接近海外的最領先模型,同時又有業內最高的性價比。

MiniMax披露,M1的優勢是支持目前業內最高的100萬上下文的輸入,和閉源模型裏面的Google Gemini 2.5 Pro一樣,是DeepSeek R1的8倍,以及業內最長的8萬Token推理輸出。MiniMax在標準基準測試集上的對比顯示,在複雜的軟件工程、工具使用和長上下文任務方面,M1優於DeepSeek-R1和Qwen3-235B等開源模型。

此次M1的最大優勢之一體現在成本上。根據M1大模型分析自身的技術優勢顯示,M1採用低成本訓練,僅用512塊H800 GPU及3周時間便完成強化學習訓練階段,成本為53.47萬美元(約417萬港元),僅為同類模型訓練成本的十分之一。

MiniMax稱,得益於以閃電注意力機制為主的混合架構,從而在計算長的上下文輸入以及深度推理的時候顯著高效。根據推算,在生成長度為10萬tokens的場景下,M1的計算量(FLOPs)為DeepSeek R1的25%,在長文本處理任務中具備顯著優勢。

複雜任務表現接近甚至超越R1

據介紹,M1的核心優勢在於超長上下文處理能力和極低的算力消耗,同時在複雜任務(如工具調用、長文本理解)中表現接近甚至超越DeepSeek R1。其訓練成本僅為R1的十分之一,且提供更靈活的API定價策略,尤其適合需要處理百萬級token的場景(如法律文檔分析、代碼庫理解)。DeepSeek R1則在傳統數學推理和程式設計基準測試中略佔優勢,但受限於上下文長度和計算效率,在長文本任務中明顯落後M1。

價格方面,M1在MiniMax App和Web上支持不限量免費使用。在API方面,第一檔0-32k的輸入長度時,每百萬token輸入為0.8元, 輸出8元;第二檔32k-128k的輸入長度時,每百萬token輸入為1.2元, 輸出16元;第三檔128k-1M輸入長度時,每百萬token輸入為2.4元, 輸出24元。

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。

信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力提供準確而可靠的資料,但不能保證資料絕對無誤,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。

建議瀏覽器: Chrome, Firefox, Safari, IE9或以上

信報財經新聞有限公司版權所有,不得轉載。
Copyright © 2025 Hong Kong Economic Journal Company Limited. All rights reserved.