You are currently at: stock360.hkej.com
Skip This Ads
  • 恒生指數 26528.72 10.07
  • 國企指數 9458.93 15.94
  • 上證指數 3849.73 3.91

2025年9月12日

阿里開源Qwen3-Next 模型訓練成本降九成

阿里巴巴(09988)旗下通義千問團隊發布下一代基礎模型架構Qwen3-Next,其訓練成本較密集模型Qwen3-32B大降逾90%,長文本推理輸送量提升10倍以上,並可支持百萬Tokens(詞元)超長上下文。

Qwen3-Next針對大模型在上下文長度和總參數兩方面不斷擴展(Scaling)的未來趨勢而設計,採用全新的高稀疏MoE架構,並對經典Transformer核心組件進行重構,創新採用線性注意力和自研門控注意力結合的混合注意力機制,實現模型訓練和推理的雙重性價比突破。

基於這一新架構,阿里通義「打樣」了Qwen3-Next-80B-A3B系列模型,開源指令(Instruct)和推理(Thinking)兩大模型版本。新模型總參數80B僅啟動3B,性能可媲美千問3旗艦版235B模型,模型計算效率大幅提升。

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。

信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力提供準確而可靠的資料,但不能保證資料絕對無誤,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。

建議瀏覽器: Chrome, Firefox, Safari, IE9或以上

信報財經新聞有限公司版權所有,不得轉載。
Copyright © 2025 Hong Kong Economic Journal Company Limited. All rights reserved.