You are currently at: stock360.hkej.com
Skip This Ads
  • 恒生指數 23601.26 56.95
  • 國企指數 8583.86 26.22
  • 上證指數 3348.37 31.82

2025年3月6日

阿里雲推新模型QwQ-32B 稱性能媲美DeepSeek-R1

阿里巴巴(09988)旗下阿里雲發布並開源「通義千問」(Qwen)系列推理模型QwQ-32B。

「通義千問」團隊介紹,QwQ-32B是一款擁有320億參數的模型,其性能可與具備6710億參數(其中370億被啟動)的DeepSeek-R1媲美。這一成果突顯將強化學習應用於經過大規模預訓練的強大基礎模型的有效性,團隊還在推理模型中集成了與Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境反饋調整推理過程。

QwQ-32B大幅降低部署使用成本,在消費級顯卡上也能實現本地部署。目前,阿里已採用寬鬆的Apache2.0協議,將QwQ-32B模型向全球開源。

阿里雲表示,這是「通義千問」在大規模強化學習(RL)以增強推理能力方面的第一步。在致力開發下一代「通義千問」的過程中,阿里雲計劃將更強大的基礎模型與依託規模化計算資源的RL相結合,從而使其更接近實現人工通用智能(AGI)。此外,阿里雲正積極探索將智能體與RL集成,以實現長時推理,目標是通過推理時間擴展來釋放更高的智能。

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。

信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力提供準確而可靠的資料,但不能保證資料絕對無誤,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。

信報財經新聞有限公司版權所有,不得轉載。
Copyright © 2025 Hong Kong Economic Journal Company Limited. All rights reserved.