阿里發佈 QwQ-32B AI 模型表現更勝 DeepSeek MacBook Pro 也可本機運行

macbookpro

阿里旗下 Qwen 團隊近日重磅推出 QwQ-32B AI 模型,這款僅有 320 億參數的模型,效能竟能與擁有 6,710 億參數(其中 370 億啟動)的 DeepSeek-R1 一較高下。團隊透露,這一突破來自強化學習技術的巧妙應用,並為模型注入 Agent 能力,讓它不僅能使用工具,還能批判思考並即時調整推理。從數學推理到程式設計,這款模型在多項基準測試中表現亮眼,甚至連筆電都能運行,令人驚嘆!

QwQ-32B

強化學習打造高效模型

QwQ-32B 的核心亮點在於其訓練方式。Qwen 團隊從冷啟動開始,採用大規模強化學習(RL)技術,特別針對數學和程式設計任務進行優化。不同於傳統依賴獎勵模型的做法,他們透過驗證數學答案的正確性提供反饋,並利用程式碼執行伺服器測試生成的程式碼是否通過案例。這種精準反饋機制,讓模型在訓練過程中逐步提升,展現出驚人的任務適應力。

通用能力全面進化

在數學與程式設計訓練告一段落後,團隊並未止步,而是啟動第二階段的強化學習,聚焦通用能力的提升。這次他們結合通用獎勵模型與基於規則的驗證器,讓 QwQ-32B 在更廣泛的應用場景中表現出色。令人驚喜的是,這一過程不僅強化了通用性,還保持了數學與程式設計領域的高水準,展現多領域均衡發展的潛力。

基準測試傲視群雄

QwQ-32B 在多項基準測試中大放異彩,涵蓋數學推理、程式設計能力與通用任務。其表現不僅媲美 DeepSeek-R1-Distilled-Qwen-32B 和 DeepSeek-R1-Distilled-Llama-70B,甚至超越 o1-mini 以及原始的 DeepSeek-R1。這意味著,儘管參數量遠低於對手,QwQ-32B 依然能憑藉優化技術站穩頂尖位置。

qwq 32b final

筆電運行開啟新可能

更令人振奮的是,QwQ-32B 不僅強大,還極具實用性。蘋果機器學習科學家 Awni Hannun 在 X 平台透露,他使用搭載 M4 Max 處理器與 MLX 深度學習框架的筆電成功運行這款模型。這表示,即便是普通用戶也能在日常設備上體驗頂級 AI 的威力,無需依賴龐大伺服器,大幅降低使用門檻。

m4max

開源共享惠及全球

Qwen 團隊將 QwQ-32B 在 Hugging Face 和 ModelScope 開源,採用 Apache 2.0 協議,並透過 Qwen Chat 提供直接體驗。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookIG