阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數學、編程尤為出色

發布日期：2024-11-29

548 次

11月28日消息，今天，阿里云通義團隊宣布推出并同步開源了全新的AI推理模型——QwQ-32B-Preview。

評測顯示，預覽版本的QwQ（Qwen with Questions）在科學推理能力上展現出研究生水平，尤其在數學和編程領域表現卓越，其整體推理能力可與OpenAI的o1相媲美。

據介紹，QwQ是通義千問Qwen大模型最新推出的實驗性研究模型，也是阿里云首個開源的AI推理模型。

阿里云通義千問團隊研究發現，當模型有足夠的時間思考、質疑和反思時，其對數學和編程的理解就會深化，基于此QwQ取得了解決復雜問題的突破性進展。

在衡量科學問題解決能力的GPQA評測集中，QwQ達到了65.2%的準確率，顯示出其研究生水平的科學推理能力；在AIME評測中，QwQ以50%的勝率證明了其解決數學問題的能力。

在MATH-500評測中，QwQ以90.6%的高分超越了o1-preview和o1-mini。在評估高難度代碼生成的LiveCodeBench評測中，QwQ答對了一半的題目，在編程競賽題場景中也有出色表現。

不僅如此，QwQ在面對復雜問題時，能夠進行深度自省，質疑自身假設，并通過深思熟慮的自我對話，仔細審視其推理過程的每一步。

例如，在解決經典智力題“猜牌問題”時，QwQ通過梳理對話和推演，像個擅長思考的人一樣，并最終得出正確答案。

目前，QwQ-32B-Preview已在魔搭社區和HuggingFace等平臺上開源，發布短短幾小時，引起全球開發者熱情體驗。

有開發者認為該模型“是完全沒有預料到的瘋狂的躍進”、“今年開源領域最重大的突破”、“讓中國在開源大模型和AI推理上占據先機”。

不過通義團隊也表示，雖然QwQ展現了強大的分析能力，但其仍是個供研究的實驗型模型，存在不同語言的混合使用、偶有不恰當偏見、對專業領域問題不了解等局限，未來隨著研究深入模型迭代，這些問題將逐步得到解決。

版權聲明：本站內容除特別聲明的原創文章之外，轉載內容只為傳遞更多信息，并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經濟損失。聯系電話：020-2204 2442,郵箱：Sales@greentest.com.cn。

上一篇: 中國半導體硅片替代加速已沖擊到海外供應商出貨量
下一篇: 邊緣AI半導體企業Ambarella首款2nm芯片2025Q4流片,預計由三星電子代工

為您精選

馬斯克：現實世界中用于訓練AI模型的數據已經所剩無幾

1 月 9 日消息，據 TechCrunch 報道，馬斯克與其他人工智能專家一致認為，現實世界中用于訓練AI 模型的數據幾乎已經耗盡。在···

更新日期：2025-01-13 461 次
馬斯克旗下xAI發布Grok 3模型

2月18日消息，當地時間周一晚上8點（北京時間18日中午12點），馬斯克旗下人工智能公司xAI召開發布會，正式推出Grok 3模型，并···

更新日期：2025-02-19 141 次
昆侖萬維開源視頻生成模型SkyReels-V1,國內首個面向AI短劇創作的視頻生成···

2 月 18 日消息，昆侖萬維今日宣布開源國內首個面向 AI 短劇創作的視頻生成模型SkyReels-V1、國內首個 SOTA 級別基于視頻基座···

更新日期：2025-02-18 215 次
復旦聯手百度打造AI開源模型Hallo2,根據音頻生成4K分辨率1小時長視頻

10 月 21 日消息，復旦大學和百度聯合開發了一款名為Hallo2的全新 AI 模型，該模型可以生成長達數小時的 4K 分辨率人物動畫，···

更新日期：2024-10-22 464 次

最新文章

VectWorks測試軟件之報告查看

發布日期: 2025-04-24
VectWorks測試軟件之測試管理

發布日期: 2025-04-24
VectWorks測試軟件之測試設計

發布日期: 2025-04-24
VectWorks測試軟件之儀器連接

發布日期: 2025-04-24
VectWorks測試軟件之帳戶權限

發布日期: 2025-04-24

關于綠測

廣州綠測電子科技有限公司（簡稱：綠測科技）成立于2015年11月，是一家專注于耕耘測試與測量行業的技術開發公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業的管家服務。綠測科技的研發部及工廠設立于廣州番禺區，隨著公司業務的發展，先后在廣西南寧、深圳、廣州南沙、香港等地設立了機構。綠測科技經過深耕測試與測量領域多年，組建了一支經驗豐富的團隊，可為廣大客戶提供品質過硬的產品及測試技術服務等支持。

查看詳情

應用解決方案

產品與服務

新聞資訊

綠測工場服務號

綠測科技訂閱號

020-2204 2442

97人人爽|97碰在线视频|三年片在线|中文字幕一区二区三区三区四区

新聞資訊

行業資訊

阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數學、編程尤為出色

為您精選

熱門文章

蘋果發布語言模型OpenELM：基于開源···

華為公布《一種星間鏈路構建方法及···

比亞迪：Q1動力電池及儲能電池裝機···

Melexis革新發布無代碼單線圈驅動芯···

比亞迪將開發更安全的兩輪車電池？···

BMS芯片，迎來更多入局者

美擬對中國電動汽車征收100%關稅

英飛凌新型OptiMOS 7 MOSFET面向各···

最新文章

VectWorks測試軟件之報告查看

VectWorks測試軟件之測試管理

VectWorks測試軟件之測試設計

VectWorks測試軟件之儀器連接

VectWorks測試軟件之帳戶權限

熱門標簽

在線客服

微信在線咨詢

聯系電話

咨詢熱線

公眾號

微信掃一掃

回到頂部