阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數(shù)學、編程尤為出色

發(fā)布日期：2024-11-29

476 次

11月28日消息，今天，阿里云通義團隊宣布推出并同步開源了全新的AI推理模型——QwQ-32B-Preview。

評測顯示，預覽版本的QwQ（Qwen with Questions）在科學推理能力上展現(xiàn)出研究生水平，尤其在數(shù)學和編程領域表現(xiàn)卓越，其整體推理能力可與OpenAI的o1相媲美。

據(jù)介紹，QwQ是通義千問Qwen大模型最新推出的實驗性研究模型，也是阿里云首個開源的AI推理模型。

阿里云通義千問團隊研究發(fā)現(xiàn)，當模型有足夠的時間思考、質(zhì)疑和反思時，其對數(shù)學和編程的理解就會深化，基于此QwQ取得了解決復雜問題的突破性進展。

在衡量科學問題解決能力的GPQA評測集中，QwQ達到了65.2%的準確率，顯示出其研究生水平的科學推理能力；在AIME評測中，QwQ以50%的勝率證明了其解決數(shù)學問題的能力。

在MATH-500評測中，QwQ以90.6%的高分超越了o1-preview和o1-mini。在評估高難度代碼生成的LiveCodeBench評測中，QwQ答對了一半的題目，在編程競賽題場景中也有出色表現(xiàn)。

不僅如此，QwQ在面對復雜問題時，能夠進行深度自省，質(zhì)疑自身假設，并通過深思熟慮的自我對話，仔細審視其推理過程的每一步。

例如，在解決經(jīng)典智力題“猜牌問題”時，QwQ通過梳理對話和推演，像個擅長思考的人一樣，并最終得出正確答案。

目前，QwQ-32B-Preview已在魔搭社區(qū)和HuggingFace等平臺上開源，發(fā)布短短幾小時，引起全球開發(fā)者熱情體驗。

有開發(fā)者認為該模型“是完全沒有預料到的瘋狂的躍進”、“今年開源領域最重大的突破”、“讓中國在開源大模型和AI推理上占據(jù)先機”。

不過通義團隊也表示，雖然QwQ展現(xiàn)了強大的分析能力，但其仍是個供研究的實驗型模型，存在不同語言的混合使用、偶有不恰當偏見、對專業(yè)領域問題不了解等局限，未來隨著研究深入模型迭代，這些問題將逐步得到解決。

版權聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：020-2204 2442,郵箱：Sales@greentest.com.cn。

上一篇: 中國半導體硅片替代加速已沖擊到海外供應商出貨量
下一篇: 邊緣AI半導體企業(yè)Ambarella首款2nm芯片2025Q4流片,預計由三星電子代工

為您精選

馬斯克：現(xiàn)實世界中用于訓練AI模型的數(shù)據(jù)已經(jīng)所剩無幾

1 月 9 日消息，據(jù) TechCrunch 報道，馬斯克與其他人工智能專家一致認為，現(xiàn)實世界中用于訓練AI 模型的數(shù)據(jù)幾乎已經(jīng)耗盡。在···

更新日期：2025-01-13 403 次
馬斯克旗下xAI發(fā)布Grok 3模型

2月18日消息，當?shù)貢r間周一晚上8點（北京時間18日中午12點），馬斯克旗下人工智能公司xAI召開發(fā)布會，正式推出Grok 3模型，并···

更新日期：2025-02-19 91 次
昆侖萬維開源視頻生成模型SkyReels-V1,國內(nèi)首個面向AI短劇創(chuàng)作的視頻生成···

2 月 18 日消息，昆侖萬維今日宣布開源國內(nèi)首個面向 AI 短劇創(chuàng)作的視頻生成模型SkyReels-V1、國內(nèi)首個 SOTA 級別基于視頻基座···

更新日期：2025-02-18 155 次
復旦聯(lián)手百度打造AI開源模型Hallo2,根據(jù)音頻生成4K分辨率1小時長視頻

10 月 21 日消息，復旦大學和百度聯(lián)合開發(fā)了一款名為Hallo2的全新 AI 模型，該模型可以生成長達數(shù)小時的 4K 分辨率人物動畫，···

更新日期：2024-10-22 408 次

最新文章

存儲芯片大廠美光宣布也將漲價

發(fā)布日期: 2025-03-31
全球首個內(nèi)河航運5G-A通感一體網(wǎng)絡正式開通運行

發(fā)布日期: 2025-03-31
全球超大規(guī)模數(shù)據(jù)中心數(shù)量五年翻倍,2024年新增137個

發(fā)布日期: 2025-03-31
繼芯片與人工智能后美國或考慮推出機器人國家戰(zhàn)略

發(fā)布日期: 2025-03-31
我國科學家發(fā)布全球首例微米級腦機接口多模態(tài)三維圖譜

發(fā)布日期: 2025-03-31

關于綠測

廣州綠測電子科技有限公司（簡稱：綠測科技）成立于2015年11月，是一家專注于耕耘測試與測量行業(yè)的技術開發(fā)公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業(yè)的管家服務。綠測科技的研發(fā)部及工廠設立于廣州番禺區(qū)，隨著公司業(yè)務的發(fā)展，先后在廣西南寧、深圳、廣州南沙、香港等地設立了機構。綠測科技經(jīng)過深耕測試與測量領域多年，組建了一支經(jīng)驗豐富的團隊，可為廣大客戶提供品質(zhì)過硬的產(chǎn)品及測試技術服務等支持。

查看詳情

應用解決方案

產(chǎn)品與服務

新聞資訊

綠測工場服務號

綠測科技訂閱號

020-2204 2442

97精品国产一区二区_亚洲国产成人久久成人52_国产精品对白刺激久久久_亚洲av午夜福利精品

新聞資訊

行業(yè)資訊

阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數(shù)學、編程尤為出色

為您精選

熱門文章

馬斯克要求SpaceX供應商將生產(chǎn)搬出···

微軟Phi-3-vision基準測試結果與Cl···

TRC毫米波測試系統(tǒng)的原理與應用

無線電池管理系統(tǒng)：實現(xiàn)智能電池生···

優(yōu)傲機器人開年四大行業(yè)預測：人工···

微軟緊急撤回最先進的AI大模型Wiza···

聯(lián)發(fā)科天璣9300系列亮相COMPUTEX 2···

“加油2024，贏肆而上”-綠測科技2···

最新文章

存儲芯片大廠美光宣布也將漲價

全球首個內(nèi)河航運5G-A通感一體網(wǎng)絡正式開通運行

全球超大規(guī)模數(shù)據(jù)中心數(shù)量五年翻倍,2024年新增137個

繼芯片與人工智能后美國或考慮推出機器人國家戰(zhàn)略

我國科學家發(fā)布全球首例微米級腦機接口多模態(tài)三維圖譜

熱門標簽

在線客服

微信在線咨詢

聯(lián)系電話

咨詢熱線

公眾號

微信掃一掃

回到頂部

新聞資訊

行業(yè)資訊

阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數(shù)學、編程尤為出色

為您精選

熱門文章

最新文章

熱門標簽

在線客服

微信在線咨詢

聯(lián)系電話

咨詢熱線

公眾號

微信掃一掃

回到頂部

阿里云開源首個AI推理模型QwQ，推理水平對標OpenAI o1 數(shù)學、編程尤為出色