清華權(quán)威報(bào)告：文心一言4.0多項(xiàng)指標(biāo)遙遙領(lǐng)先

發(fā)布日期：2024-04-23

958 次

4月23日消息，由清華大學(xué)基礎(chǔ)模型研究中心最新發(fā)布的2024年3月版《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》中，共涵蓋了14個(gè)具有海內(nèi)外影響力的模型。

在此次評(píng)測(cè)中，文心4.0的表現(xiàn)令人矚目，其性能接近國(guó)際頂級(jí)模型，且與頂尖模型的差距正在逐步縮小，堪稱國(guó)內(nèi)領(lǐng)先模型。

例如，在人類對(duì)齊能力的評(píng)測(cè)中，文心4.0以卓越的表現(xiàn)位居國(guó)內(nèi)首位。

在中文推理和中文語(yǔ)言的評(píng)測(cè)中，文心4.0遙遙領(lǐng)先，與其他模型相比，差距明顯。在中文理解上，文心4.0的領(lǐng)先優(yōu)勢(shì)尤其突出，比第二名的GLM-4高出0.41分。

在語(yǔ)義理解的數(shù)學(xué)能力評(píng)測(cè)中，文心4.0與Claude-3并列全球第一，而GPT-4系列模型則位列第四和第五，其他模型的得分主要集中在55分左右，顯著落后于領(lǐng)先群體。

在閱讀理解能力的評(píng)測(cè)中，文心4.0超越了GPT-4 Turbo、Claude-3以及GLM-4，取得了最高的成績(jī)。

在企業(yè)最關(guān)注的安全性評(píng)測(cè)中，文心4.0同樣表現(xiàn)出色，力壓國(guó)際一流的GPT-4系列模型和Claude-3，獲得了最高分（89.1分），而Claude-3僅位列第四。

數(shù)據(jù)還顯示，自去年3月16日文心一言首次亮相以來(lái)，用戶數(shù)量已經(jīng)突破了2億，每天的API調(diào)用量也超過(guò)了2億次。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：020-2204 2442,郵箱：Sales@greentest.com.cn。

上一篇: 氫能?源汽車(chē)長(zhǎng)距離?測(cè)試成功，新能源汽車(chē)?領(lǐng)域迎來(lái)革新
下一篇: 百度發(fā)布純視覺(jué)高階智駕ANP3 Pro,媲美激光雷達(dá) 全國(guó)都能開(kāi)

為您精選

北電數(shù)智政務(wù)大模型助力打造更加安全高效政務(wù)服務(wù)體系

當(dāng)前，人工智能技術(shù)正以破竹之勢(shì)推動(dòng)政務(wù)服務(wù)體系數(shù)智化升級(jí)。IDC數(shù)據(jù)顯示，中國(guó)人工智能在政府領(lǐng)域的應(yīng)用滲透度已達(dá)52%，位···

更新日期：2025-03-06 183 次
華為發(fā)布新一代全閃分布式存儲(chǔ) 業(yè)界最高密、最低功耗

3月4日消息，在昨日的巴塞羅那MWC25上，華為發(fā)布AI-Ready的數(shù)據(jù)存儲(chǔ)，助力運(yùn)營(yíng)商全面擁抱AI時(shí)代。據(jù)官方介紹，AI-Ready的數(shù)據(jù)···

更新日期：2025-03-04 133 次
Marvell宣布推出首款2nm芯片,基于臺(tái)積電N2，支持AI XPU、交換機(jī)開(kāi)發(fā)

3 月 4 日消息，Marvell美滿電子當(dāng)?shù)貢r(shí)間昨日公布了其首款2nmIP 驗(yàn)證芯片。該芯片采用臺(tái)積電N2 制程，是 Mavell 基于該節(jié)點(diǎn)開(kāi)···

更新日期：2025-03-04 125 次
藍(lán)牙連接技術(shù)成為了人工智能/機(jī)器學(xué)習(xí)驅(qū)動(dòng)智能指環(huán)的首選

傳統(tǒng)的可穿戴設(shè)備取得了巨大成功，使得其后面世的智能指環(huán)受到早期采用者的熱烈追捧，成為了最前沿、最時(shí)尚的健康和健身無(wú)線···

更新日期：2025-03-03 157 次
OpenAI推出首個(gè)智能體Operator

當(dāng)?shù)貢r(shí)間 1 月 23 日，OpenAI正式推出了其首款 AI 智能體Operator。它可以通過(guò)自帶的瀏覽器獨(dú)立瀏覽網(wǎng)頁(yè)，并通過(guò)鍵入、單擊和···

更新日期：2025-01-24 367 次