業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源

2023-12-01 11:53 來源：互聯(lián)網(wǎng) 我來投稿撤稿糾錯

12月1日，阿里云舉辦通義千問發(fā)布會，開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權(quán)威基準(zhǔn)測評創(chuàng)下開源模型最優(yōu)成績，成為業(yè)界最強開源大模型，性能超越開源標(biāo)桿Llama 2-70B和大部分商用閉源模型。未來，企業(yè)級、科研級的高性能應(yīng)用，也有了開源大模型這一選項。

通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此，通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型，以及視覺理解、音頻理解兩款多模態(tài)大模型，實現(xiàn)“全尺寸、全模態(tài)”開源。力度之大，業(yè)界無出其右。

業(yè)界最強開源模型，填補中國LLM開源領(lǐng)域空白

Qwen-72B基于3T tokens高質(zhì)量數(shù)據(jù)訓(xùn)練，延續(xù)通義千問預(yù)訓(xùn)練模型一貫以來的強勢表現(xiàn)，在10個權(quán)威基準(zhǔn)測評中奪得開源模型最優(yōu)成績，在部分測評中超越閉源的GPT-3.5和GPT-4。

英語任務(wù)上，Qwen-72B在MMLU基準(zhǔn)測試取得開源模型最高分；中文任務(wù)上，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準(zhǔn)，得分超越GPT-4；數(shù)學(xué)推理方面，Qwen-72B在GSM8K、MATH測評中斷層式領(lǐng)先其他開源模型；代碼理解方面，Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升，代碼能力有了質(zhì)的飛躍。

在10大權(quán)威測評中，通義千問720億參數(shù)模型獲得開源模型最優(yōu)成績

通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

Qwen-72B可以處理最多32k的長文本輸入，在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團(tuán)隊優(yōu)化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游應(yīng)用集成。比如，Qwen-72B搭載了強大的系統(tǒng)指令（System Prompt）能力，用戶只用一句提示詞就可定制AI助手，要求大模型扮演某個角色或者執(zhí)行特定的回復(fù)任務(wù)。

用戶僅用一句提示詞就可創(chuàng)建自己的AI助手

此前，中國大模型市場還沒出現(xiàn)足以對標(biāo)Llama 2-70B的優(yōu)質(zhì)開源模型。Qwen-72B填補了國內(nèi)空白，以高性能、高可控、高性價比的優(yōu)勢，提供不亞于商業(yè)閉源大模型的選擇?；赒wen-72B，大中型企業(yè)可開發(fā)商業(yè)應(yīng)用，高校、科研院所可開展AI for Science等科研工作。

從1.8B到72B， 通義千問 率先實現(xiàn)全尺寸開源

如果說Qwen-72B“向上摸高”，抬升了開源大模型的尺寸和性能天花板；發(fā)布會上的另一開源模型Qwen-1.8B則“向下探底”，成為尺寸最小的中國開源大模型，推理2K長度文本內(nèi)容僅需3G顯存，可在消費級終端部署。

從18億、70億、140億到720億參數(shù)規(guī)模，通義千問成為業(yè)界首個“全尺寸開源”的大模型。用戶可在魔搭社區(qū)直接體驗Qwen系列模型效果，也可通過阿里云靈積平臺調(diào)用模型API，或基于阿里云百煉平臺定制大模型應(yīng)用。阿里云人工智能平臺PAI針對通義千問全系列模型進(jìn)行深度適配，推出了輕量級微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗證、在線服務(wù)部署等服務(wù)。

阿里云是國內(nèi)最早開源自研大模型的科技企業(yè)，8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單，得到中小企業(yè)和個人開發(fā)者的青睞，累計下載量超過150萬，催生出150多款新模型、新應(yīng)用。發(fā)布會現(xiàn)場，多位開發(fā)者伙伴現(xiàn)身說法，分享了他們用Qwen開發(fā)專屬模型和特定應(yīng)用的實踐。

阿里云CTO周靖人表示，開源生態(tài)對促進(jìn)中國大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要，通義千問將持續(xù)投入開源，希望成為“AI時代最開放的大模型”，與伙伴們共同促進(jìn)大模型生態(tài)建設(shè)。

通義千問基座模型持續(xù)進(jìn)化，多模態(tài)探索業(yè)界領(lǐng)先

通義千問在多模態(tài)大模型領(lǐng)域的探索也領(lǐng)先業(yè)界一步，當(dāng)天，阿里云首次開源音頻理解大模型Qwen-Audio。

Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻，要求模型給出對音頻的理解，甚至基于音頻進(jìn)行文學(xué)創(chuàng)作、邏輯推理、故事續(xù)寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。

通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL，迅速成為國際開源社區(qū)最佳實踐之一。本次發(fā)布會又宣布了Qwen-VL的重大更新，大幅提升通用OCR、視覺推理、中文文本理解基礎(chǔ)能力，還能處理各種分辨率和規(guī)格的圖像，甚至能“看圖做題”。不論從權(quán)威測評成績還是真人體驗的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通義千問閉源模型也在持續(xù)進(jìn)化，一個月前發(fā)布的通義千問2.0版閉源模型，最近已進(jìn)階至2.1版，上下文窗口長度擴展到32k，代碼理解生成能力、數(shù)學(xué)推理能力、中英文百科知識、幻覺誘導(dǎo)抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費體驗最新版本的閉源模型。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關(guān)標(biāo)簽: 大模型

相關(guān)文章

首屆通義千問AI挑戰(zhàn)賽開賽，參賽者可暢玩通義開源模型家族

12月1日，首屆“通義千問AI挑戰(zhàn)賽”開賽，參賽者可免費暢玩通義開源模型家族，包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道，前者聚焦通義千問大模型的微調(diào)訓(xùn)練，希望通過高質(zhì)量的數(shù)據(jù)探索開源模型的代碼能力上限，后

標(biāo)簽：

大模型
最強開源大模型來了！通義千問720億參數(shù)模型開源發(fā)布

12月1日通義千問發(fā)布會，阿里云開源通義千問720億參數(shù)模型Qwen-72B。Qwen-72B在10個權(quán)威基準(zhǔn)測評創(chuàng)下開源模型最優(yōu)成績，成為業(yè)界最強開源大模型，性能超越開源標(biāo)桿Llama2-70B和大部分商用閉源模型，可適配企業(yè)級、科研級的高性能應(yīng)用。通義千問當(dāng)天還開源了18億參數(shù)模型Qwen-1.

標(biāo)簽：

大模型
掰開安卓手機，滿屏都是三個字：大模型

這年頭，安卓廠商沒個大模型，都不敢開手機發(fā)布會了。前腳OPPO剛用大模型升級了語音助手，后腳vivo就官宣自研手機AI大模型;小米發(fā)布會則直接將大模型當(dāng)場塞進(jìn)手機系統(tǒng)……其競爭激烈程度，不亞于搶芯片首發(fā)。到底是怎么回事?究其原因，還是智能終端已經(jīng)成為了各類AIGC應(yīng)用的落地“新灘頭”。先是圖像生成大

標(biāo)簽：

大模型
加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務(wù)

基于容聯(lián)云自主研發(fā)的赤兔大模型能力，容聯(lián)云容犀機器人真正將大模型強大的理解能力、知識學(xué)習(xí)能力、總結(jié)能力、挖掘能力、推理能力融入于實際落地應(yīng)用中。開創(chuàng)性的打造生成式場景化智能問答、生成式智能輔助、AI運營話術(shù)庫，幫助企業(yè)洞悉更精準(zhǔn)的客戶真實需求，提升一線客服人員的專業(yè)服務(wù)能力，并代替人工完成大量低價值

標(biāo)簽：

大模型
從搜索到大模型，百度商業(yè)化的“驚險一躍”

文：向善財經(jīng)關(guān)于百度，最近發(fā)生了這么兩件事兒。一個是華爾街分析師重申了對百度股票的買入評級和目標(biāo)價，但在該公司11月21日公布第三季度收益之前下調(diào)了第三季度收入預(yù)期。分析師給出的理由是，線下廣告支出走軟，以及2G資金減少之后，給智能交通帶來挑戰(zhàn)。另外一個是最近文心一言正式上線了專業(yè)版，并且開始收費，

標(biāo)簽：

百度

大模型

未來5年，中國AI的“大洗牌”和“內(nèi)循環(huán)”

我覺得我們AI的目標(biāo)是：從芯片設(shè)計到軟件生態(tài)，全鏈路自主開發(fā)，建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年，英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表，大多數(shù)AI大模型會以軟件彌補硬件不足，所以訓(xùn)練和推理分開，訓(xùn)練就
H20芯片開賣即叫停，英偉達(dá)如何解圍？

文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后，英偉達(dá)的“特供版”H20芯片，又有了新消息。近日，美國科技媒體《TheInformation》援引知情人士消息稱，英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令，要求暫停所有與H20AI

標(biāo)簽：

英偉達(dá)
真正的「國產(chǎn)英偉達(dá)」來了

文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議，正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告，上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一，包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心，以及在國產(chǎn)GPU領(lǐng)域取

標(biāo)簽：

英偉達(dá)
AI視頻生成賽道“分野”：小廠重產(chǎn)品，大廠重生態(tài)

AI視頻生成賽道“分野”：小廠重產(chǎn)品，大廠重生態(tài)

標(biāo)簽：

騰訊

阿里巴巴

快手
數(shù)據(jù)庫進(jìn)入“內(nèi)存自由”時代！阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務(wù)器

技術(shù)的進(jìn)步永無止境，繼創(chuàng)下TPC-C性能&性價比雙冠之后，阿里云PolarDB云原生數(shù)據(jù)庫再度實現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會上，阿里云宣布推出全球首款基于CXL（ComputeExpressLink）2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上，Polar
為AI時代云服務(wù)器量身定制阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

2025年9月24日，在杭州舉辦的云棲大會上，阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4（簡稱Alinux4）。Alinux4基于Linux6.6內(nèi)核打造，是首個全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài)，更針對阿里云最新9代ECS

阿里云重磅發(fā)布AI安全護(hù)欄五項安全能力護(hù)航AI安全

9月24日，杭州云棲大會技術(shù)主論壇上，阿里云重磅發(fā)布AI安全護(hù)欄，提供五項核心安全能力，護(hù)航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護(hù)，另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級，打造Agentic-SOC安全運營，提升安全威脅檢測和響應(yīng)效率。在過去的一年，AIAgent正在
魔搭社區(qū)國際版上線，并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

9月24日，魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無限”的專題論壇，并發(fā)布魔搭社區(qū)國際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench，旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今，魔搭社區(qū)已成長為中國最大AI開源社區(qū)，其模型數(shù)量已突破10萬，服務(wù)了全球20
七連發(fā)！阿里多款重磅發(fā)布亮相云棲大會

9月24日，2025云棲大會現(xiàn)場，阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語言、語音、視覺、多模態(tài)、代碼等模型領(lǐng)域，在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實現(xiàn)突破。在大語言模型中，阿里通義旗艦?zāi)Ｐ蚎wen3-Max全新亮相，性能超過G
阿里云擴建全球基礎(chǔ)設(shè)施，將新增巴西、法國和荷蘭數(shù)據(jù)中心

9月24日，阿里云在云棲大會上宣布新一輪全球基礎(chǔ)設(shè)施擴建計劃：將在巴西、法國和荷蘭首次設(shè)立云計算地域節(jié)點（region），并將擴建墨西哥、日本、韓國、馬來西亞和迪拜的數(shù)據(jù)中心，以便更好服務(wù)全球客戶日益增長的AI和云計算需求。目前，阿里云在全球29個地區(qū)運營91個可用區(qū)，是中國最大、亞太第一的云服務(wù)商

加載更多

業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源

相關(guān)文章

首屆通義千問AI挑戰(zhàn)賽開賽，參賽者可暢玩通義開源模型家族

最強開源大模型來了！通義千問720億參數(shù)模型開源發(fā)布

掰開安卓手機，滿屏都是三個字：大模型

加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務(wù)

從搜索到大模型，百度商業(yè)化的“驚險一躍”

未來5年，中國AI的“大洗牌”和“內(nèi)循環(huán)”

H20芯片開賣即叫停，英偉達(dá)如何解圍？

真正的「國產(chǎn)英偉達(dá)」來了

AI視頻生成賽道“分野”：小廠重產(chǎn)品，大廠重生態(tài)

數(shù)據(jù)庫進(jìn)入“內(nèi)存自由”時代！阿里云PolarDB發(fā)布全球首個CXL數(shù)據(jù)庫服務(wù)器

為AI時代云服務(wù)器量身定制阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

阿里云重磅發(fā)布AI安全護(hù)欄五項安全能力護(hù)航AI安全

魔搭社區(qū)國際版上線，并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

七連發(fā)！阿里多款重磅發(fā)布亮相云棲大會

阿里云擴建全球基礎(chǔ)設(shè)施，將新增巴西、法國和荷蘭數(shù)據(jù)中心

熱門排行

編輯推薦

業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源

相關(guān)文章

熱門排行

編輯推薦

業(yè)界最強開源大模型來了！通義千問720億參數(shù)模型正式開源