1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

ChatGPT攪動(dòng)AI又一波風(fēng)潮,卻扒出了百度的長(zhǎng)板

 2023-02-08 08:38  來(lái)源:A5專欄  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

文|智能相對(duì)論

作者| 葉一城

野火燎原,openAI搞出的chatGPT大有當(dāng)年alphaGo的架勢(shì),攪動(dòng)整個(gè)AI業(yè)界春心蕩漾。

從openAI的大金主微軟,到昔日明星alphaGo的爸爸Google,都火急火燎地要出來(lái)表態(tài)——前者要彰顯主權(quán)并在內(nèi)部全面應(yīng)用,后者作為全球AI領(lǐng)頭羊怎么能失了對(duì)稱的地位,要發(fā)布對(duì)應(yīng)的產(chǎn)品。

國(guó)內(nèi)科技圈自然也發(fā)揚(yáng)了聞風(fēng)而動(dòng)的優(yōu)良品格,在元宇宙概念疲軟后,有關(guān)的沒關(guān)的都紛紛貼上來(lái)。股市上各種妖魔鬼怪橫行,對(duì)于上漲,某些董秘的回復(fù)中,否定或許還帶著撿漏的竊喜。

而“AI大戶”百度在宣布發(fā)布類似的產(chǎn)品“文心一言”后,股價(jià)也立刻上漲。

股民們?cè)┎辉??這次可能不太冤,因?yàn)榫?ldquo;中國(guó)版ChatGPT”而言,不管騰訊、阿里怎么站位的,某種程度上百度確實(shí)最有技術(shù)資格,也最能從ChatGPT的落地應(yīng)用中獲得現(xiàn)實(shí)的商業(yè)價(jià)值。

判斷誰(shuí)能在技術(shù)的風(fēng)口上占便宜,第一步永遠(yuǎn)是先看技術(shù)的本質(zhì)。

ChatGPT從產(chǎn)品形態(tài)上,是“一個(gè)使用自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)和人類互動(dòng)對(duì)話的產(chǎn)品”,而其內(nèi)在本質(zhì),就是一個(gè)預(yù)訓(xùn)練大模型。所謂“大”,就是在巨量到一般人無(wú)法想象的數(shù)據(jù)訓(xùn)練下?lián)碛旋嫶蟮膮?shù)規(guī)模,因?yàn)?ldquo;大”而見識(shí)多,博學(xué)多才,任何領(lǐng)域都懂,只要稍微調(diào)教一下就能出產(chǎn)特定場(chǎng)景的應(yīng)用。

ChatGPT并不是一次性發(fā)展而來(lái)的,其屬于openAI的一系列預(yù)訓(xùn)練模型,所謂GPT,即Generative Pre-Trained Transformer,就是通過(guò)Transformer為基礎(chǔ)模型,使用預(yù)訓(xùn)練技術(shù)得到通用的文本模型。從已經(jīng)公布的論文看,從2018年起,GPT家族已經(jīng)先后擁有GPT-1,GPT-2,GPT-3,以及圖像預(yù)訓(xùn)練iGPT等模型,而目前火得一塌糊涂的ChatGPT,更像是一個(gè)GPT-4之前的過(guò)渡版本GPT-3.5,因?yàn)閺?qiáng)大的對(duì)話能力突然爆火起來(lái)。

不同的是,ChatGPT采用了新的指示學(xué)習(xí)(Instruction Learning)和人工反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback,RLHF)來(lái)指導(dǎo)模型的訓(xùn)練,前者為ChatGPT帶來(lái)理解能力,后者通過(guò)人工標(biāo)注反饋的方式來(lái)增強(qiáng)模型的效果,實(shí)現(xiàn)GPT的進(jìn)化。

在一系列進(jìn)化下,ChatGPT的參數(shù)總量與GPT-3一致,達(dá)到了1750億,實(shí)現(xiàn)了從GPT-2的15億的跳躍。

說(shuō)到底,ChatGPT就是一個(gè)積累已久、有著特殊訓(xùn)練方式的大模型,它的發(fā)展是有技術(shù)進(jìn)化路線的。

而“巧合”的是,百度大力投入的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語(yǔ)言的深度語(yǔ)義理解與生成能力,其技術(shù)演進(jìn)幾乎走出了同樣的進(jìn)程。

早在2019年3月,百度就做出了文心 ERNIE 1.0,這一技術(shù)創(chuàng)新與“同類”GPT-1、BERT的差距都只有幾個(gè)月,而且百度積累的大規(guī)模知識(shí)和海量多元數(shù)據(jù),讓文心得以快速發(fā)展——搜索業(yè)務(wù)給大模型所需要的龐大數(shù)據(jù)訓(xùn)練量帶來(lái)了天然的便利。

例如,在文心的發(fā)展過(guò)程中,2021年,ERNIE 3.0大模型即擁有千億參數(shù);與超強(qiáng)算力方聯(lián)合的鵬城-百度·文心作為一款融合了自然語(yǔ)言理解和自然語(yǔ)言生成的大模型,其參數(shù)量達(dá)到了2600億,相對(duì)GPT-3和ChatGPT提升了50%。

去年9月,百度CEO李彥宏判斷人工智能發(fā)展在“技術(shù)層面和商業(yè)應(yīng)用層面,都有方向性改變”。據(jù)推測(cè),百度那時(shí)候就開始做文心一言。

除了參數(shù)規(guī)模擴(kuò)大、能力增強(qiáng),文心與ChatGPT一樣,也在適應(yīng)不同需要進(jìn)行技術(shù)進(jìn)化。目前文心大模型總量已經(jīng)有36個(gè),以其中的知識(shí)增強(qiáng)輕量級(jí)大模型ERNIE 3.0 Tiny為例,該模型能夠通過(guò)多任務(wù)知識(shí)蒸餾手段將千億多任務(wù)大模型的所學(xué)遷移至輕量級(jí)模型中,訓(xùn)練了10億級(jí)、億級(jí)、千萬(wàn)級(jí)不同體量大小的輕量級(jí)大模型,實(shí)現(xiàn)了優(yōu)秀的泛化能力。

回過(guò)頭來(lái)看,百度在技術(shù)上一直在做與GPT相同的事,但是晦澀的技術(shù)決定了它始終缺乏足夠的曝光度,直到大洋彼岸的ChatGPT突然搞出了“大新聞”,舉起了旗幟,于是,這就成了百度彰顯自身技術(shù)能力的契機(jī)。

從GPT-3到ChatGPT,與從“文心”到“文心一言”(英文名ERNIE Bot)的命名方式,也“驚人巧合”——原本就是一樣的技術(shù)迭代過(guò)程罷了,百度之所以3月就能馬上做出來(lái),甚至按目前的節(jié)奏內(nèi)測(cè)還可能提前,原因就在于ChatGPT要的那些技術(shù)百度都有,產(chǎn)品上再加入對(duì)話算法等,很快就能對(duì)齊。

至少在NLP領(lǐng)域,目前國(guó)內(nèi)還沒用企業(yè)能夠看齊百度。

而在現(xiàn)實(shí)價(jià)值方面,實(shí)際上ChatGPT做的各種對(duì)話、各種輔助功能,都與百度的業(yè)務(wù)線較為契合,無(wú)論是內(nèi)部的搜索+信息流,還是對(duì)外提供的諸如智慧城市等B端解決方案中,都能得到很好的利用。

尤其是,AI與搜索的契合一直是百度近些年的努力方向,以傳統(tǒng)精確搜索為主、“文心一言”的工具型搜索為輔的方式,也更符合未來(lái)搜索的形態(tài)。

當(dāng)然,其他輔助的,比如芯片(算力相關(guān))、開發(fā)框架(飛槳),百度也都有成熟的“基建配套”了,

不過(guò),百度面臨的問(wèn)題還是那個(gè)老生常談的話題:能不能持續(xù)投入下去,等待真正的商業(yè)價(jià)值回報(bào)?畢竟,ChatGPT吹得再響,現(xiàn)實(shí)的問(wèn)題肯定少不了,得有一個(gè)成熟的過(guò)程。

說(shuō)白了,在沒有進(jìn)入強(qiáng)人工智能時(shí)代,ChatGPT再厲害其本質(zhì)也只是“小孩學(xué)舌”,學(xué)得更多當(dāng)然就更像,但也只是“知其然不知其所以然”。

這不是說(shuō)小孩學(xué)舌就沒有用,能夠?qū)W起來(lái)很像、能解決一些問(wèn)題,價(jià)值也很大。只不過(guò),帶過(guò)孩子的都知道,小孩學(xué)舌在面臨認(rèn)知問(wèn)題時(shí),會(huì)出現(xiàn)很多邏輯尷尬。

目前ChatGPT在一些對(duì)話上就出現(xiàn)了這個(gè)問(wèn)題,例如解一道簡(jiǎn)單的數(shù)學(xué)題,能給你扯一大堆,但結(jié)果就是不對(duì)。又例如很多專業(yè)領(lǐng)域的會(huì)話,和官樣文章一樣看似內(nèi)容很多、邏輯嚴(yán)密,但就是言之無(wú)物。

一些程序界大佬驚呼ChatGPT的健壯性遠(yuǎn)超人類,要開除外包程序員,實(shí)際危言聳聽。所謂健壯性無(wú)非就是設(shè)定規(guī)則的執(zhí)行,就像數(shù)數(shù),人從0數(shù)到300,肯定容易出錯(cuò),機(jī)器數(shù),當(dāng)然就不會(huì)出錯(cuò),沒啥好驚奇的。

無(wú)論如何,ChatGPT還有一些路要走,最有資格也最能得益的百度,在風(fēng)潮面前仍然要咬牙繼續(xù)堅(jiān)持才好,這其中的投入或許會(huì)更大。

*本文圖片均來(lái)源于網(wǎng)絡(luò)

此內(nèi)容為【智能相對(duì)論】原創(chuàng),

僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

•AI產(chǎn)業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長(zhǎng)期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬(wàn)個(gè)為什么》

•【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無(wú)人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai技術(shù)

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來(lái)個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)

    個(gè)人創(chuàng)業(yè)需要啟動(dòng)成本低、無(wú)需龐大團(tuán)隊(duì)、可快速驗(yàn)證、能利用個(gè)人技能或資源。這里分享適合個(gè)人創(chuàng)業(yè)的十個(gè)機(jī)會(huì)一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個(gè)人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語(yǔ)言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營(yíng)銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語(yǔ)言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來(lái)的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過(guò)載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(zhǎng)(2025年已超數(shù)萬(wàn)款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對(duì)工具篩選的場(chǎng)景需求,垂直化、場(chǎng)景化的AI導(dǎo)航網(wǎng)站應(yīng)運(yùn)而生。這類平臺(tái)通過(guò)聚合、評(píng)測(cè)、分類與推薦四重機(jī)制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強(qiáng)行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號(hào)文章中出現(xiàn)一個(gè)人的名字,它會(huì)自動(dòng)變成藍(lán)色鏈接,點(diǎn)擊即可查看AI生成的“個(gè)人簡(jiǎn)歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭(zhēng)議漩渦。多位網(wǎng)友在社交平臺(tái)反映,當(dāng)微信公眾號(hào)推文中出現(xiàn)本人姓名時(shí),名字會(huì)自動(dòng)變?yōu)樗{(lán)色超鏈接,點(diǎn)擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • GDPS2025賽場(chǎng)直擊!開普勒大黃蜂助力華理斬獲搬運(yùn)賽項(xiàng)桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會(huì)暨國(guó)際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競(jìng)技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來(lái)。上海開普勒機(jī)器人有限公司(以下簡(jiǎn)稱"開普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無(wú)界|2025TechWorld智慧安全大會(huì)在京召開

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來(lái)5年,中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)