百度AI團(tuán)隊(duì)今日正式推出PaddleOCR 3.1版本,以突破性的多語(yǔ)言組合識(shí)別(Multilingual Composition Perception, MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)景提供前所未有的智能化解決方案。
技術(shù)制高點(diǎn):MCP重塑OCR能力邊界
顛覆性混合識(shí)別:MCP技術(shù)突破單一語(yǔ)言識(shí)別局限,無(wú)需預(yù)先指定語(yǔ)種,即可對(duì)文檔中自由穿插的中文、英文、日文、韓文、法文、德文、阿拉伯文等數(shù)十種語(yǔ)言文本進(jìn)行同步、高精度識(shí)別,尤其擅長(zhǎng)處理專業(yè)術(shù)語(yǔ)、專有名詞混排場(chǎng)景。
上下文語(yǔ)義貫通:基于百度文心大模型強(qiáng)大的語(yǔ)義理解能力,系統(tǒng)可智能關(guān)聯(lián)混合文本上下文,顯著提升如“中英技術(shù)文檔”、“多語(yǔ)合同條款”、“國(guó)際化財(cái)報(bào)”等復(fù)雜材料的識(shí)別準(zhǔn)確率與邏輯連貫性。
工業(yè)級(jí)魯棒性:針對(duì)模糊掃描件、低光照拍攝、復(fù)雜表格等極端場(chǎng)景優(yōu)化模型架構(gòu),識(shí)別精度在制造業(yè)圖紙、物流單據(jù)、醫(yī)療檔案等專業(yè)領(lǐng)域提升超15%。
全景應(yīng)用賦能:驅(qū)動(dòng)產(chǎn)業(yè)智能化升級(jí)
跨境貿(mào)易與金融:自動(dòng)解析多語(yǔ)種報(bào)關(guān)單、信用證、合同,縮短處理周期70%,規(guī)避人工誤讀風(fēng)險(xiǎn)。
學(xué)術(shù)研究與國(guó)際出版:高效處理混合引用文獻(xiàn)、多語(yǔ)論文資料,助力知識(shí)高效流轉(zhuǎn)。
智能辦公與檔案數(shù)字化:一鍵轉(zhuǎn)換國(guó)際化會(huì)議紀(jì)要、混排企業(yè)檔案,實(shí)現(xiàn)全球信息無(wú)縫管理。
多語(yǔ)言產(chǎn)品與客服:實(shí)時(shí)識(shí)別用戶上傳的多語(yǔ)種圖片反饋,提升全球客戶服務(wù)體驗(yàn)。
開(kāi)發(fā)者生態(tài):極致效率與開(kāi)放共創(chuàng)
輕量化部署:提供從服務(wù)器到邊緣設(shè)備的全棧優(yōu)化模型,推理速度提升50%,內(nèi)存占用降低30%。
零代碼落地:升級(jí)OCR辦公平臺(tái),企業(yè)用戶無(wú)需開(kāi)發(fā)即可通過(guò)可視化界面配置多語(yǔ)言混合識(shí)別流程。
模型工廠開(kāi)源:在GitHub開(kāi)放MCP訓(xùn)練架構(gòu)及多語(yǔ)言數(shù)據(jù)集,支持開(kāi)發(fā)者定制專屬混合識(shí)別模型。
“PaddleOCR 3.1的MCP能力是全球化智能文檔處理的里程碑。”百度AI技術(shù)負(fù)責(zé)人王海峰表示,“它不僅是技術(shù)的突破,更是對(duì)全球商業(yè)、文化交流底層需求的回應(yīng)。我們致力于讓機(jī)器真正‘讀懂’人類多元化的表達(dá)方式。”
即刻體驗(yàn)未來(lái):
開(kāi)發(fā)者可通過(guò)PaddleOCR GitHub倉(cāng)庫(kù)獲取3.1版本完整代碼、預(yù)訓(xùn)練模型及詳細(xì)教程。企業(yè)用戶可登陸百度智能云官網(wǎng)申請(qǐng)MCP能力商用授權(quán)。
關(guān)于PaddleOCR:
作為百度飛槳生態(tài)的核心組件,PaddleOCR已服務(wù)全球超10萬(wàn)企業(yè)和開(kāi)發(fā)者,涵蓋金融、制造、醫(yī)療、教育等80余個(gè)行業(yè),日均調(diào)用量超百億次,持續(xù)領(lǐng)跑開(kāi)源OCR技術(shù)發(fā)展。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
導(dǎo)航網(wǎng)站的崛起:從信息過(guò)載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(zhǎng)(2025年已超數(shù)萬(wàn)款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對(duì)工具篩選的場(chǎng)景需求,垂直化、場(chǎng)景化的AI導(dǎo)航網(wǎng)站應(yīng)運(yùn)而生。這類平臺(tái)通過(guò)聚合、評(píng)測(cè)、分類與推薦四重機(jī)制,將分散的工具資源整合為結(jié)構(gòu)化入口。例
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問(wèn)……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績(jī)才勉強(qiáng)過(guò)一本線,今年集體晉升985。據(jù)悉,豆包甚至過(guò)了清北的錄取線。頭部大模型在高考“考場(chǎng)”上玩得不亦樂(lè)乎,中小AI創(chuàng)企的處境卻日益尷尬
當(dāng)微信公眾號(hào)文章中出現(xiàn)一個(gè)人的名字,它會(huì)自動(dòng)變成藍(lán)色鏈接,點(diǎn)擊即可查看AI生成的“個(gè)人簡(jiǎn)歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭(zhēng)議漩渦。多位網(wǎng)友在社交平臺(tái)反映,當(dāng)微信公眾號(hào)推文中出現(xiàn)本人姓名時(shí),名字會(huì)自動(dòng)變?yōu)樗{(lán)色超鏈接,點(diǎn)擊即可瀏覽由
蘋果還沒(méi)從WWDC25的“群嘲”中走出,又迎來(lái)了一次新的痛擊。據(jù)路透社報(bào)道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語(yǔ)音助手Siri所需的時(shí)間,導(dǎo)致iPhone銷量受影響、股價(jià)下滑,構(gòu)成證券欺詐。在這份訴訟中,庫(kù)克、首席財(cái)務(wù)官凱文·帕雷克及前首席財(cái)務(wù)官盧卡·馬埃
ERGO與ECODYNAMICS聯(lián)合報(bào)告解析LLM的“內(nèi)容審美”結(jié)構(gòu)清晰、問(wèn)答模塊化的內(nèi)容,正成為AI驅(qū)動(dòng)搜索時(shí)代的“新通行證”。近期,ERGO創(chuàng)新實(shí)驗(yàn)室與ECODYNAMICS聯(lián)合發(fā)布的開(kāi)創(chuàng)性研究報(bào)告在保險(xiǎn)科技領(lǐng)域引發(fā)關(guān)注。這項(xiàng)覆蓋33,000個(gè)AI搜索結(jié)果和600個(gè)網(wǎng)站的研究發(fā)現(xiàn):大型語(yǔ)言模型(
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20
9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G
9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商