1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

靈伴AI開放平臺上線ASR功能,構(gòu)建智能生態(tài)未來

 2019-12-05 16:42  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

近日,靈伴AI能力開放平臺上線了ASR功能模塊,繼TTS賦予機(jī)器開口說話的能力之后,本次ASR功能的開放將使用戶的產(chǎn)品具備聽覺感知能力、使其能夠輕松聽懂人類的話語,與TTS構(gòu)成語音交互的核心環(huán)節(jié),使更多產(chǎn)品及用戶能夠在零技術(shù)門檻下完成整體交互方案。

近年來,語音交互被看作連接各種智能服務(wù)的入口,雖然已經(jīng)落地多個行業(yè)應(yīng)用場景,但仍然有很多不盡如人意的地方。具體到ASR技術(shù)方面,業(yè)內(nèi)普遍宣稱的97%識別準(zhǔn)確率,多數(shù)是指局限于安靜室內(nèi)的近場識別,而在真實使用場景中,使用者的口音復(fù)雜多變、距離麥克風(fēng)的遠(yuǎn)近、周圍環(huán)境的噪音等都會嚴(yán)重影響到語音識別的準(zhǔn)確率,從而使交互的體驗感大打折扣。

靈伴AI開放平臺ASR功能界面展示

靈伴的ASR技術(shù)作為整體交互服務(wù)方案中的重要環(huán)節(jié),已經(jīng)經(jīng)歷了來自市場的嚴(yán)苛檢驗,并在實踐中不斷迭代和完善,能夠以高標(biāo)準(zhǔn)勝任實際業(yè)務(wù)場景的需求。

國際領(lǐng)先的識別技術(shù)

靈伴ASR算法模型具有較強(qiáng)的魯棒性,具備復(fù)雜環(huán)境識別能力,基于自研抗噪和遠(yuǎn)場處理技術(shù),有效分離噪音、混響,極大提高戶外、室內(nèi)、車內(nèi)等復(fù)雜環(huán)境下語音識別準(zhǔn)確率,使得用戶無論在何種嘈雜環(huán)境下,都能夠最大程度被識別;獨創(chuàng)說話人識別和語音識別同步處理技術(shù),實現(xiàn)實時的說話人區(qū)分及語音內(nèi)容識別;先進(jìn)的深度學(xué)習(xí)算法模型,保證系統(tǒng)具有較高的準(zhǔn)確率、識別效率及較低的計算成本;

20+領(lǐng)域識別引擎

得益于長久以來專注于語音交互領(lǐng)域的優(yōu)勢,靈伴智能服務(wù)方案在銀行、保險、教育、醫(yī)療等20余個行業(yè)落地并積累了海量業(yè)務(wù)數(shù)據(jù)及經(jīng)驗。經(jīng)過實際業(yè)務(wù)場景的應(yīng)用反饋進(jìn)而對算法模型的迭代優(yōu)化,使得靈伴ASR作為單項技術(shù)能力也有著高于業(yè)界平均水平的識別準(zhǔn)確率;

卓越的產(chǎn)品性能

靈伴ASR不僅支持中文普通話識別、中英文混說識別,也支持帶有方言口音的普通話識別,這一能力在實際落地過程中不斷完善。因為多數(shù)企業(yè)面向全國用戶提供服務(wù),而帶方言口音是影響ASR在實際應(yīng)用中準(zhǔn)確率的主要因素之一。靈伴ASR立足先進(jìn)的算法模型、多年業(yè)務(wù)積累及龐大的數(shù)據(jù)庫支撐,在識別不同方言口音普通話方面具有較高的精準(zhǔn)度;

支持個性化定制

靈伴ASR技術(shù)還支持個人或企業(yè)用戶的個性化需求定制,提供基于細(xì)分領(lǐng)域的行業(yè)模型定制、方言、語種等多種需求定制。

作為智能語音交互領(lǐng)域的先行者,靈伴是業(yè)內(nèi)為數(shù)不多擁有語音交互全棧技術(shù)的企業(yè)之一,在AI商業(yè)化落地過程中可根據(jù)實際業(yè)務(wù)情況進(jìn)行快速調(diào)整及應(yīng)對,而不用依賴他人,這也是靈伴AI技術(shù)產(chǎn)品能夠深入業(yè)務(wù)場景的重要因素之一。本次ASR功能的開放,意味著靈伴AI能力開放平臺對全行業(yè)更為全面、深度的賦能,也表達(dá)了靈伴愿意與更多企業(yè)一起構(gòu)建未來智能生態(tài)的美好愿景。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai智能
語音交互
智能語音
開放平臺

相關(guān)文章

  • 百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

    “AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

    標(biāo)簽:
    人工智能
    ai智能
  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • 宇樹科技加速沖刺科創(chuàng)板IPO,人形機(jī)器人龍頭估值飆至120億元

    “宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉,國內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計劃于科創(chuàng)板IPO,預(yù)計

    標(biāo)簽:
    宇樹科技
  • OpenAI推出GPT-5:AI大統(tǒng)一時代的到來?

    推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強(qiáng)大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負(fù)

    標(biāo)簽:
    chatgpt

編輯推薦