11月20日,愛(ài)數(shù)智慧發(fā)布中文普通話真·萌童聲語(yǔ)音合成(TTS)開(kāi)源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語(yǔ)音合成數(shù)據(jù)集子集,時(shí)長(zhǎng)為15分鐘,文本主要為日常用語(yǔ)。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時(shí)長(zhǎng)超2小時(shí)。這也是該童聲第一次用于TTS錄制。
隨著智能終端市場(chǎng)的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對(duì)話的入口。在人機(jī)互動(dòng)過(guò)程中,語(yǔ)音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對(duì)合成語(yǔ)音的期望值也不斷提高。
TTS數(shù)據(jù)是影響語(yǔ)音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來(lái)看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過(guò)程中還需要有專業(yè)的錄音師和監(jiān)聽(tīng)人在場(chǎng),便于及時(shí)矯正錄音過(guò)程中的錯(cuò)誤。從標(biāo)注環(huán)節(jié)來(lái)看,TTS數(shù)據(jù)標(biāo)注分為4個(gè)層級(jí),包括發(fā)音校對(duì)、韻律層級(jí)、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語(yǔ)義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。
智能設(shè)備使用者“低齡化”趨勢(shì)明顯,從而帶動(dòng)了童聲數(shù)據(jù)的需求。受制于兒童識(shí)字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫(kù)數(shù)量較少,且多為成年人模仿。童聲TTS語(yǔ)料庫(kù)呈現(xiàn)出明顯的供需不平衡。
本次愛(ài)數(shù)智慧發(fā)布的TTS童聲開(kāi)源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)寫(xiě)和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對(duì)聽(tīng)感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對(duì)聲韻母邊界進(jìn)行切分外,還對(duì)句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。
發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來(lái)更好的聽(tīng)感。
在與愛(ài)數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開(kāi)朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動(dòng)畫(huà)片時(shí),就會(huì)黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時(shí),言語(yǔ)間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對(duì)這個(gè)真·萌童聲充滿期待!
為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛(ài)數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場(chǎng)景,服務(wù)更廣域的客戶。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
雖然我國(guó)汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無(wú)限潛力。一方面,智能汽車的發(fā)展不斷帶動(dòng)需求增長(zhǎng);另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對(duì)此,在7月5日-7日舉辦的2023年中國(guó)汽車論壇上,中國(guó)汽車工業(yè)協(xié)會(huì)副秘書(shū)長(zhǎng)李邵華就做出表示,“中國(guó)將成為未來(lái)汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的
2023世界人工智能大會(huì)將于7月6日至8日在上海舉辦。云天勵(lì)飛將在大會(huì)上展示自主設(shè)計(jì)開(kāi)發(fā)的新一代邊緣計(jì)算芯片DeepEdge10系列SoC芯片,并公布“天書(shū)”大模型的最新動(dòng)態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺(tái)參觀交流!同時(shí),云天勵(lì)飛也將與中國(guó)電子、中國(guó)信通院、華為等合作伙伴,在WAIC的舞臺(tái)
6月28日,首屆中國(guó)智慧生活大會(huì)(CIC)在北京成功召開(kāi)。本次大會(huì)是對(duì)貫徹?cái)U(kuò)大內(nèi)需政策,落實(shí)國(guó)務(wù)院“三品戰(zhàn)略”,結(jié)合“2023消費(fèi)提振年”工作安排的積極響應(yīng)。會(huì)議由中國(guó)電子視像行業(yè)協(xié)會(huì)、中國(guó)標(biāo)準(zhǔn)科技集團(tuán)、中家院(北京)檢測(cè)認(rèn)證有限公司聯(lián)合指導(dǎo),洛圖科技(RUNTO)主辦,京東3C數(shù)碼和植理文化協(xié)辦。
近日,酷學(xué)院智能產(chǎn)品發(fā)布會(huì)在深圳閃亮登場(chǎng)。近200位現(xiàn)場(chǎng)觀眾和近萬(wàn)人次在線觀看,共同見(jiàn)證了這一激動(dòng)人心的時(shí)刻。發(fā)布會(huì)上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級(jí)和突破。酷學(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過(guò)形象生動(dòng)、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺(tái),以
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門(mén)”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20
9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G
9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商