1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

愛數(shù)智慧發(fā)布中文普通話真·萌童聲TTS開源數(shù)據(jù)集

 2019-11-26 14:41  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

11月20日,愛數(shù)智慧發(fā)布中文普通話真·萌童聲語音合成(TTS)開源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語音合成數(shù)據(jù)集子集,時長為15分鐘,文本主要為日常用語。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時長超2小時。這也是該童聲第一次用于TTS錄制。

隨著智能終端市場的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對話的入口。在人機(jī)互動過程中,語音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對合成語音的期望值也不斷提高。

TTS數(shù)據(jù)是影響語音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過程中還需要有專業(yè)的錄音師和監(jiān)聽人在場,便于及時矯正錄音過程中的錯誤。從標(biāo)注環(huán)節(jié)來看,TTS數(shù)據(jù)標(biāo)注分為4個層級,包括發(fā)音校對、韻律層級、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。

智能設(shè)備使用者“低齡化”趨勢明顯,從而帶動了童聲數(shù)據(jù)的需求。受制于兒童識字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫數(shù)量較少,且多為成年人模仿。童聲TTS語料庫呈現(xiàn)出明顯的供需不平衡。

本次愛數(shù)智慧發(fā)布的TTS童聲開源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對數(shù)據(jù)進(jìn)行轉(zhuǎn)寫和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對聽感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對聲韻母邊界進(jìn)行切分外,還對句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。

發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來更好的聽感。

在與愛數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動畫片時,就會黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時,言語間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對這個真·萌童聲充滿期待!

為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場景,服務(wù)更廣域的客戶。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能
智慧生活

相關(guān)文章

  • IoT開發(fā)者為王,涂鴉智能硬核“靠邊站”

    IoT盛宴:涂鴉向下,產(chǎn)品向上

    標(biāo)簽:
    人工智能
  • IPO觀察丨黑芝麻智能遞表港交所,車芯行業(yè)已邁向量產(chǎn)決戰(zhàn)期?

    雖然我國汽車芯片行業(yè)還處在發(fā)展初期,但已經(jīng)迸發(fā)出無限潛力。一方面,智能汽車的發(fā)展不斷帶動需求增長;另一方面,政策引導(dǎo)下,汽車芯片企業(yè)持續(xù)搶占高地。對此,在7月5日-7日舉辦的2023年中國汽車論壇上,中國汽車工業(yè)協(xié)會副秘書長李邵華就做出表示,“中國將成為未來汽車芯片發(fā)展的集聚地”。車規(guī)芯片行業(yè)近日的

    標(biāo)簽:
    人工智能
  • 倒計時2天丨云天勵飛將亮相世界人工智能大會

    2023世界人工智能大會將于7月6日至8日在上海舉辦。云天勵飛將在大會上展示自主設(shè)計開發(fā)的新一代邊緣計算芯片DeepEdge10系列SoC芯片,并公布“天書”大模型的最新動態(tài)。歡迎蒞臨上海世博展覽館H1-C801展臺參觀交流!同時,云天勵飛也將與中國電子、中國信通院、華為等合作伙伴,在WAIC的舞臺

    標(biāo)簽:
    人工智能
  • 首屆中國智慧生活大會(CIC)在京成功召開

    6月28日,首屆中國智慧生活大會(CIC)在北京成功召開。本次大會是對貫徹擴(kuò)大內(nèi)需政策,落實(shí)國務(wù)院“三品戰(zhàn)略”,結(jié)合“2023消費(fèi)提振年”工作安排的積極響應(yīng)。會議由中國電子視像行業(yè)協(xié)會、中國標(biāo)準(zhǔn)科技集團(tuán)、中家院(北京)檢測認(rèn)證有限公司聯(lián)合指導(dǎo),洛圖科技(RUNTO)主辦,京東3C數(shù)碼和植理文化協(xié)辦。

    標(biāo)簽:
    智慧生活
  • 酷學(xué)院智能產(chǎn)品發(fā)布會:引領(lǐng)中大型企業(yè)學(xué)習(xí)新潮流

    近日,酷學(xué)院智能產(chǎn)品發(fā)布會在深圳閃亮登場。近200位現(xiàn)場觀眾和近萬人次在線觀看,共同見證了這一激動人心的時刻。發(fā)布會上,酷學(xué)院引領(lǐng)大家探索企業(yè)培訓(xùn)學(xué)習(xí)和人才發(fā)展領(lǐng)域的新高度,并揭幕其全新的產(chǎn)品智能升級和突破??釋W(xué)院產(chǎn)品負(fù)責(zé)人徐晨通過形象生動、邏輯嚴(yán)謹(jǐn)?shù)闹v述,揭曉了全新的智能企業(yè)培訓(xùn)和人才發(fā)展平臺,以

    標(biāo)簽:
    人工智能
  • “創(chuàng)造市場”與“算法進(jìn)化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達(dá)股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費(fèi)”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機(jī)器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會,反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應(yīng)用與未來

    瞄準(zhǔn)場景需求,打造國內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實(shí)力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨(dú)角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項(xiàng)

  • 60萬獎金召喚AI創(chuàng)新者,2024無錫國際人工智能創(chuàng)新應(yīng)用大賽火熱進(jìn)行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。無錫市作為中國的科技創(chuàng)新中心之一,正通過構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強(qiáng)大支撐,通過“AI+”行動推動人工智能與多個產(chǎn)業(yè)交叉融合,實(shí)現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國際競爭力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動操作系統(tǒng)創(chuàng)新升級,龍蜥堅持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機(jī)學(xué)會開源發(fā)展委員會、中關(guān)村科學(xué)城委員會、海淀區(qū)委網(wǎng)信辦、中國開源軟件推進(jìn)聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進(jìn)化

編輯推薦