語音合成(Text To Speech)已經在可懂度、自然度等方面取得了較好的效果,被廣泛應用于銀行叫號、機場廣播、地圖導航等多個領域。而人的語音交流不僅包含著基本的文字信息,還承載著大量豐富的情感信息,這就對語音合成提出了更高的要求。
極限元專門從事智能語音技術,擁有完全自主知識產權。其語音合成采用世界先進的數據驅動技術,利用精心設計的語音語料庫進行聲學模型和文本處理模型的訓練,得到的模型深度挖掘了語音語言特性,從而能夠合成接近真人發音的語音,合成的語音清晰、自然、親切、具有高表現力。
韻律是合成語音是否具有高自然度的關鍵所在。極限元語音合成對輸入文本進行韻律分析預測,其中包括韻律詞、韻律短語邊界劃分,詞重音的分布,各個語音單元的基頻、時長等。這樣合成的語音清晰明朗,親切自然,接近真人發音。目前,極限元已為百度、騰訊、搜狗、奇虎360等眾多客戶服務,建立了長期穩定的合作關系。
極限元語音合成技術,合成語音效果媲美真人發聲,專業MOS分可達4.0,為了市場發展需要,極限元的語音合成技術全面支持多方言、多語種、多音色的選擇,目前標配的有甜美女生和渾厚男生,針對用戶的不同應用場景和個性化的音色需求,提供全方位的語音合成定制化服務,例如:明星的聲音、兒童的聲音以及某個地區方言。
極限元語音合成定制化支持錄音人選型、錄音采集、語料標注,還能實現模型迭代訓練、合成引擎優化,支持在線、離線模式,適用于多種平臺,可應用于多個領域。如:
呼叫中心行業中的應用
擁有大量客戶群體的行業呼叫中心,如電信、銀行、證券、保險、房地產、家電、運輸、互聯網、公共服務機構,語音合成技術能夠以有限的資源占用,將文字信息轉化成連續語音,合成語音自然、流暢。對于呼叫中心而言,無需對大量的信息進行錄音,極大地節省了工作量和存儲空間,同時根據呼叫中心需求,語音合成技術還能提供個性化語音合成服務,為呼叫中心提供高質量的服務需求。
車載導航上的應用
智能化、人性化的車載導航已經成為一個重要的發展趨勢,車載導航產品中的語音輸出用合成技術將需要同用戶交互的信息轉化成語音,如:道路信息,駕駛導航信息,POI信息,實時路況等,使用戶通過語音獲取信息,方便駕駛員解放雙手和眼睛,同時提高駕駛安全性。
智能機器人的應用
銀行、醫院、教育等行業的商用機器人逐漸成熟,極限元語音合成可以為機器人合成個性化語音,比如銀行、醫院的機器人語音需要甜美親切的,而教育行業主要針對孩子的,機器人的語音需要呆萌可愛的童音。
智能家居的應用
在家居場景中,主要圍繞著智能電視、智能音箱展開,解決用戶需求,如搜索影片、歌曲、簡單交互、應用調取等,極限元語音合成定制化能夠根據用戶需求,定制合成語音,如明星的聲音。
極限元語音合成已達到流暢、連貫、自然、逼近真人發聲的語音合成效果,無論是地圖導航、機場廣播的甜美女生,新聞朗讀的渾厚男生,還是機器人的可愛童聲,極限元的語音合成技術能夠滿足企業需求,實現個性化高端定制,讓大家聽到機器的聲音娓娓動聽,讓未來交互場景更加豐富、個性化。