帳號:
密碼:
CTIMES/SmartAuto / 新聞 /
NVIDIA在Interspeech大會分享表達性語言合成研究成果
 

【CTIMES/SmartAuto 王岫晨 報導】   2021年09月06日 星期一

瀏覽人次:【1277】
  

原本的自動電話語音和已經發展數十年的 GPS 導航系統都只能發出生硬的機器合成聲音,而人工智慧 (AI) 卻讓智慧型手機和智慧音箱中的虛擬助理呈現逼真的語調。不過,AI 合成的聲音和我們在日常對話及媒體中聽到的真實人聲之間,還是差了那麼一點,原因在於人們說話時帶有複雜的節奏、音調和音色,這是很難以 AI 仿真出來的。

開發人員與創作者可運用最先進的表達性語言合成對話式人工智慧模型
開發人員與創作者可運用最先進的表達性語言合成對話式人工智慧模型

然而這個差距正在迅速縮小。NVIDIA 的研究人員正在打造高品質、可控制的語音合成模型與工具,它們能捕捉人類口說聲音中的豐富細節,又不會聽起來人工感很重。研究人員也於 INTERSPEECH 2021 大會展示這項最新的研究成果。

這些模型有助銀行和零售商的自動語音客服,也能讓電玩遊戲或書籍中的人物更為生動,並即時為數位分身加上合成語音。NVIDIA 內部的創意團隊甚至運用這項技術,為一支介紹 AI 的系列影片製作出富有表現力的旁白內容。

表達性語言合成只是 NVIDIA Research 團隊在對話式 AI 的其中一項研究,這個領域還包括自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等。這項先進研究成果的部分內容已透過 NVIDIA NeMo 工具套件成為開放原始碼,可以在 NGC 容器及其它軟體中心取得,並經最佳化調整,能在 NVIDIA GPU 上高效執行。

關鍵字: GPU  邊緣運算  NVIDIA 
相關新聞
NVIDIA人工智慧感知技術攜手ROS社群 加速機器人應用開發
NVIDIA人工智慧感知技術將走進ROS開發者社群
NVIDIA首度公布在Arm架構伺服器上的AI測試結果
慧榮布局邊緣AI應用 戰略投資Deep Vision
APAL搶進5G國際市場 推出跨裝置5G行動網卡
comments powered by Disqus
相關討論
  相關新品
CWFA205: WiFi+BT
原廠/品牌:鉅景
供應商:鉅景
產品類別:RF
GPS SiP Module
原廠/品牌:鉅景
供應商:鉅景
產品類別:RF
CGPA10x: GPS SiP
原廠/品牌:鉅景
供應商:鉅景
產品類別:RF
  相關產品
» Power Integrations 推出InnoSwitch3-PD 系列開關 IC
» ADI推出臨床級四項生命體徵AFE 適用於遠端病人監測設備
» Bigtera發佈新版軟體定義儲存產品 為企業數位創新提供資料後盾
» NVIDIA AI Enterprise正式上市 各行各業盡享AI
» Arm全面運算解決方案 為廣泛消費終端帶來效能與效率
  相關文章
» EDA進化中!
» 虛擬與模擬的世界觀
» ST:支付技術發展迅速 使用者渴望新的支付體驗
» 超大規模運算五年內發揮積極影響力
» SLM晶片生命週期管理平台 形塑半導體智慧製造新層次

AD


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2021 遠播資訊股份有限公司版權所有 Powered by O3
地址:台北市中山北路三段29號11樓 / 電話 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw