TCL科技申请音频合成专利,使得合成音频能够呈现同语种下的不同口音和音色

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

TCL科技申请音频合成专利,使得合成音频能够呈现同语种下的不同口音和音色

转自:金融界

本文源自:金融界

金融界2023年12月1日消息,据国家知识产权局公告,TCL科技集团股份有限公司申请一项名为“一种音频合成方法、装置、设备和存储介质“,公开号CN117153140A,申请日期为2022年5月。

专利摘要显示,本申请实施例公开了一种音频合成方法、装置、设备和存储介质,包括:获取预设文本的标准音标文本,所述标准音标文本用于表征所述预设文本的标准读音;获取目标口音特征向量;获取目标身份标识;通过音频合成模型,根据所述标准音标文本、所述目标口音特征向量以及所述身份标识,生成目标声音特征参数;将所述目标声音特征参数转换成所述预设文本对应的目标音频,所述目标音频携带有所述目标口音特征向量对应的目标口音和所述目标身份标识对应的所述目标音色。通过训练音频合成模型来生成合成音频,使得合成音频能够呈现同语种下的不同口音和音色,改善现有的部分人群无法适应或理解普通话提示语音或引导语音的问题。

您可以还会对下面的文章感兴趣:

最新评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

使用微信扫描二维码后

点击右上角发送给好友