基于预训练语言表示模型的汉语韵律结构预测

更新时间:2023-05-28

《天津大学学报(自然科学与工程技术版)》2020年03期

【摘要】韵律结构预测作为语音合成系统中的一个关键步骤,其结果直接影响合成语音的自然度和可懂度.本文提出了一种基于预训练语言表示模型的韵律结构预测方法,以字为建模单位,在预训练语言模型的基础上对每个韵律层级设置了独立的输出层,利用韵律标注数据对预训练模型进行微调.另外在此基础上额外增加了分词任务,通过多任务学习的方法对各韵律层级间的关系及韵律与词间的关系建模,实现对输入文本各级韵律边界的同时预测.实验首先证明了多输出结构设置的合理性及使用预训练模型的有效性,并验证了分词任务的加入可以进一步提升模型性能;将最优的结果与设置的两个基线模型相比,在韵律词和韵律短语预测的F1值上与条件随机场模型相比分别有2.48%和4.50%的绝对提升,而与双向长短时记忆网络相比分别有6.2%和5.4%的绝对提升;最后实验表明该方法可以在保证预测性能的同时减少对训练数据量的需求.

【关键词】韵律结构预测预训练语言表示模型多任务学习语音合成

全网下载: 1375 页数: 2页价格: 免费来源:

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像秀出你的观点

0/500

以上留言仅代表用户个人观点，不代表中教立场

基于预训练语言表示模型的汉语韵律结构预测

更新时间:2023-05-28

发表评论

热门文献

精选文献

推荐期刊