2019深度学习语音合成指南（下）

发布时间：2019-12-23 09:02:41 所属栏目：运营来源：站长网

导读：副标题#e# 前文回顾：2019深度学习语音合成指南（上） Deep Voice 3: 利用卷积序列学习将文本转换为语音文章链接：https://arxiv.org/abs/1710.07654 作者提出了一种全卷积字符到谱图的框架，可以实现完全并行计算。该框架是基于注意力的序列到序列模型。

它由一个循环的的序列到序列特征预测网络组成，该网络将字符嵌入到梅尔标度图谱中。然后是一个修改后的WaveNet模型，这个模型充当声码器，利用频谱图来合成时域波。模型的平均意见评分(MOS)为4.53分。

2019深度学习语音合成指南（下）

这个模型结合了Tacconon和WaveNet的最佳特点。下面是它与其他模型的性能对比：

2019深度学习语音合成指南（下）

结论：

现在的语音合成技术发展很快，我们希望能够尽快追赶上最前沿的研究。以上这几篇文章是当前语音合成领域最重要的进展代表，论文、以及其代码实现都可在网上找到，期待你能去下载下来进行测试，并能够获得期望的结果。

让我们一起创造一个丰富多彩的语音世界。

原文链接：https://heartbeat.fritz.ai/a-2019-guide-to-speech-synthesis-with-deep-learning-630afcafb9dd

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

三星联合开发，真全面	realme Book增强版配置
小米12系列在西欧上线	iPhone 14 Pro前瞻工