全部文章Ta的评论
- 2017年,google提出Tacotron模型,该模型包括声学模型和声码器两部分,从文本直接生成音频波形。其中,声学模型部分采取encoder-attention-decoder框架,以RNN作为主要网络结构。此后,在Tacotron的基础上,产生了Tacotron2,DurIAN,Non-Attentive Tacotron,Parallel Tacotron1/2等变体。本文对Tacotron系列的声学模型进行介绍。戴****茜2024-06-26170
- Deep Voice1/2基于传统SPSS流水线,用CNN进行增强。Deep Voice3采用encoder-attention-decoder 的结构,和Tacotron整体结构类似,但采用CNN而不是RNN作为主体网络。 本文对Deep Voice,Deep Voice2,Deep Voice3进行介绍。戴****茜2024-06-26360
共 2 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 2 篇文章
文章获得 0 次赞同
文章被浏览 53 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉