相关背景

语言模型与生成任务

https://blog.csdn.net/qq_27590277/article/details/120662976

语言模型可以通过在大规模语料集上进行预训练(Step1),来学习通用的语言知识和表达能力,然后再根据不同的任务进行微调或者固定参数,来适应特定的领域或者场景(Step2)。预训练语言模型可以提高生成任务的效果和样本效率。

根据学习方式的不同,Step1可以分为如下四种方式:

Step2又可以分为如下三种:

离散单元

S2ST可以分为两种方法,一种是预测梅尔谱,一种是预测离散单元。预测离散单元具有以下优点:

离散语音单元又分为两种: