1.一種基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過輕量化文本編碼器對所述標(biāo)準(zhǔn)文本序列進(jìn)行編碼,生成文本隱向量,包括:
3.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過非自回歸聲學(xué)特征預(yù)測模塊將所述文本隱向量映射為學(xué)生聲學(xué)特征序列,包括:
4.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過知識蒸餾模塊確定所述學(xué)生聲學(xué)特征序列與所述教師聲學(xué)特征序列之間的對齊損失,包括:
5.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,根據(jù)所述對齊損失對所述輕量化文本編碼器和所述非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行結(jié)構(gòu)化剪枝處理,包括:
6.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,對剪枝處理后的輕量化文本編碼器和非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行參數(shù)量化處理,包括:
7.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過聲碼器將所述優(yōu)化聲學(xué)特征序列轉(zhuǎn)換為語音波形,包括:
8.一種基于知識蒸餾的文本轉(zhuǎn)語音裝置,其特征在于,所述基于知識蒸餾的文本轉(zhuǎn)語音裝置包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括存儲器、處理器以及存儲至所述存儲器上并可以在所述處理器上運(yùn)行的基于知識蒸餾的文本轉(zhuǎn)語音程序,所述基于知識蒸餾的文本轉(zhuǎn)語音程序被所述處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)上存儲有基于知識蒸餾的文本轉(zhuǎn)語音程序,所述基于知識蒸餾的文本轉(zhuǎn)語音程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。