天堂资源成人√,久热最新,欧美黄色免费在线观看,国产精品久久久久久久久久精爆,91日韩中文字幕,av免费一区二区,7777精品久久久大香线蕉电影

基于知識蒸餾的文本轉(zhuǎn)語音方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號:42298308發(fā)布日期:2025-06-27 18:38閱讀:來源:國知局

技術(shù)特征:

1.一種基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,包括以下步驟:

2.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過輕量化文本編碼器對所述標(biāo)準(zhǔn)文本序列進(jìn)行編碼,生成文本隱向量,包括:

3.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過非自回歸聲學(xué)特征預(yù)測模塊將所述文本隱向量映射為學(xué)生聲學(xué)特征序列,包括:

4.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過知識蒸餾模塊確定所述學(xué)生聲學(xué)特征序列與所述教師聲學(xué)特征序列之間的對齊損失,包括:

5.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,根據(jù)所述對齊損失對所述輕量化文本編碼器和所述非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行結(jié)構(gòu)化剪枝處理,包括:

6.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,對剪枝處理后的輕量化文本編碼器和非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行參數(shù)量化處理,包括:

7.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法,其特征在于,通過聲碼器將所述優(yōu)化聲學(xué)特征序列轉(zhuǎn)換為語音波形,包括:

8.一種基于知識蒸餾的文本轉(zhuǎn)語音裝置,其特征在于,所述基于知識蒸餾的文本轉(zhuǎn)語音裝置包括:

9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括存儲器、處理器以及存儲至所述存儲器上并可以在所述處理器上運(yùn)行的基于知識蒸餾的文本轉(zhuǎn)語音程序,所述基于知識蒸餾的文本轉(zhuǎn)語音程序被所述處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。

10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述存儲介質(zhì)上存儲有基于知識蒸餾的文本轉(zhuǎn)語音程序,所述基于知識蒸餾的文本轉(zhuǎn)語音程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。


技術(shù)總結(jié)
本發(fā)明涉及語音處理技術(shù)領(lǐng)域,可應(yīng)用于醫(yī)療健康、金融科技及無障礙服務(wù)領(lǐng)域等業(yè)務(wù)場景中,公開了一種基于知識蒸餾的文本轉(zhuǎn)語音方法,包括:對輸入文本進(jìn)行標(biāo)準(zhǔn)化處理,生成標(biāo)準(zhǔn)文本序列;輕量化文本編碼器對標(biāo)準(zhǔn)文本序列進(jìn)行編碼,生成文本隱向量;非自回歸聲學(xué)特征預(yù)測模塊將文本隱向量映射為學(xué)生聲學(xué)特征序列,并通過知識蒸餾計(jì)算對齊損失;基于對齊損失進(jìn)行結(jié)構(gòu)化剪枝和參數(shù)量化,優(yōu)化后的模型生成聲學(xué)特征序列,并由聲碼器轉(zhuǎn)換為語音波形。本發(fā)明通過知識蒸餾、剪枝優(yōu)化和參數(shù)量化,在降低模型體積和計(jì)算需求的同時,提高推理速度和跨設(shè)備適配性,使TTS系統(tǒng)能夠在資源受限環(huán)境下實(shí)現(xiàn)高效、低延遲、低功耗的語音生成。

技術(shù)研發(fā)人員:石巖,陳閩川,王少軍
受保護(hù)的技術(shù)使用者:平安科技(深圳)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/6/26
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1