基于知識蒸餾的文本轉(zhuǎn)語音方法、裝置、設(shè)備及介質(zhì)與流程

文檔序號：42298308發(fā)布日期：2025-06-27 18:38閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>基于知識蒸餾的文本轉(zhuǎn)語音方法、裝置、設(shè)備及介質(zhì)與流程

技術(shù)特征：

1.一種基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，包括以下步驟：

2.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，通過輕量化文本編碼器對所述標(biāo)準(zhǔn)文本序列進(jìn)行編碼，生成文本隱向量，包括：

3.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，通過非自回歸聲學(xué)特征預(yù)測模塊將所述文本隱向量映射為學(xué)生聲學(xué)特征序列，包括：

4.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，通過知識蒸餾模塊確定所述學(xué)生聲學(xué)特征序列與所述教師聲學(xué)特征序列之間的對齊損失，包括：

5.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，根據(jù)所述對齊損失對所述輕量化文本編碼器和所述非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行結(jié)構(gòu)化剪枝處理，包括：

6.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，對剪枝處理后的輕量化文本編碼器和非自回歸聲學(xué)特征預(yù)測模塊進(jìn)行參數(shù)量化處理，包括：

7.如權(quán)利要求1所述的基于知識蒸餾的文本轉(zhuǎn)語音方法，其特征在于，通過聲碼器將所述優(yōu)化聲學(xué)特征序列轉(zhuǎn)換為語音波形，包括：

8.一種基于知識蒸餾的文本轉(zhuǎn)語音裝置，其特征在于，所述基于知識蒸餾的文本轉(zhuǎn)語音裝置包括：

9.一種計(jì)算機(jī)設(shè)備，其特征在于，所述計(jì)算機(jī)設(shè)備包括存儲器、處理器以及存儲至所述存儲器上并可以在所述處理器上運(yùn)行的基于知識蒸餾的文本轉(zhuǎn)語音程序，所述基于知識蒸餾的文本轉(zhuǎn)語音程序被所述處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。

10.一種計(jì)算機(jī)可讀存儲介質(zhì)，其特征在于，所述存儲介質(zhì)上存儲有基于知識蒸餾的文本轉(zhuǎn)語音程序，所述基于知識蒸餾的文本轉(zhuǎn)語音程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的基于知識蒸餾的文本轉(zhuǎn)語音方法的步驟。

技術(shù)總結(jié)
本發(fā)明涉及語音處理技術(shù)領(lǐng)域，可應(yīng)用于醫(yī)療健康、金融科技及無障礙服務(wù)領(lǐng)域等業(yè)務(wù)場景中，公開了一種基于知識蒸餾的文本轉(zhuǎn)語音方法，包括：對輸入文本進(jìn)行標(biāo)準(zhǔn)化處理，生成標(biāo)準(zhǔn)文本序列；輕量化文本編碼器對標(biāo)準(zhǔn)文本序列進(jìn)行編碼，生成文本隱向量；非自回歸聲學(xué)特征預(yù)測模塊將文本隱向量映射為學(xué)生聲學(xué)特征序列，并通過知識蒸餾計(jì)算對齊損失；基于對齊損失進(jìn)行結(jié)構(gòu)化剪枝和參數(shù)量化，優(yōu)化后的模型生成聲學(xué)特征序列，并由聲碼器轉(zhuǎn)換為語音波形。本發(fā)明通過知識蒸餾、剪枝優(yōu)化和參數(shù)量化，在降低模型體積和計(jì)算需求的同時，提高推理速度和跨設(shè)備適配性，使TTS系統(tǒng)能夠在資源受限環(huán)境下實(shí)現(xiàn)高效、低延遲、低功耗的語音生成。

技術(shù)研發(fā)人員：石巖,陳閩川,王少軍
受保護(hù)的技術(shù)使用者：平安科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/6/26

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

天堂资源成人√,久热最新,欧美黄色免费在线观看,国产精品久久久久久久久久精爆,91日韩中文字幕,av免费一区二区,7777精品久久久大香线蕉电影

基于知識蒸餾的文本轉(zhuǎn)語音方法、裝置、設(shè)備及介質(zhì)與流程

基于知識蒸餾的文本轉(zhuǎn)語音方法、裝置、設(shè)備及介質(zhì)與流程