天堂资源成人√,久热最新,欧美黄色免费在线观看,国产精品久久久久久久久久精爆,91日韩中文字幕,av免费一区二区,7777精品久久久大香线蕉电影

一種基于多跳檢索和推理的復雜聲明事實核查方法及系統(tǒng)

文檔序號:42299478發(fā)布日期:2025-06-27 18:40閱讀:9來源:國知局

本發(fā)明涉及事實核查,尤其涉及一種基于多跳檢索和推理的復雜聲明事實核查方法及系統(tǒng)。


背景技術:

1、隨著社交網絡的迅速發(fā)展,信息傳播的速度與廣度顯著提升,但同時也催生了虛假信息的大量擴散。事實核查系統(tǒng)旨在通過精準檢索相關證據(jù)并對聲明的真實性進行系統(tǒng)性驗證,從而有效遏制虛假信息的傳播,為信息環(huán)境的可信度與透明性提供保障。其主要目標是通過自動化手段輔助人類判別信息的真實性,進而提高社交媒體內容的可靠性。傳統(tǒng)的事實核查方法通常采用兩階段的范式:首先從大規(guī)模語料庫中檢索與聲明相關的證據(jù),然后通過分析聲明與證據(jù)之間的語義關系來判斷聲明的真?zhèn)巍?/p>

2、然而,傳統(tǒng)方法大多依賴一對一的聲明和證據(jù)的相關性,在現(xiàn)有方法中,單跳檢索通常僅關注聲明與單條證據(jù)的語義相似性,難以有效捕捉多條證據(jù)之間的交互信息;多跳檢索雖然嘗試通過迭代方式整合證據(jù),但卻面臨意圖漂移、噪聲累積以及對超鏈接的依賴問題。同時,推理階段的挑戰(zhàn)在于難以同時捕獲局部語義特征和多條證據(jù)間的全局結構關系,導致復雜聲明驗證的準確性受限。


技術實現(xiàn)思路

1、鑒于此,本發(fā)明實施例提供了一種基于多跳檢索和推理的復雜聲明事實核查方法,以消除或改善現(xiàn)有技術中存在的一個或更多個缺陷。

2、本發(fā)明的一個方面提供了一種基于多跳檢索和推理的復雜聲明事實核查方法,該方法的步驟包括:

3、獲取待核查的聲明語句,通過多個檢索輪次構建對應聲明語句的證據(jù)集合;

4、在每個檢索輪次中,將所述聲明語句和當前證據(jù)集合中的證據(jù)語句進行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進行檢索,得到檢索出的證據(jù)語句,并將該證據(jù)語句加入證據(jù)集合中;

5、將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進行句內推理,得到對應的聲明證據(jù)對向量;

6、基于所述聲明證據(jù)對向量構建對應每個證據(jù)語句的多跳推理子圖,基于全部的多跳推理子圖得到句間推理向量;

7、將所述句間推理向量輸入到預設置的mlp模型中,得到聲明語句的核查結果。

8、采用上述方案,本方案聚焦于解決多跳檢索中的意圖偏移和多跳推理中的復雜關聯(lián)建模問題,這些問題是導致現(xiàn)有模型在處理復雜聲明時檢索效率低下和推理能力受限的核心挑戰(zhàn),具體的,本方案通過設計句內推理和句間推理的分層式結構,在句內推理中利用循環(huán)記憶捕捉長距離語義依賴,在句間推理中基于潛在連邊學習和圖神經網絡,構建多跳證據(jù)子圖以建模復雜的跨證據(jù)語義關聯(lián),捕獲局部語義特征和多條證據(jù)間的全局結構關系。

9、在本發(fā)明的一些實施方式中,在將所述聲明語句和當前證據(jù)集合中的證據(jù)語句進行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進行檢索,得到檢索出的證據(jù)語句的步驟中:

10、將所述聲明語句和當前證據(jù)集合中的證據(jù)語句進行組合,并將組合語句輸入到預設置的查詢壓縮器中,得到壓縮后的組合語句;

11、將壓縮后的組合語句輸入到約束生成式檢索器中,得到檢索出的證據(jù)語句。

12、在本發(fā)明的一些實施方式中,在將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進行句內推理,得到對應的聲明證據(jù)對向量的步驟中,每個所述聲明證據(jù)對輸入到包括多個transformer層的遞歸記憶模型中,得到對應的聲明證據(jù)對向量。

13、在本發(fā)明的一些實施方式中,在證據(jù)集合中基于證據(jù)語句的加入順序,對所述證據(jù)語句進行順序編號,在基于所述聲明證據(jù)對向量構建對應每個證據(jù)語句的多跳推理子圖的步驟中:

14、在證據(jù)語句對應的多跳推理子圖中包括該證據(jù)語句的編號的前序編號的任一個證據(jù)語句的對應節(jié)點,在多跳推理子圖中基于證據(jù)語句的編號對各個節(jié)點順序連接構建多條路徑邊;

15、基于各個節(jié)點對應的聲明證據(jù)對向量的相似度構建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖。

16、在本發(fā)明的一些實施方式中,在基于各個節(jié)點對應的聲明證據(jù)對向量的相似度構建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖的步驟中,基于節(jié)點對應的聲明證據(jù)對向量計算相似度,并與預設置的相似度閾值比較,判定是否構建兩個節(jié)點之間的潛在連邊。

17、在本發(fā)明的一些實施方式中,在基于全部的多跳推理子圖得到句間推理向量的步驟中,將每個多跳推理子圖通過圖注意力層進行處理,并對全部的多跳推理子圖進行聚合,得到句間推理向量。

18、在本發(fā)明的一些實施方式中,所述方法的步驟還包括對查詢壓縮器進行預訓練,對查詢壓縮器進行預訓練的步驟包括蒸餾和對齊處理;

19、在蒸餾處理的過程中,采用預設置的大語言模型處理聲明語句和證據(jù)語句的組合語句,生成壓縮文本,作為查詢壓縮器的學習目標;

20、使用預設置的大語言模型來計算壓縮文本與原始的聲明語句的語義匹配度,將得分最高的壓縮文本作為正樣本,將其余的壓縮文本作為負樣本;

21、基于所述正樣本和負樣本訓練所述查詢壓縮器。

22、在本發(fā)明的一些實施方式中,在基于所述正樣本和負樣本訓練所述查詢壓縮器的步驟中,將所述正樣本和負樣本對應的組合語句輸入到查詢壓縮器,得到壓縮后的組合語句,基于壓縮后的組合語句與所述正樣本和負樣本計算損失函數(shù),基于損失函數(shù)值對查詢壓縮器進行訓練。

23、在本發(fā)明的一些實施方式中,在基于壓縮后的組合語句與所述正樣本和負樣本計算損失函數(shù)的步驟中,基于如下公式計算損失函數(shù):

24、

25、其中,la表示損失函數(shù)的值,n表示組合語句的數(shù)量,n表示負樣本的數(shù)量,qi表示第i個壓縮后的組合語句,q+表示正樣本,表示第j個負樣本,f(·)表示編碼器,τ表示溫度系數(shù)。

26、本發(fā)明的第二方面還提供一種基于多跳檢索和推理的復雜聲明事實核查系統(tǒng),該系統(tǒng)包括計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有計算機指令,所述處理器用于執(zhí)行所述存儲器中存儲的計算機指令,當所述計算機指令被處理器執(zhí)行時該系統(tǒng)實現(xiàn)如前所述方法所實現(xiàn)的步驟。

27、本發(fā)明的第三方面還提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時以實現(xiàn)前述基于多跳檢索和推理的復雜聲明事實核查方法所實現(xiàn)的步驟。

28、本發(fā)明的附加優(yōu)點、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領域普通技術人員在研究下文后部分地變得明顯,或者可以根據(jù)本發(fā)明的實踐而獲知。本發(fā)明的目的和其它優(yōu)點可以通過在說明書以及附圖中具體指出并獲得。

29、本領域技術人員將會理解的是,能夠用本發(fā)明實現(xiàn)的目的和優(yōu)點不限于以上具體所述,并且根據(jù)以下詳細說明將更清楚地理解本發(fā)明能夠實現(xiàn)的上述和其他目的。



技術特征:

1.一種基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,該方法的步驟包括:

2.根據(jù)權利要求1所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在將所述聲明語句和當前證據(jù)集合中的證據(jù)語句進行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進行檢索,得到檢索出的證據(jù)語句的步驟中:

3.根據(jù)權利要求1所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對,將每個所述聲明證據(jù)對輸入到遞歸記憶模型中進行句內推理,得到對應的聲明證據(jù)對向量的步驟中,每個所述聲明證據(jù)對輸入到包括多個transformer層的遞歸記憶模型中,得到對應的聲明證據(jù)對向量。

4.根據(jù)權利要求1所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在證據(jù)集合中基于證據(jù)語句的加入順序,對所述證據(jù)語句進行順序編號,在基于所述聲明證據(jù)對向量構建對應每個證據(jù)語句的多跳推理子圖的步驟中:

5.根據(jù)權利要求4所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在基于各個節(jié)點對應的聲明證據(jù)對向量的相似度構建節(jié)點之間的潛在連邊,得到最終的多跳推理子圖的步驟中,基于節(jié)點對應的聲明證據(jù)對向量計算相似度,并與預設置的相似度閾值比較,判定是否構建兩個節(jié)點之間的潛在連邊。

6.根據(jù)權利要求1所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在基于全部的多跳推理子圖得到句間推理向量的步驟中,

7.根據(jù)權利要求2所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,所述方法的步驟還包括對查詢壓縮器進行預訓練,對查詢壓縮器進行預訓練的步驟包括蒸餾和對齊處理;

8.根據(jù)權利要求7所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在基于所述正樣本和負樣本訓練所述查詢壓縮器的步驟中,將所述正樣本和負樣本對應的組合語句輸入到查詢壓縮器,得到壓縮后的組合語句,基于壓縮后的組合語句與所述正樣本和負樣本計算損失函數(shù),基于損失函數(shù)值對查詢壓縮器進行訓練。

9.根據(jù)權利要求8所述的基于多跳檢索和推理的復雜聲明事實核查方法,其特征在于,在基于壓縮后的組合語句與所述正樣本和負樣本計算損失函數(shù)的步驟中,基于如下公式計算損失函數(shù):

10.一種基于多跳檢索和推理的復雜聲明事實核查系統(tǒng),其特征在于,該系統(tǒng)包括計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有計算機指令,所述處理器用于執(zhí)行所述存儲器中存儲的計算機指令,當所述計算機指令被處理器執(zhí)行時該系統(tǒng)實現(xiàn)如權利要求1~9任一項所述方法所實現(xiàn)的步驟。


技術總結
本發(fā)明提供一種基于多跳檢索和推理的復雜聲明事實核查方法及系統(tǒng),該方法的步驟包括:獲取待核查的聲明語句,通過多個檢索輪次構建對應聲明語句的證據(jù)集合;在每個檢索輪次中,將所述聲明語句和當前證據(jù)集合中的證據(jù)語句進行組合,并通過約束生成式檢索器從數(shù)據(jù)庫中進行檢索,得到檢索出的證據(jù)語句,并將該證據(jù)語句加入證據(jù)集合中;將聲明語句與證據(jù)集合中的每個證據(jù)語句組合為一個聲明證據(jù)對輸入到遞歸記憶模型中進行句內推理,得到對應的聲明證據(jù)對向量;基于所述聲明證據(jù)對向量構建對應每個證據(jù)語句的多跳推理子圖,基于全部的多跳推理子圖得到句間推理向量;將所述句間推理向量輸入到預設置的MLP模型中,得到聲明語句的核查結果。

技術研發(fā)人員:李朝卓,鄭莉雯,賈浩苒,張力天,張熙
受保護的技術使用者:北京郵電大學
技術研發(fā)日:
技術公布日:2025/6/26
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1