背景技術(shù):
1、在捕獲圖像數(shù)據(jù)(例如,靜止圖像,視頻)時(shí),多個(gè)計(jì)算機(jī)控制的相機(jī)系統(tǒng)基于目標(biāo)幀中的所標(biāo)識(shí)的感興趣的區(qū)域(roi)來動(dòng)態(tài)地調(diào)整捕獲參數(shù)。例如,roi經(jīng)常被用于3a(自動(dòng)聚焦、自動(dòng)曝光、自動(dòng)白平衡)捕獲參數(shù)調(diào)整,盡管它們也可以用于其他捕獲參數(shù)調(diào)整。通常,計(jì)算機(jī)系統(tǒng)采用對(duì)象檢測算法來標(biāo)識(shí)視野幀內(nèi)的一個(gè)或多個(gè)感興趣的對(duì)象,使用那些所檢測的(多個(gè))對(duì)象來標(biāo)識(shí)幀內(nèi)的roi,并且基于至少一個(gè)(多個(gè))roi的可視化內(nèi)容來調(diào)整捕獲參數(shù)。在一個(gè)常見示例中,計(jì)算機(jī)系統(tǒng)采用軟件驅(qū)動(dòng)的面部檢測技術(shù)來標(biāo)識(shí)包含面部(或其部分)的roi,并且基于roi的可視化內(nèi)容來調(diào)整一個(gè)或多個(gè)捕獲參數(shù),以改進(jìn)面部的捕獲。
2、在捕獲視頻饋送時(shí),感興趣的對(duì)象的數(shù)目、大小和/或位置能夠隨著時(shí)間的進(jìn)展而改變,這能夠使得所標(biāo)識(shí)的一個(gè)或多個(gè)roi集不準(zhǔn)確或者不適用。一些計(jì)算機(jī)控制的相機(jī)系統(tǒng)通過以固定間隔(例如,每200毫秒,或者一秒五次)重新運(yùn)行對(duì)象檢測算法,并且在感興趣的對(duì)象改變時(shí),調(diào)整所標(biāo)識(shí)的roi集(例如,通過添加roi、通過移除roi、通過調(diào)整幀內(nèi)roi的大小、通過調(diào)整幀內(nèi)roi的位置)來適應(yīng)這些改變。
3、本文所要求保護(hù)的主題不限于解決任何缺點(diǎn)或者僅在諸如上述環(huán)境中操作的實(shí)施例。相反,提供此背景僅以說明可以實(shí)踐本文中所描述的一些實(shí)施例的一個(gè)實(shí)例技術(shù)領(lǐng)域。
技術(shù)實(shí)現(xiàn)思路
1、在一些方面,本文描述的技術(shù)涉及用于在視頻饋送中的基于簽名的對(duì)象跟蹤的方法、系統(tǒng)和計(jì)算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計(jì)算針對(duì)第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對(duì)象相關(guān)聯(lián);基于視頻饋送的第二視頻幀的內(nèi)容,計(jì)算針對(duì)第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對(duì)象相關(guān)聯(lián);確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對(duì)象檢測。
2、在一些方面,本文描述的技術(shù)涉及用于在視頻饋送中的基于簽名的對(duì)象跟蹤的方法、系統(tǒng)和計(jì)算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計(jì)算針對(duì)第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對(duì)象相關(guān)聯(lián),第一簽名表征第一區(qū)域內(nèi)的邊緣強(qiáng)度;基于視頻饋送的第二視頻幀的內(nèi)容,計(jì)算針對(duì)第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二簽名表征第二區(qū)域內(nèi)的邊緣強(qiáng)度;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對(duì)象檢測。
3、在一些方面,本文描述的技術(shù)涉及用于視頻饋送中的基于簽名的對(duì)象跟蹤的方法、系統(tǒng)和計(jì)算機(jī)產(chǎn)品,包括:基于視頻饋送的第一視頻幀的內(nèi)容,計(jì)算針對(duì)第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對(duì)象相關(guān)聯(lián),其中計(jì)算第一簽名包括:將第一區(qū)域劃分為第一多個(gè)子區(qū)域;計(jì)算第一多個(gè)子區(qū)域簽名,每個(gè)子區(qū)域簽名與第一多個(gè)子區(qū)域的不同子區(qū)域相對(duì)應(yīng);以及聯(lián)接第一多個(gè)子區(qū)域簽名;基于視頻饋送的第二視頻幀的內(nèi)容,計(jì)算針對(duì)第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內(nèi)的第一視頻幀之后,第二區(qū)域與視頻饋送內(nèi)的所檢測的感興趣的對(duì)象相關(guān)聯(lián),其中計(jì)算第二簽名包括:將第二區(qū)域劃分為第二多個(gè)子區(qū)域;計(jì)算第二多個(gè)子區(qū)域簽名,每個(gè)子區(qū)域簽名與第二多個(gè)子區(qū)域中的不同子區(qū)域相對(duì)應(yīng);以及聯(lián)接第二多個(gè)子區(qū)域簽名;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對(duì)象檢測。
4、本
技術(shù)實(shí)現(xiàn)要素:
被提供以便以簡化形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在被用于幫助確定所要求保護(hù)的主題的范圍。
1.一種在處理系統(tǒng)處實(shí)現(xiàn)的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中計(jì)算所述第一簽名包括:
3.根據(jù)權(quán)利要求2所述的方法,針對(duì)所述多個(gè)子區(qū)域簽名的每個(gè)子區(qū)域簽名,其中計(jì)算所述多個(gè)子區(qū)域簽名包括:
4.根據(jù)權(quán)利要求3所述的方法,其中每個(gè)像素組簽名基于相對(duì)于像素的邊緣角度指示所述像素的強(qiáng)邊緣。
5.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個(gè)區(qū)域與所述所檢測的感興趣的對(duì)象的邊界框相對(duì)應(yīng)。
6.根據(jù)權(quán)利要求1至權(quán)利要求4中的任一項(xiàng)所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個(gè)區(qū)域包括超過所述所檢測的感興趣的對(duì)象的邊界框的擴(kuò)展區(qū)域。
7.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,還包括:基于在所述視頻饋送上的對(duì)象檢測未能定位感興趣的對(duì)象,觸發(fā)基于定向的對(duì)象檢測。
8.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,還包括:基于在所述視頻饋送上的對(duì)象檢測未能定位感興趣的對(duì)象,在所述視頻饋送的整個(gè)幀上生成簽名。
9.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,其中觸發(fā)對(duì)所述視頻饋送的所述基于簽名的對(duì)象檢測包括:使用人工智能模型或者機(jī)器學(xué)習(xí)模型來觸發(fā)面部檢測。
10.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的方法,還包括:在觸發(fā)在所述視頻饋送上的所述基于簽名的對(duì)象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對(duì)象檢測。
11.一種計(jì)算機(jī)系統(tǒng),包括:
12.根據(jù)權(quán)利要求11的所述的計(jì)算機(jī)系統(tǒng),其中計(jì)算所述第一簽名包括:
13.根據(jù)權(quán)利要求11或者權(quán)利要求12所述的計(jì)算機(jī)系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個(gè)區(qū)域與所述所檢測的感興趣的對(duì)象的邊界框相對(duì)應(yīng)。
14.根據(jù)權(quán)利要求11或者權(quán)利要求12所述的計(jì)算機(jī)系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個(gè)區(qū)域包括超過所述所檢測的感興趣的對(duì)象的邊界框的擴(kuò)展區(qū)域。
15.根據(jù)權(quán)利要求11至權(quán)利要求14中的任一項(xiàng)所述的計(jì)算機(jī)系統(tǒng),所述計(jì)算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對(duì)象檢測未能定位感興趣的對(duì)象,觸發(fā)基于定向的對(duì)象檢測。
16.根據(jù)權(quán)利要求11至權(quán)利要求15中的任一項(xiàng)所述的計(jì)算機(jī)系統(tǒng),所述計(jì)算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對(duì)象檢測未能定位感興趣的對(duì)象,在所述視頻饋送的整個(gè)幀上生成簽名。
17.根據(jù)權(quán)利要求11至權(quán)利要求16中的任一項(xiàng)所述的計(jì)算機(jī)系統(tǒng),其中觸發(fā)對(duì)所述視頻饋送的所述基于簽名的對(duì)象檢測包括:使用人工智能模型或者機(jī)器學(xué)習(xí)模型來觸發(fā)面部檢測。
18.一種計(jì)算機(jī)程序產(chǎn)品,包括存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令由處理系統(tǒng)可執(zhí)行以至少:
19.根據(jù)權(quán)利要求18所述的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:基于在所述視頻饋送上的對(duì)象檢測未能定位感興趣的對(duì)象,觸發(fā)基于定向的對(duì)象檢測。
20.根據(jù)權(quán)利要求18或者權(quán)利要求19所述的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:在觸發(fā)對(duì)所述視頻饋送上所述基于簽名的對(duì)象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對(duì)象檢測。