基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法、裝置及設(shè)備與流程

文檔序號：42169434發(fā)布日期：2025-06-13 16:25閱讀：13來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明屬于圖像數(shù)據(jù)傳輸，具體涉及一種基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法、裝置及設(shè)備。

背景技術(shù)：

1、在當今工業(yè)互聯(lián)網(wǎng)快速發(fā)展的時代，圖像數(shù)據(jù)在工業(yè)生產(chǎn)、監(jiān)控、檢測等眾多領(lǐng)域發(fā)揮著至關(guān)重要的作用。例如，在工業(yè)生產(chǎn)線上，通過圖像數(shù)據(jù)可以實時監(jiān)測產(chǎn)品的質(zhì)量和生產(chǎn)流程；在安防監(jiān)控中，圖像數(shù)據(jù)能夠及時捕捉異常情況并進行預(yù)警。然而，隨著圖像數(shù)據(jù)量的不斷增長以及對數(shù)據(jù)傳輸實時性要求的提高，圖像數(shù)據(jù)傳輸面臨著諸多挑戰(zhàn)。

2、傳統(tǒng)的圖像數(shù)據(jù)編解碼方法主要關(guān)注圖像的像素級重建，以像素誤差作為損失函數(shù)進行優(yōu)化。這種方法雖然能夠在一定程度上保證解碼后圖像的視覺質(zhì)量，但卻忽略了圖像數(shù)據(jù)對于下游任務(wù)的實際價值。例如，在工業(yè)缺陷檢測任務(wù)中，即使解碼后的圖像在視覺上與原始圖像非常接近，但如果沒有準確恢復(fù)出與缺陷相關(guān)的關(guān)鍵特征，那么仍然無法準確檢測出缺陷，導(dǎo)致下游任務(wù)的準確率降低。此外，傳統(tǒng)編解碼方法通常缺乏對信道條件的自適應(yīng)能力，無法根據(jù)不同的信道狀況動態(tài)調(diào)整編碼策略，從而難以在傳輸壓縮效果和抗噪能力之間取得平衡。

技術(shù)實現(xiàn)思路

1、針對傳統(tǒng)的圖像數(shù)據(jù)編解碼方法主要關(guān)注圖像的像素級重建，以像素誤差作為損失函數(shù)進行優(yōu)化，忽略了圖像數(shù)據(jù)對于下游任務(wù)的實際價值的問題，本發(fā)明提供一種基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法、裝置及設(shè)備。

2、第一方面，本發(fā)明技術(shù)方案提供一種基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法，包括如下步驟：

3、s1：收集工業(yè)互聯(lián)網(wǎng)中的圖像數(shù)據(jù)整理為數(shù)據(jù)集，對數(shù)據(jù)集中的圖像進行預(yù)處理；

4、s2：基于預(yù)處理后的圖像對編碼器模型和解碼器模型進行訓(xùn)練得到訓(xùn)練編碼器模型和解碼器模型的參數(shù)；訓(xùn)練過程包括：將預(yù)處理后的圖像輸入編碼器模型得到編碼信息，并通過?snr?噪聲信道發(fā)送到解碼器進行解碼；將解碼后的圖像輸入到下游任務(wù)計算損失函數(shù)；將計算得到的損失函數(shù)反饋給編碼器模型和解碼器模型完成最小化損失函數(shù)的模型訓(xùn)練優(yōu)化，得到模型參數(shù)；

5、s3：圖像數(shù)據(jù)傳輸時，在編碼過程中，編碼器根據(jù)訓(xùn)練得到的參數(shù)，提取關(guān)鍵圖像特征進行編碼，在解碼過程中，解碼器依據(jù)訓(xùn)練后的參數(shù)和信道?snr?信息，優(yōu)先恢復(fù)關(guān)鍵圖像特征；所述關(guān)鍵圖像特征為相關(guān)性與1的絕對差值小于設(shè)定閾值的圖像特征，所述相關(guān)性是計算的圖像特征與下游任務(wù)標簽之間的相關(guān)性。

6、作為本發(fā)明技術(shù)方案的進一步限定，步驟s2中對編碼器模型和解碼器模型進行訓(xùn)練的具體步驟包括：

7、s21：將預(yù)處理后的圖像輸入編碼器模型得到編碼信息，并通過snr噪聲信道發(fā)送出去；

8、s22：解碼器模型接收經(jīng)過噪聲信道傳輸?shù)木幋a信息，根據(jù)snr調(diào)整接收到的編碼數(shù)據(jù)，利用與編碼器模型對稱的卷積置換網(wǎng)絡(luò)進行解碼，得到解碼后的圖像；

9、s23：將解碼后的圖像輸入到下游任務(wù)計算用于反饋的損失函數(shù)；

10、s24：將計算得到的損失函數(shù)反饋給編碼器模型和解碼器模型，采用反向傳播算法計算損失函數(shù)關(guān)于模型參數(shù)的梯度，利用梯度下降法根據(jù)計算得到的梯度更新編碼器和解碼器的參數(shù)；所述模型參數(shù)包括編碼器參數(shù)和解碼器參數(shù)；

11、s25：重復(fù)步驟s21-s24，在每次訓(xùn)練時，更新信道的snr值并反饋給編編碼器和解碼器中的snr處理層，直至損失函數(shù)收斂條件，得到訓(xùn)練后的編碼器模型和解碼器模型的參數(shù)。

12、作為本發(fā)明技術(shù)方案的進一步限定，編碼器模型的結(jié)構(gòu)包括卷積層、殘差模塊和snr處理層，步驟s21具體包括：

13、圖像從輸入層開始，依次經(jīng)過卷積層、殘差模塊和snr處理層對輸入圖像數(shù)據(jù)進行處理，得到編碼信息，在編碼過程中，通過卷積層的下采樣和特征提取，以及殘差模塊和snr處理層的優(yōu)化，將原始圖像數(shù)據(jù)壓縮為設(shè)定大小的編碼信息；

14、進行snr噪聲信道模擬對編碼信息進行處理；

15、將經(jīng)過snr噪聲信道處理后的編碼信息發(fā)送到解碼器模塊。

16、作為本發(fā)明技術(shù)方案的進一步限定，依次經(jīng)過卷積層、殘差模塊和snr處理層對輸入圖像數(shù)據(jù)進行處理的步驟包括：

17、在卷積層使用卷積核在圖像上滑動進行卷積操作，提取圖像的局部特征；殘差模塊將輸入的圖像特征直接傳遞到殘差模塊的輸出端，與經(jīng)過殘差模塊內(nèi)部卷積層處理后的特征進行相加操作；將當前信道的snr值作為額外的信息輸入到snr處理層，與卷積層和殘差模塊輸出的特征進行融合。

18、作為本發(fā)明技術(shù)方案的進一步限定，進行snr噪聲信道模擬對編碼信息進行處理的步驟包括：

19、根據(jù)給定的snr值和編碼信息的功率，計算噪聲功率；其中，snr值為信號功率與噪聲功率的比值；

20、根據(jù)計算的噪聲功率，生成符合高斯分布的隨機噪聲；其中，高斯分布中，噪聲的均值為0，根據(jù)噪聲功率計算標準差；

21、將生成的噪聲添加到編碼信息上，添加噪聲后的編碼信息即為經(jīng)過snr噪聲信道處理后的編碼信息。

22、作為本發(fā)明技術(shù)方案的進一步限定，將解碼后的圖像輸入到下游任務(wù)計算用于反饋的損失函數(shù)的步驟包括：

23、s231：將解碼后的圖像輸入到下游任務(wù)，計算解碼圖像與每個任務(wù)類別之間的匹配程度；

24、s232：基于匹配程度計算識別損失；同時計算原圖像與解碼后圖像的均方誤差作為像素損失；

25、s233：將識別損失和像素損失相加，得到用于反饋的損失函數(shù)。

26、作為本發(fā)明技術(shù)方案的進一步限定，該方法還包括：

27、計算損失函數(shù)時，若存在多個下游任務(wù)，根據(jù)預(yù)設(shè)的任務(wù)重要程度的權(quán)重對各個任務(wù)的損失進行加權(quán)組合，得到用于反饋的損失函數(shù)。

28、作為本發(fā)明技術(shù)方案的進一步限定，計算的圖像特征與下游任務(wù)標簽之間的相關(guān)性的步驟包括：

29、s31：明確下游任務(wù)，并收集對應(yīng)的標簽數(shù)據(jù)；

30、s32：從工業(yè)互聯(lián)網(wǎng)的圖像數(shù)據(jù)集中提取特定的圖像特征，確保圖像特征和對應(yīng)的標簽數(shù)據(jù)一一對應(yīng)；

31、s33：對提取的圖像特征和下游任務(wù)標簽進行標準化處理，生成標簽數(shù)據(jù)集和圖像特征集；

32、s34：計算圖像特征與標簽數(shù)據(jù)之間的皮爾遜相關(guān)系數(shù)r；

33、

34、式中，和分別是數(shù)據(jù)集和內(nèi)元素的均值。

35、第二方面，本發(fā)明技術(shù)方案還提供一種基于下游任務(wù)的圖像數(shù)據(jù)傳輸編解碼裝置，包括數(shù)據(jù)預(yù)處理模塊、模型參數(shù)訓(xùn)練模塊、傳輸處理模塊，所述傳輸處理模塊包括編碼器和解碼器；

36、數(shù)據(jù)預(yù)處理模塊，用于收集工業(yè)互聯(lián)網(wǎng)中的圖像數(shù)據(jù)整理為數(shù)據(jù)集，對數(shù)據(jù)集中的圖像進行預(yù)處理；

37、模型參數(shù)訓(xùn)練模塊，用于基于預(yù)處理后的圖像對編碼器模型和解碼器模型進行訓(xùn)練得到訓(xùn)練編碼器模型和解碼器模型的參數(shù)；訓(xùn)練過程包括：將預(yù)處理后的圖像輸入編碼器模型得到編碼信息，并通過?snr?噪聲信道發(fā)送到解碼器進行解碼；將解碼后的圖像輸入到下游任務(wù)計算損失函數(shù)；將計算得到的損失函數(shù)反饋給編碼器模型和解碼器模型完成最小化損失函數(shù)的模型訓(xùn)練優(yōu)化，得到模型參數(shù)；

38、圖像數(shù)據(jù)傳輸時，在編碼過程中，編碼器根據(jù)訓(xùn)練得到的參數(shù)，提取關(guān)鍵圖像特征進行編碼，在解碼過程中，解碼器依據(jù)訓(xùn)練后的參數(shù)和信道?snr?信息，優(yōu)先恢復(fù)關(guān)鍵圖像特征；所述關(guān)鍵圖像特征為相關(guān)性與1的絕對差值小于設(shè)定閾值的圖像特征，所述相關(guān)性是計算的圖像特征與下游任務(wù)標簽之間的相關(guān)性。

39、作為本發(fā)明技術(shù)方案的進一步限定，模型參數(shù)訓(xùn)練模塊對編碼器模型和解碼器模型進行訓(xùn)練的具體步驟包括：將預(yù)處理后的圖像輸入編碼器模型得到編碼信息，并通過snr噪聲信道發(fā)送出去；解碼器模型接收經(jīng)過噪聲信道傳輸?shù)木幋a信息，根據(jù)snr調(diào)整接收到的編碼數(shù)據(jù)，利用與編碼器模型對稱的卷積置換網(wǎng)絡(luò)進行解碼，得到解碼后的圖像；將解碼后的圖像輸入到下游任務(wù)計算用于反饋的損失函數(shù)；將計算得到的損失函數(shù)反饋給編碼器模型和解碼器模型，采用反向傳播算法計算損失函數(shù)關(guān)于模型參數(shù)的梯度，利用梯度下降法根據(jù)計算得到的梯度更新編碼器和解碼器的參數(shù)；所述模型參數(shù)包括編碼器參數(shù)和解碼器參數(shù)；在每次訓(xùn)練時，更新信道的snr值并反饋給編編碼器和解碼器中的snr處理層，直至損失函數(shù)收斂條件，得到訓(xùn)練后的編碼器模型和解碼器模型的參數(shù)。

40、作為本發(fā)明技術(shù)方案的進一步限定，編碼器的結(jié)構(gòu)包括卷積層、殘差模塊和snr處理層，圖像從輸入層開始，依次經(jīng)過卷積層、殘差模塊和snr處理層對輸入圖像數(shù)據(jù)進行處理，得到編碼信息，在編碼過程中，通過卷積層的下采樣和特征提取，以及殘差模塊和snr處理層的優(yōu)化，將原始圖像數(shù)據(jù)壓縮為設(shè)定大小的編碼信息；進行snr噪聲信道模擬對編碼信息進行處理；將經(jīng)過snr噪聲信道處理后的編碼信息發(fā)送到解碼器模塊。

41、在卷積層使用卷積核在圖像上滑動進行卷積操作，提取圖像的局部特征；殘差模塊將輸入的圖像特征直接傳遞到殘差模塊的輸出端，與經(jīng)過殘差模塊內(nèi)部卷積層處理后的特征進行相加操作；將當前信道的snr值作為額外的信息輸入到snr處理層，與卷積層和殘差模塊輸出的特征進行融合。

42、作為本發(fā)明技術(shù)方案的進一步限定，該裝置還包括模擬處理模塊，用于進行snr噪聲信道模擬對編碼信息進行處理；具體用于根據(jù)給定的snr值和編碼信息的功率，計算噪聲功率；其中，snr值為信號功率與噪聲功率的比值；根據(jù)計算的噪聲功率，生成符合高斯分布的隨機噪聲；其中，高斯分布中，噪聲的均值為0，根據(jù)噪聲功率計算標準差；將生成的噪聲添加到編碼信息上，添加噪聲后的編碼信息即為經(jīng)過snr噪聲信道處理后的編碼信息。

43、作為本發(fā)明技術(shù)方案的進一步限定，模型參數(shù)訓(xùn)練模塊，具體用于將解碼后的圖像輸入到下游任務(wù)，計算解碼圖像與每個任務(wù)類別之間的匹配程度；基于匹配程度計算識別損失；同時計算原圖像與解碼后圖像的均方誤差作為像素損失；將識別損失和像素損失相加，得到用于反饋的損失函數(shù)。計算損失函數(shù)時，若存在多個下游任務(wù)，根據(jù)預(yù)設(shè)的任務(wù)重要程度的權(quán)重對各個任務(wù)的損失進行加權(quán)組合，得到用于反饋的損失函數(shù)。

44、作為本發(fā)明技術(shù)方案的進一步限定，該裝置還包括相關(guān)性計算模塊，用于計算的圖像特征與下游任務(wù)標簽之間的相關(guān)性；具體用于明確下游任務(wù)，并收集對應(yīng)的標簽數(shù)據(jù)；從工業(yè)互聯(lián)網(wǎng)的圖像數(shù)據(jù)集中提取特定的圖像特征，確保圖像特征和對應(yīng)的標簽數(shù)據(jù)一一對應(yīng)；對提取的圖像特征和下游任務(wù)標簽進行標準化處理，生成標簽數(shù)據(jù)集和圖像特征集；計算圖像特征與標簽數(shù)據(jù)之間的皮爾遜相關(guān)系數(shù)r；

45、

46、式中，和分別是數(shù)據(jù)集和內(nèi)元素的均值。

47、第三方面，本發(fā)明技術(shù)方案還提供一種電子設(shè)備，所述電子設(shè)備包括：至少一個處理器；以及與所述至少一個處理器通信連接的存儲器；存儲器存儲有可被至少一個處理器執(zhí)行的計算機程序指令，所述計算機程序指令被所述至少一個處理器執(zhí)行，以使所述至少一個處理器能夠執(zhí)行如第一方面所述的基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法。

48、本發(fā)明技術(shù)方案的有益效果是：通過將下游任務(wù)的損失函數(shù)反饋到編碼器和解碼器的訓(xùn)練過程中，使得編解碼過程能夠更加關(guān)注與下游任務(wù)相關(guān)的關(guān)鍵圖像特征。編碼器在訓(xùn)練后能夠根據(jù)下游任務(wù)的需求，準確地提取關(guān)鍵圖像特征進行編碼，舍棄那些對下游任務(wù)影響較小的冗余信息。這樣可以大大減少編碼后的數(shù)據(jù)量，提高傳輸壓縮比。在保證下游任務(wù)準確率的前提下，有效地節(jié)省了傳輸帶寬，降低了數(shù)據(jù)傳輸成本。

49、由于編碼后的數(shù)據(jù)量大幅減少，傳輸所需的時間也相應(yīng)縮短，從而加速了圖像數(shù)據(jù)的傳輸速度。在工業(yè)生產(chǎn)和監(jiān)控等對實時性要求較高的場景中，能夠及時獲取和處理圖像數(shù)據(jù)，提高生產(chǎn)效率和應(yīng)急響應(yīng)能力。本發(fā)明在訓(xùn)練過程中考慮了信道的?snr?信息，使得解碼器能夠根據(jù)不同的信道狀況，靈活地調(diào)整解碼策略，優(yōu)先恢復(fù)關(guān)鍵圖像特征。在噪聲干擾的信道環(huán)境下，能夠更好地抵抗噪聲的影響，保證解碼后圖像的質(zhì)量和下游任務(wù)的準確性。

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：許博,劉星,吳振華,齊光鵬,龐松濤,徐顏
技術(shù)所有人：浪潮云洲工業(yè)互聯(lián)網(wǎng)有限公司
我是此專利的發(fā)明人

上一篇：一種提高有絲分裂中期細胞比例的方法及其應(yīng)用與流程
下一篇：一種納米碳化鋯陶瓷粉體及其制備方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

aaa视频网站,国产最新进精品视频,国产主播一区二区,999热精品视频,а√天堂资源8在线官网在线,国产免费不卡av,麻豆国产视频

基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法、裝置及設(shè)備與流程

基于下游任務(wù)反饋的圖像數(shù)據(jù)傳輸編解碼方法、裝置及設(shè)備與流程