專利名稱:一種低碼率下視覺關注區(qū)域的視頻編碼方法
技術領域:
本發(fā)明涉及視頻編碼領域,具體涉及一種低碼率下基于H.264的視覺關注區(qū)域的視頻編碼方法。
背景技術:
在碼率充足的情況下,視頻各幀各個部分的質量都能夠得以保證;然而,在碼率非常有限的情況下,如手機視頻通信等,編碼時如果仍依照圖像內(nèi)容進行統(tǒng)計并平等對待,視頻整體的質量會因碼率低而急劇下降。生理和心理研究表明:人類總是主動地特別關注于某些特定的、能夠產(chǎn)生新異刺激的區(qū)域。因此,在這種情況下有必要對人眼視覺重點關注區(qū)域分配相對多的碼率,保證該區(qū)域的質量,從而提高人對視頻的主觀評價。1998年Itti等提出了自底向上的視覺顯著性注意檢測模型。該模型首先通過線性濾波將輸入圖像分解成多個多尺度的低級視覺特征(灰度、顏色、方向)通道;對于每個特征空間通道,利用中央刺激-周圍抑制策略(中心-周圍尺度差分)計算視覺感受野,并應用一種非線性空間競爭機制將不同尺度信息進行合并得到特征顯著圖;接著,通過使用預設的權值對各特征顯著圖進行線性合并得到一張顯著圖;最后,神經(jīng)網(wǎng)絡的贏者全勝和抑制返回機制相互作用,并按照顯著級別從高到低產(chǎn)生人們的注意焦點。其后,該模型進一步得到完善,中國專利第CN102164281A號提出一種基于Itti視覺顯著度模型的視頻編碼碼率控制方法,考慮了運動特征在視頻內(nèi)容感知中的重要作用。然而,該模型是基于像素點顯著值的統(tǒng)計,實現(xiàn)視覺關注區(qū)域的檢測過程異常復雜,無法實際應用到實時的編碼環(huán)境中。在碼率有限的情況下,如何在特定的碼率和失真度之間進行取舍,有賴于率失真優(yōu)化(RDO)技術的應用。在H.264標準中,RDO大大提高了編碼的壓縮效率。而RDO中失真的衡量是使用絕對誤差和(SAD)、頻域絕對誤差和(SATD)或平方誤差和(SSD)等函數(shù),這些測度由來已久并成為了傳統(tǒng),但由于只對圖像塊中單個像素進行統(tǒng)計而忽略了像素間的聯(lián)系,不能很好地適應人眼視覺系統(tǒng)的特點。結構相似度(SSIM)準則是基于人眼在觀察圖像時對結構信息的變化更敏感的視覺特點而提出的一種圖像質量評價方法,與其它準則相t匕,它更加符合人眼的視覺特點,并已引入至H.264各開源編碼器中作為評價編碼視頻質量的標準。已經(jīng)有學者開展了基于SSIM的感知率失真優(yōu)化編碼的研究,研究結果顯示在RDO中采用SSIM代替原有的失真度量函數(shù)能實現(xiàn)更有效的視頻壓縮。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種低碼率下視覺關注區(qū)域的視頻編碼方法,該方法在低碼率下能檢測出視頻內(nèi)容中的視覺關注區(qū)域并保證其視覺質量,可以實現(xiàn)快速的、準確的碼率分配優(yōu)化,解決了現(xiàn)有技術實現(xiàn)視覺關注區(qū)域的檢測過程異常復雜,無法實際應用到實時的編碼環(huán)境中的問題。為實現(xiàn)上述發(fā)明目的,本發(fā)明采用如下技術方案:一種低碼率下視覺關注區(qū)域的視頻編碼方法,包含以下幾個步驟:
S1、讀取當前編碼幀,判斷當前編碼幀類別,確定當前編碼幀視覺關注區(qū)域;S2、確定當前編碼幀所有宏塊的量化參數(shù)調整等級;S3、確定當前編碼幀所有宏塊的視覺關注度權值;S4、采用結構相似度SSIM作為宏塊預測模式選擇時RDO失真衡量標準;S5、根據(jù)視覺關注度權值確定新的RDO代價計算公式;S6、確定新的RDO代價計算公式中的經(jīng)驗值;S7、根據(jù)新的RDO代價計算公式計算每種預測模式下的RDO代價;S8、根據(jù)宏塊等級重新分配每個宏塊的編碼量化參數(shù);S9、根據(jù)重新分配的量化參數(shù)編碼當前編碼幀的每個宏塊;重復步驟SI到S9,直到編碼結束。優(yōu)選的,所述的步驟SI中,如果當前編碼幀是I幀,則通過Canny邊緣檢測算法檢測視覺關注區(qū)域,并統(tǒng)計該幀的邊緣點總數(shù);如果當前編碼幀是P幀或B幀,則根據(jù)運動矢量特征分布得到視覺關注區(qū)域,對所有宏塊進行運動估計,得到宏塊運動矢量,如果宏塊運動矢量為(X,I),則其強度為再計算宏塊運動矢量強度均值以及方差,并統(tǒng)計該幀所有運動矢量強度方差之和。優(yōu)選的,所述的步驟S2中,如果當前編碼幀是I幀,根據(jù)宏塊包含的邊緣像素點個數(shù)對宏塊進行分級;如果當前編碼幀是P幀或B幀,根據(jù)宏塊運動矢量強度與所在幀運動矢量強度均值的關系判定該宏塊的量化參數(shù)等級。優(yōu)選的,所述的步驟S3中,對于I幀中的宏塊,視覺關注度權值等于該宏塊包含邊緣像素點占整幀邊緣像素點的比例;對于P幀和B幀的宏塊,視覺關注度權值等于該宏塊運動矢量強度方差和該幀所有宏塊的運動矢量強度方差總和之比。優(yōu)選的,所述的步驟S4中,在采用結構相似度SSIM作為失真準則進行宏塊預測模式選擇時,假設原圖像為X,重建圖像為y,則X和I的結構相似度SSIM可表示為:SSIM(x,y) = I (X,y).c (X, y).s (X, y)其中 I (x, y)、c (x, y)、s (x, y)分別表示兩圖像的亮度相關性、對比度相關性以及結構相關性。優(yōu)選的,所述的步驟S5中,新的RDO代價計算公式為:Jcmsst =K.Dssim.( a +w) + λ SSIM.Rmb ;其中Rmb為碼率大小;λ SSIM為率失真平衡參數(shù),取值與x264原有SSD失真標準下的相同;DSSIM為失真度,取值范圍為
;w為視覺關注度權值;1(和α為經(jīng)驗值;w的大小直接影響失真度在RDO代價中所占的比重,從而對視覺關注區(qū)域的宏塊在率失真優(yōu)化階段優(yōu)先考慮視覺失真度,保證宏塊的視覺質量。優(yōu)選的,所述的步驟S6中,確定經(jīng)驗值α為0.01,并確定經(jīng)驗值K為:1幀中非精細化RDO以及16x16分塊下精細化RDO的K值為300000,4x4分塊下精細化RDO的K值為5000 ;對于P幀和B幀非精細化RD0,統(tǒng)計幀中運動矢量強度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例,若比例大于60%則K值設為300000,否則K值設為100000 ;精細化RDO下K值設為30000。優(yōu)選的,所述的步驟S8中,量化參數(shù)的調整根據(jù)宏塊級別得到,重新分配的量化參數(shù)隨著宏塊等級的遞增而線性遞減,對I幀宏塊降低其量化參數(shù),而對P幀或B幀宏塊則提高其量化參數(shù),以使視頻序列的碼率分配趨于均衡。本發(fā)明的原理為:對于視頻的內(nèi)容,在空域上,物體邊緣對人眼的視覺感知起著重要的作用,而在時域上,一個區(qū)域的運動屬性相對于其周圍區(qū)域運動具有顯著變化會能引起人眼的重點關注。因此,在使用H.264標準進行視頻編碼時,可利用其本身基于宏塊的分析機制實現(xiàn)快速的人眼視覺關注區(qū)域的檢測。本發(fā)明提出通過邊緣檢測算法識別視頻I幀中的視覺關注區(qū)域,邊緣檢測的目的是提取圖像中亮度變化明顯的區(qū)域。實現(xiàn)邊緣檢測的方法有許多種,目前最常用的是Canny邊緣檢測算法,該算法可以很好地降低圖像中的噪聲,同時較為準確地確定圖像邊緣的位置;而對于視頻時域的運動顯著特征捕捉,目前已存在多種相關的視頻圖像運動檢測算法包括幀間差分法、背景差分法、光流法等,以上運動檢測方式均在實際應用中取得過一定效果,但卻都是基于像素的分析,復雜度較高。本發(fā)明中將利用H.264中原有的幀間編碼運動矢量分析機制,提出一種運動顯著特征模型檢測P/B幀中的視覺關注區(qū)域,對視覺關注區(qū)域重點編碼;為保證視覺關注區(qū)域失真度衡量優(yōu)先,本發(fā)明將建立基于視覺關注度權值與SSIM的RDO代價函數(shù),可以進一步提高視覺關注區(qū)域的圖像質量。本發(fā)明以實際應用為出發(fā)點,針對低帶寬網(wǎng)絡環(huán)境下的移動視頻應用而提出,并在x264 (版本為0.76.X)編碼器上驗證了本方法的有效性。本發(fā)明應用于低碼率情況下的視頻編碼系統(tǒng)中。區(qū)別于傳統(tǒng)的編碼方法,本發(fā)明能夠在碼率非常有限的情況下,智能地識別出人視覺關注的區(qū)域并調整宏塊的碼率分配,進而結合結構相似度重新構造了與視覺關注區(qū)域權重相關的率失真模型,實現(xiàn)快速的、更符合人眼視覺特征的視頻編碼。與現(xiàn)有技術相比,本發(fā)明具有如下有益效果及主要優(yōu)點:1、邊緣檢測技術的應用有利于幀內(nèi)編碼實現(xiàn)符合人眼視覺特征的碼率分配。2、基于塊的運動矢量特征檢測模型的建立有利于幀間編碼實現(xiàn)符合人眼視覺特征的碼率分配。3、基于塊的運動矢量特征檢測模型嵌入在編碼過程,不需要任何離線操作,能夠對視頻序列進行實時運動檢測。4、能夠應用于各種基于H.264標準的視頻編碼系統(tǒng)中,可移植性強。
圖1是基于H.264的視覺關注區(qū)域編碼方法框圖;圖2是基于視覺關注區(qū)域的編碼方法流程圖;圖3是基于視覺關注度權值和SSM的RDO流程圖。
具體實施例方式下面結合實施例及附圖對本發(fā)明作進一步詳細的描述,但本發(fā)明的實施方式不限于此。實施例根據(jù)H.264編碼流程,基于本發(fā)明的編碼方法流程圖如圖1所示。該方法利用Canny邊緣檢測技術檢測出I幀中包含重要邊緣信息的宏塊,依據(jù)各宏塊包含邊緣信息的多少調整編碼量化參數(shù),實現(xiàn)幀內(nèi)編碼比特率的合理分配;對于P幀和B幀,建立了基于宏塊級的運動特征檢測模型,該模型根據(jù)宏塊的運動矢量與所在幀的平均運動矢量的方差分布調整編碼量化參數(shù),實現(xiàn)幀間編碼比特率的合理分配;并在率失真優(yōu)化技術的基礎上,建立基于結構相似度的與視覺關注區(qū)域權重相關的率失真優(yōu)化函數(shù)。
本發(fā)明提供的編碼方法主要應用于解決低碼率下基于H.264的視頻編碼系統(tǒng)中的碼率分配的快速優(yōu)化,實現(xiàn)在碼率有限情況下人眼對視頻視覺感知的更佳效果。如圖1、2及3所示,具體實施方法按以下三方面的具體步驟完成:一、基于邊緣檢測算法的I幀視覺關注區(qū)域檢測在本發(fā)明中,由于I幀采用幀內(nèi)模式編碼,對視頻圖像的細節(jié)如紋理、邊緣能更好地保存,因而邊緣檢測算法將主要應用于I幀,包含較多邊緣點的宏塊可以認為是I幀的視覺關注區(qū)域,再根據(jù)宏塊包含的邊緣點所占幀邊緣點比例大小分配I幀率失真優(yōu)化權值以及量化參數(shù)調整等級,進而達到動態(tài)調整每個宏塊碼率大小的目的。其主要流程原理如下:①在編碼I幀之前,應用Canny邊緣檢測算法檢測視覺關注區(qū)域,并統(tǒng)計該幀的邊緣點總數(shù);②對于每個16x16宏塊,根據(jù)宏塊包含的邊緣像素點個數(shù)對宏塊進行分級,邊緣像素點越多,宏塊級別越高,在稍后的編碼中將會分配更低的量化參數(shù)以提高宏塊編碼質量;③根據(jù)宏塊包含邊緣像素點占整幀邊緣像素點的比例計算出每個宏塊用于率失真優(yōu)化的視覺關注度權值w ;④根據(jù)宏塊等級重新分配量化參數(shù),重新分配的量化參數(shù)隨著宏塊等級的遞增而線性遞減;⑤根據(jù)重新分配的量化參數(shù)編碼I幀的每個宏塊。本實施例中,采用邊緣檢測算法對I幀視覺關注區(qū)域進行檢測時,具體步驟如下:①初始化結構空間和變量;②讀取一巾貞為當前巾貞curFrame,判斷當前巾貞curFrame是否是I巾貞,如果是I巾貞,將I幀Y分量數(shù)據(jù)拷貝進臨時結構空間;③對I幀Y分量進行Canny邊緣檢測算法檢測邊緣;④對于每個16x16宏塊,根據(jù)邊緣像素點的個數(shù)m分配量化參數(shù)等級level:a)若m為0,則level為O ;否貝丨J,轉b);b)若m小于8,則level為I ;否則,轉c);c)若m小于24,則level為2 ;否則,轉d);d)若m小于56,則level為3 ;否則,轉e);e)若m大于或等于56,貝丨J level為4 ;結束level賦值。⑤統(tǒng)計該巾貞所有邊緣像素點的個數(shù)s,對于每個16x16宏塊,根據(jù)邊緣像素點占該幀幀邊緣像素點的比例,確定該宏塊用于率失真優(yōu)化的視覺關注度權值w=m/s ;⑥對當前幀curFrame進行編碼,在編碼宏塊過程中,根據(jù)宏塊的量化參數(shù)等級level,對該宏塊進行編碼量化參數(shù)調整,具體如下:如果level為O級,則量化參數(shù)qp減少O ;如果level為I級,則量化參數(shù)qp減少I ;如果level為2級,則量化參數(shù)qp減少2 ;如果level為3級,則量化參數(shù)qp減少3 ;如果level為4級,則量化參數(shù)qp減少4 ;
⑦使用調整后的量化參數(shù)對當前巾貞curFrame進行編碼,直至當前巾貞curFrame所有宏塊編碼完成;⑧若當前巾貞curFrame不是最后一巾貞,跳至第②步;否則編碼結束。二、基于運動矢量特征的P幀和B幀視覺關注區(qū)域檢測在視頻序列中,物體的運動特征越突出越容易吸引人眼的關注。P幀和B幀中運動物體所占據(jù)的宏塊一般具備較大的運動矢量強度,通過分析宏塊的矢量強度與幀整體的運動趨勢之間的關系,就可判定宏塊的運動特征是否突出,將運動特征突出的宏塊作為視覺關注區(qū)域進行重點編碼,其他宏塊則相對降低編碼質量,以達到P幀和B幀碼率均衡分配的效果。對于在P幀和B幀中檢測到的視覺關注區(qū)域,將根據(jù)其運動矢量強度方差分配率失真優(yōu)化權值,并根據(jù)運動矢量強度均值分配量化參數(shù)調整等級,以此達到動態(tài)調整宏塊碼率分配的目的。其主要流程原理如下:①對于P幀或B幀中采用幀間編碼模式的宏塊,本發(fā)明先對所有宏塊進行運動估計,得到所有宏塊的運動矢量,再計算其強度;②計算整幀所有宏塊的運動矢量強度均值以及每個宏塊的運動矢量強度的方差;③根據(jù)運動矢量強度方差和該幀所有宏塊的運動矢量強度方差總和之比確定每個宏塊用于率失真優(yōu)化的視覺關注度權值w ;④根據(jù)宏塊運動矢量強度與所在幀運動矢量強度均值的關系對宏塊進行分級,運動矢量強度越大等級越高;⑤根據(jù)宏塊等級重新分配量化參數(shù),重新分配的量化參數(shù)隨著宏塊等級的遞增而線性遞減;⑥根據(jù)重新分配的量化參數(shù)編碼P幀或B幀的每個宏塊。在本實施例中,基于運動矢量特征對P幀和B幀視覺關注區(qū)域檢測,具體包括以下步驟:①初始化用于運動矢量強度計算結構體和變量;②如果當前巾貞curFrame是P巾貞,遍歷巾貞中所有宏塊進行運動估計后提取運動矢量(X,y),將運動矢量轉化為強度,強度intensity=sqrt (x*x+y*y);③為所有宏塊運動矢量強度求和,計算強度平均值avg_intenSity,再根據(jù)均值確定每個宏塊運動矢量強度的方差Oi,并統(tǒng)計所有宏塊強度方差的總和Σ oi;④確定每個宏塊用于率失真優(yōu)化的視覺關注度權值Wi= σ y Σ Qi⑤根據(jù)強度均值avg_intensity確定每個宏塊量化參數(shù)等級level:a)如果宏塊運動矢量強度為0,則level為O ;否則,轉b);b)如果宏塊運動矢量強度小于或等于avg_intensity*0.5,則level為I ;否則,轉c);c)如果宏塊運動矢量強度小于或等于avg_intensity,則level為2 ;否則,轉d);d)如果宏塊運動矢量強度小于或等于avg_intensity*2,則level為3 ;否則,轉e);e)如果宏塊運動矢量強度大于avg_intensity*2,則level為4 ;level賦值結束。⑥對宏塊進行編碼時,根據(jù)宏塊的量化參數(shù)等級level對該宏塊的量化參數(shù)進行調整,具體如下:如果level為O級,則量化參數(shù)qp增加4 ;如果level為I級,則量化參數(shù)qp增加3 ;如果level為2級,則量化參數(shù)qp增加2 ;如果level為3級,則量化參數(shù)qp增加I ;如果level為4級,則量化參數(shù)qp增加O ;⑦使用調整后的量化參數(shù)對當前巾貞curFrame進行編碼,直至當前巾貞curFrame所有宏塊編碼完成;⑧若當前巾貞curFrame不是最后一巾貞,跳至第②步;否則編碼結束。三、基于視覺關注度權值以及SSM的RDO改進實施方案本發(fā)明中采用了結構相似度(SSIM)作為了 RDO失真衡量標準,取代原x264編碼器中使用的SSD標準,以使編碼模式的選擇更為準確,同時結合前述I和2中提到的視覺關注度權值w的計算,得到本發(fā)明使用的率失真優(yōu)化公式:Jcost — K.Dssim.( ct +w) + λ SSIM.Rmb (I)(I)式中Rmb為碼率大?。籜ssim為率失真平衡參數(shù),本發(fā)明中它的取值與χ264原有SSD失真標準下的相同;DSSIM為失真度,這里表示為1-SSM,SSM取值范圍是
。假設原圖像為X,重建圖像為y,則X和I的結構相似度SSIM可表示為:SSIM (X, y) = I (x, y).c(x, y).s (x, y) (2)(2)式中,I(x, y)、c(x, y)、s(x, y)分別表示兩圖像的亮度相關性、對比度相關性以及結構相關性。(具體見Wang Zhou, Bovik AC等人著的A universal image qualityindex 一文)。(I)式中K和α是經(jīng)驗值,通過大量的實驗表明,給I幀和P幀、B幀分配不同的K值可以得到較好的率失真優(yōu)化效果。本發(fā)明中設置α為0.01,對于K的設置如下:①I幀中非精細化RDO以及16x16分塊下精細化RDO的K值為300000,4x4分塊下精細化RDO的K值為5000 ;②對于P幀和B幀非精細化RD0,統(tǒng)計幀中運動矢量強度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例,若比例大于60%則K值設為300000,否則K值設為100000 ;精細化RDO下K值設為30000。在本實施例中,改進后的χ264基于視覺關注度權值和SSM的RDO可分為以下步驟:①使用SSM計算函數(shù)替換χ264編碼器Ι、Ρ、Β通用RDO函數(shù)x264_rd_cost_mb、I中貞4x4分塊下精細化RDO函數(shù)264_rd_cost_i4x4以及P巾貞精細化RDO函數(shù)x264_rd_cost_part>x264_rd_cost_subpart中原有的SSD計算函數(shù),I巾貞8x8分塊下精細化RDO函數(shù)由于未啟用而不替換,SSIM的計算由公式(2)得到;②在第一輪RDO中,確定宏塊的最佳分塊模式,此階段的RDO函數(shù)是1、P、B幀通用RDO函數(shù)。根據(jù)公式(I ),如果當前編碼幀是I幀,則經(jīng)驗值K設為300000,如果是P或B幀,則根據(jù)當前編碼幀中運動矢量不為O的比例分配K值,如果該比例大于60%,則設置K值為300000,否則設為100000 ;③在精細化RDO中,對最佳分塊模式下各種預測模式進行率失真代價計算,以確定最佳預測模式。此階段I幀16x16分塊下精細化RDO函數(shù)的K值設為300000,4x4分塊下精細化RDO函數(shù)K值設為5000,P幀和B幀精細化RDO函數(shù)K值設為30000 ;④根據(jù)公式(1),在1、P、B幀通用RDO函數(shù)以及各精細化RDO函數(shù)中加入每個宏塊的視覺關注度權值的影響,即K* (1-SSIM) * ( a +w),經(jīng)驗值α設為0.01,w為每個宏塊視覺關注度權值;⑤公式(I)中λ SSIM.Rmb的計算按照x264原有計算完成,接著各RDO函數(shù)返回公式(I)計算的結果,即RDO代價Jkbt用于幀內(nèi)預測或幀間預測模式的選擇。表I本方法定義的主要數(shù)據(jù)結構和變量
權利要求
1.一種低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,包含以下幾個步驟: 51、讀取當前編碼幀,判斷當前編碼幀類別,確定當前編碼幀視覺關注區(qū)域; 52、確定當前編碼幀所有宏塊的量化參數(shù)調整等級; 53、確定當前編碼幀所有宏塊的視覺關注度權值; 54、采用結構相似度SSIM作為宏塊預測模式選擇時RDO失真衡量標準; 55、根據(jù)視覺關注度權值確定新的RDO代價計算公式; 56、確定新的RDO代價計算公式中的經(jīng)驗值; 57、根據(jù)新的RDO代價計算公式計算每種預測模式下的RDO代價; 58、根據(jù)宏塊等級重新分配每個宏塊的編碼量化參數(shù); 59、根據(jù)重新分配 的量化參數(shù)編碼當前編碼幀的每個宏塊; 重復步驟SI到S9,直到編碼結束。
2.根據(jù)權利要求1所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟SI中,如果當前編碼幀是I幀,則通過Canny邊緣檢測算法檢測視覺關注區(qū)域,并統(tǒng)計該幀的邊緣點總數(shù);如果當前編碼幀是P幀或B幀,則根據(jù)運動矢量特征分布得到視覺關注區(qū)域,對所有宏塊進行運動估計,得到宏塊運動矢量,如果宏塊運動矢量為(x,y),則其強度為再計算宏塊運動矢量強度均值以及方差,并統(tǒng)計該幀所有運動矢量強度方差之和。
3.根據(jù)權利要求1所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S2中,如果當前編碼幀是I幀,根據(jù)宏塊包含的邊緣像素點個數(shù)對宏塊進行分級;如果當前編碼幀是P幀或B幀,根據(jù)宏塊運動矢量強度與所在幀運動矢量強度均值的關系判定該宏塊的量化參數(shù)等級。
4.根據(jù)權利要求1所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S3中,對于I幀中的宏塊,視覺關注度權值等于該宏塊包含邊緣像素點占整幀邊緣像素點的比例;對于P幀和B幀的宏塊,視覺關注度權值等于該宏塊運動矢量強度方差和該幀所有宏塊的運動矢量強度方差總和之比。
5.根據(jù)權利要求1所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S4中,在采用結構相似度SSIM作為失真準則進行宏塊預測模式選擇時,假設原圖像為X,重建圖像為y,則X和y的結構相似度SSIM可表示為:SSIM(x,y) = I (x, y).c(x,y) *s(x,y),其中I (x, y)、c(x, y)、s(x, y)分別表示兩圖像的亮度相關性、對比度相關性以及結構相關性。
6.根據(jù)權利要求1或5所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S5中,新的RDO代價計算公式為-Jcost = K.Dssim.( a +w) + λ SSIM.Rmb ;其中Rmb為碼率大??;λ ssiM為率失真平衡參數(shù),取值與x264原有SSD失真標準下的相同;Dssim為失真度,取值范圍為
;w為視覺關注度權值;K和α為經(jīng)驗值。
7.根據(jù)權利要求6所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S6中,確定經(jīng)驗值α為0.01,并確定經(jīng)驗值K為:1幀中非精細化RDO以及16x16分塊下精細化RDO的K值為300000,4x4分塊下精細化RDO的K值為5000 ;對于P幀和B幀非精細化RD0,統(tǒng)計幀中運動矢量強度不為O的宏塊數(shù)占幀宏塊總數(shù)的比例,若比例大于60%則K值設為300000,否則K值設為100000 ;精細化RDO下K值設為30000。
8.根據(jù)權利要求6所述的低碼率下視覺關注區(qū)域的視頻編碼方法,其特征在于,所述的步驟S8中,量化參數(shù)的調整根據(jù)宏塊級別得到,重新分配的量化參數(shù)隨著宏塊等級的遞增而線性遞減,對 I幀宏塊降低其量化參數(shù),而對P幀或B幀宏塊則提高其量化參數(shù)。
全文摘要
本發(fā)明為一種低碼率下基于H.264的視覺關注區(qū)域的視頻編碼方法,包括步驟判斷當前編碼幀類別,確定視覺關注區(qū)域、當前編碼幀所有宏塊的量化參數(shù)調整等級、當前編碼幀所有宏塊的視覺關注度權值;采用結構相似度SSIM作為失真準則進行宏塊預測模式選擇時RDO失真衡量標準;根據(jù)視覺關注度權值確定新的RDO代價計算公式;確定新的RDO代價計算公式中的經(jīng)驗值;根據(jù)新的RDO代價計算公式計算每種預測模式下的RDO代價;根據(jù)宏塊等級重新分配每個宏塊的編碼量化參數(shù);根據(jù)重新分配的量化參數(shù)編碼當前編碼幀的每個宏塊;重復上述步驟直到編碼結束。本發(fā)明可在碼率非常有限的情況下優(yōu)化碼率分配,實現(xiàn)更符合人眼視覺特征的視頻編碼。
文檔編號H04N7/26GK103079063SQ20121055741
公開日2013年5月1日 申請日期2012年12月19日 優(yōu)先權日2012年12月19日
發(fā)明者張星明, 林育蓓, 張吉, 陳銘洙 申請人:華南理工大學