H.264/AVC的重要技術(shù)進(jìn)展
NGN及3G、3G演進(jìn)和NGBW發(fā)展的一個(gè)主要目標(biāo)即為包括視頻在內(nèi)的多媒體應(yīng)用。對(duì)此,H.264/AVC定義了3種視頻服務(wù)類型,即會(huì)話型服務(wù)(如可視電話、視頻會(huì)議等)、現(xiàn)場(chǎng)或先期錄制的視頻流型服務(wù)和多媒體消息類服務(wù)MMS。
為適應(yīng)NGN IP網(wǎng)絡(luò)及帶寬資源有限的時(shí)變型移動(dòng)/無(wú)線信道的傳輸需要,H.264/AVC無(wú)論從網(wǎng)絡(luò)層匹配自適應(yīng)能力、提高源壓縮編碼效率及信道抗干擾能力等方面均進(jìn)行了較精心的設(shè)計(jì),有較大幅度的性能增強(qiáng)與改進(jìn)。
1.1 視頻編譯碼結(jié)構(gòu)的分層設(shè)計(jì)
視頻編譯碼結(jié)構(gòu)從功能和算法上分為兩層設(shè)計(jì),即視頻編碼層(VCL)及網(wǎng)絡(luò)適配層(NAL)。VCL負(fù)責(zé)高效率視頻編碼壓縮;NAL負(fù)責(zé)網(wǎng)絡(luò)的適配,即提供對(duì)不同網(wǎng)絡(luò)性能匹配的自適應(yīng)處理能力,它針對(duì)下層網(wǎng)絡(luò)的特性對(duì)數(shù)據(jù)進(jìn)行封裝,包括成幀、發(fā)送相應(yīng)信號(hào)給邏輯信道、利用同步信息進(jìn)行處理等。NAL從VCL獲得數(shù)據(jù)信息,包括頭信息、段結(jié)構(gòu)信息及實(shí)際凈荷信息,進(jìn)而將它們映射到下層的各傳輸協(xié)議上。這些協(xié)議諸如H.320、H.323、H.324、MPEG-2等。NAL單元按RTP序列號(hào)順序傳送,序列號(hào)設(shè)置可發(fā)現(xiàn)丟失的是哪一個(gè)VCL單元,即使基本編碼圖像丟失,借助冗余編碼圖像,仍可獲得較“粗糙”的圖像恢復(fù)。同時(shí),借助圖像的片(Slice)、片組、宏塊(MB)結(jié)構(gòu)及黑白宏塊非掃描順序的靈活宏塊順序(FMO),安排與切換P幀(SP)、切換I幀(SI)的流切換、流拼接、隨機(jī)接入與差錯(cuò)恢復(fù)等,都有利于提高其誤碼掩蓋及抗干擾能力,并有助于壓縮效率的提高。NAL層的引入,大大提高了H.264/AVC對(duì)不同網(wǎng)絡(luò)及復(fù)雜信道的適應(yīng)能力。
1.2 高效率視頻編碼設(shè)計(jì)
1.2.1 統(tǒng)一的可變長(zhǎng)度編碼(UVLC)碼表
以往標(biāo)準(zhǔn)的熵編碼通常采用變長(zhǎng)度的哈夫曼編碼,其碼表不統(tǒng)一,不能適應(yīng)變化多端的視頻內(nèi)容,從而影響編碼效率的提高。在此,即對(duì)H.263不同系數(shù)采用不同碼表進(jìn)行VLC作了改進(jìn),采用了一個(gè)統(tǒng)一碼表的UVLC,同時(shí),又對(duì)H.26L中的VCL方法進(jìn)行了改進(jìn),使量化后的DCT變換系數(shù)使用基于內(nèi)容的自適應(yīng)可變長(zhǎng)度編碼(CAVLC),此外還定義了一種基于上下文內(nèi)容的自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC),其性能比CAVLC更好,當(dāng)然計(jì)算更復(fù)雜。從而,借助UVLC、CAVLC及CABAC較好地提高了壓縮編碼效率。
1.2.2 自適應(yīng)幀、場(chǎng)編碼(AFFC)
如眾所知,幀中鄰行空間相關(guān)性強(qiáng),場(chǎng)中鄰行時(shí)間相關(guān)性較強(qiáng),從而幀編碼可用于運(yùn)動(dòng)性較小圖像編碼,而場(chǎng)編碼可用于運(yùn)動(dòng)性較大圖像編碼。按此根據(jù)圖像運(yùn)動(dòng)狀況選擇編碼模式即構(gòu)成圖像自適應(yīng)幀、場(chǎng)編碼(PAFFC),以提高編碼效率。進(jìn)而,若一幀內(nèi)包含一些運(yùn)動(dòng)快慢不同的區(qū)域,還可將此區(qū)域劃分為“宏塊對(duì)”進(jìn)行AFFC,此時(shí)即稱為宏塊自適應(yīng)幀、場(chǎng)編碼(MBAFFC)。
1.2.3 4×4塊的整數(shù)變換
H.264/AVC中的DCT變換與H.263中的情況不同,它采用的變換單位不是8×8塊,而是4×4塊,且變換是整數(shù)操作,而不是實(shí)數(shù)操作。其優(yōu)點(diǎn)為:運(yùn)算速度快、精度高并占用較少內(nèi)存。整數(shù)操作,編譯碼有嚴(yán)格的反變換,避免了截取誤差,減少了運(yùn)動(dòng)邊緣塊的編碼噪聲。同時(shí),4×4變換比8×8變換產(chǎn)生的方塊效應(yīng)亦要小。
為進(jìn)一步利用圖像的空間相關(guān)性,在對(duì)色度分量預(yù)測(cè)殘差及16×16幀內(nèi)預(yù)測(cè)的預(yù)測(cè)殘差進(jìn)行DCT變換后,還對(duì)每個(gè)4×4變換系數(shù)塊中的DC系數(shù)組成的2×2和4×4大小的塊進(jìn)一步做哈達(dá)瑪(Hadamard)變換,以更好改善性能。
1.2.4 動(dòng)目標(biāo)估值(ME)算法的改進(jìn)
a) 搜索精度增強(qiáng):首先,進(jìn)一步增強(qiáng)了動(dòng)目標(biāo)估值的搜索精度,在半像素預(yù)測(cè)后的生成矩陣基礎(chǔ)上,內(nèi)插一次擴(kuò)展至1/4像素精度矢量,在1/4像素基礎(chǔ)上再內(nèi)插一次,獲得1/8像素更高精度的運(yùn)動(dòng)矢量。
b) 宏塊(MB)更精細(xì)與多樣化分解:對(duì)每一個(gè)MB,進(jìn)行更精細(xì)與多樣化分解,此時(shí)MB擁有和此類小塊數(shù)相對(duì)應(yīng)的運(yùn)動(dòng)矢量。這種多模式的靈活細(xì)致的分塊劃分,更切合實(shí)際動(dòng)目標(biāo)形狀,大大提高了動(dòng)目標(biāo)估值精度。
c) 多參考幀模式預(yù)測(cè):采取多參考幀模式,進(jìn)行多于一幀的先前幀(最多5幀)動(dòng)目標(biāo)估值。此時(shí)對(duì)某個(gè)MB進(jìn)行動(dòng)目標(biāo)估值時(shí),會(huì)從過(guò)去的2個(gè)或3個(gè)剛編碼過(guò)的參考幀中選一幀作參考,以改善動(dòng)目標(biāo)估值性能,提高譯碼器的誤碼恢復(fù)能力,取得更好的預(yù)測(cè)效果。
d) 變尺寸塊運(yùn)動(dòng)補(bǔ)償(MC):例如平坦區(qū)可取16×16尺寸塊,而細(xì)節(jié)區(qū)可采用8×8甚至4×4等更精細(xì)尺寸塊,此時(shí)MC預(yù)測(cè)精度更高、靈活性更好,更符合視頻內(nèi)容不斷變化的實(shí)際情況。
e) 加權(quán)預(yù)測(cè):H.264/AVC還允許對(duì)MC預(yù)測(cè)信號(hào)進(jìn)行加權(quán)預(yù)測(cè),可較大幅度改善無(wú)線信道衰落之類信道變化時(shí)的編碼效率。
f) MC時(shí)的環(huán)路去方塊濾波:H.264/AVC把去方塊濾波引入MC預(yù)測(cè)環(huán)路中,既可去除方塊效應(yīng),又能保護(hù)圖像細(xì)節(jié)邊緣,同時(shí)亦改善了圖像的主、客觀評(píng)定質(zhì)量。而且經(jīng)過(guò)濾波后的圖像根據(jù)需要放在緩存中用于幀間預(yù)測(cè),此濾波器位于譯碼環(huán)中而非譯碼環(huán)外,從而又稱環(huán)路濾波。
1.2.5 幀內(nèi)方向空間預(yù)測(cè)
由于單個(gè)圖像幀內(nèi)有較高空間冗余度,在空間域上進(jìn)行幀內(nèi)方向空間預(yù)測(cè)可獲得更高壓縮效率。對(duì)亮度預(yù)測(cè)通常取INTRA-4×4及INTRA-16×16兩種方式,對(duì)圖像中較平坦部分采用INTRA-16×16方式,對(duì)細(xì)化圖像部分用INTRA-4×4塊預(yù)測(cè)。預(yù)測(cè)前,應(yīng)對(duì)當(dāng)前塊相鄰的左、上重構(gòu)塊進(jìn)行分類,根據(jù)不同分類,選擇不同預(yù)測(cè)模式。INTRA-4×4共有9種預(yù)測(cè)模式,INTRA-16×16共有4種預(yù)測(cè)模式,對(duì)色度預(yù)測(cè)按INTRA-8×8塊進(jìn)行,亦共有4種預(yù)測(cè)模式。從而,精細(xì)的幀內(nèi)方向空間預(yù)測(cè)可有效提高預(yù)測(cè)質(zhì)量。
這樣,H.264/AVC的精細(xì)數(shù)字壓縮編碼技術(shù)取得了優(yōu)良的壓縮效率。測(cè)試結(jié)果表明:它比H.263++的平均編碼比特率要少48.80%,比MPEG-4 ASP要少38.62%,相對(duì)H.263約提高了一倍壓縮效率,很具吸引力。