2017年2月22日 星期三

x264 - 高品質 H.264 編碼器

 這個月有點懶就轉載一個我認為滿實用的文章
 原文:
https://www.mobile01.com/topicdetail.php?f=510&t=3735840


H.264 / MPEG-4 AVC 是優秀的視訊編碼格式
就目前已成熟的視訊編碼格式而言,H.264的壓縮率是最佳的。
壓縮率極高,可以只用很低 bitrate 提供堪用畫質。

而 x264 為免費開放原始碼的 H.264 / MPEG-4 AVC 編碼器,
是目前編碼效率最高的開放原始碼 H.264 編碼器。

此文只是基礎知識,說明只是大略而已。

H.264: Wiki
x264: 官網Wiki


H.264 Frame


影片是由許多連續的 Frames 所組成,但並不是所有 Frames 都是完整的畫面,那些 Frames 需要參考其他 Frames 才能解碼出一張完整的畫面。

H.264 的 Frame types 有 I、B、P 三種。

I-frame:
不需要參考其他 Frames,是一張完整的畫面。

I-frame (IDR):
不需要參考其他 Frames,是一張完整的畫面。
IDR frame 為真正的 關鍵畫格 (keyframes),
P-frame & B-frame 不會越過 IDR frame 去參考其他 Frames,
所以可以隨意跳轉到任意 IDR frame 開始播放/解碼,而不會發生問題。

P-frame:
只紀錄了與之前的 Frames 相異的區塊,最多可以參考 "16 張" 之前的 Frames
播放/解碼時需要參用到之前的 Frames 的部分資料,才能解碼出完整畫面。
在 x264 中,你不能控制 P-frame 數量,但你可以控制一個 P-frame 所能參考的 Frame 數量,
也就是 Reference frame (ref) 的數值。

B-frame:
只紀錄了與前一張與後一張的 Frames 相異的區塊,壓縮率高(由其是在低動態/低變化的影片),
播放/解碼時需要用到前後兩張的 Frames 的部分資料,才能解碼出完整畫面。


從此圖你可以發見 B-Frame 有用到前一張與後一張 Frame 的資料。

播放 Farme 的順序是依照 Frame 的時間點,但解碼順序則不一定,
當 B-Frame 有用到後一張 Frame 的資料時,就必須預先解碼後一張 Frame。
以上圖為例
解碼(處理)順序: 1-2-4-3
顯示(播放)順序: 1-2-3-4

由於 P-/B-frame 不是完整的畫面,解碼時必須參考其他 Frames,
所以你不能隨意跳轉到 P-/B-frame 上播放/解碼。
也就是說你如果播放 MPEG 視訊格式,當你跳播放時間點時,
正常而言,並不會跳到你所選的時間點上,而是最近的 IDR / I-frame。


就壓縮率而言...
由於 P-/B-frame 並不是完整的畫面,所以占用的資料量較少,
提高這類 Frame 使用量可以有效提升壓縮率,但對畫質幾乎不會降低,
這代表可以使用較少的 bitrate (位元率)達到維持一定畫質。

由以上得知,在 bitrate 充足的情況下,則不需要使用較多 B-frame、Reference frame (ref) ,
多少 bitrate 為充足依影片內容為定,高動態影片需要較多 bitrate,低動則較少。

至於使用時機...
提高 B-frame/ref 使用量可以降低 bitrate 的需求,使用較少 bitrate 達到目標品質。
低動態的影片可以使用較多的 B-frame,高動態或是純靜態則是 P-frame 效果較好。

對於相容性與硬體負擔...
提高 B-frame/ref 使用量的副作用是降相容性以及提高硬體負擔,請先保證相容性再來追求壓縮率。
而 ref 的副作用要比 B-frame 強,例如 ref=16 這代表解碼一個 P-frame 必須要連跳回 1~16 張之前的 Frames 取用資料。


x264 參數設定

Maximun B-frame:
當設定 B-frame 時,重複部分比較多/變化較少的 Frames 會被編碼為 B-frame
此值限制 B-frame 的最大連續數量。

Reference frame (ref):
設定一個 P-frame 所能參考的 Frames 數量。
ref 會影響播放相容性,請參考下文 H.264 Level 部分

推薦設定
‧Reference frame (ref): 3 - 5
‧Maximun B-frame: 3 - 6

GOP 長度:
一個 keyframe (IDR frame) 到下一個 keyframe 的範圍。
所以將 GOP 設為無限大雖然可以大幅增加壓縮率,但這樣就不能隨意跳轉到其他時間點播放/解碼。
建議維持 default 即可。


H.264 Profile (x264)


Profile 越高 壓縮率 也越高,但編碼複雜度也越高,對播放硬體性能要求較高

x264 支援輸出的 H.264 Profile:
baseline, main, high, high10, high422, high444

沒有特殊需求使用 High Profile 即可。

無法直接指定輸出 Profile 的話,可以手動設定參數值。

H.264 Profile 對應的參數

ps. 空欄位代表無限制
完整表格(Wiki,下拉至 Profiles 底部)


參數說明:

bframes (Number of B-frames):
設定 I-frame P-frame 之間連續 B-frames 的最大數量。

cqm (custom quantization matrices):
設定所有自訂量化矩陣(custom quantization matrices)為內建的預設之一。內建預設有 flat 和 JVT。

weightp (explicit weighted prediction):
使 x264 能夠使用明確加權預測(explicit weighted prediction)來改善 P-frame 的壓縮率。亦改善淡入/淡出的品質。模式越高越慢。

8x8dct (Adaptive 8x8 DCT):
彈性 8x8 離散餘弦轉換(DCT)使x264能夠彈性使用 I-frame 的 8x8 轉換。

cabac (CABAC: Context Adaptive Binary Arithmetic Coder):
彈性內容的二進位算數編碼資料流壓縮,禁用 CABAC 會切換回效率較低的彈性內容的可變長度編碼(CAVLC:Context Adaptive Variable Length Coder)系統。大幅降低壓縮效率(通常10~20%)和解碼的硬體需求。

interlaced:
支援編碼輸出 interlaced 的視訊。


x264 preset


Preset 是一個選項集合,這設定一編碼速度來決定壓縮比。速度越慢則會得到更好的壓縮編碼效率 (畫質-位元率比 或 畫質-檔案大小比)。也就是說,若你設定一個目標位元率或是檔案大小,則越慢的 Preset 將會得到更好的輸出品質。而對於設定一個恆定品質 (CRF) 或是恆定量化值 (QP),你可以透過選擇更慢的 Preset 來簡單的節省位元率 (也就是得到更小的檔案大小)。

一般而言是使用你所能忍受的最慢 Preset。目前 Presets 依速度遞減排序是: ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow, placebo。該預設 Preset 是 medium。忽略 placebo 因為它會比 veryslow 浪費更多時間而且效果差異太小。

而越慢的 Preset 其 Reference frame (ref) 值也越高,例如 veryslow preset 的 ref 為 16。由於通常不需這麼高的 ref,你可以透過指定一個 Level 來限制 ref,或是手動指定一個合理的 ref 值 (1 ~ 6)。


x264 tune


針對特定類型的影片微調參數設定值,以獲得更好的品質或壓縮率。

Film (電影): 膠片電影。
Animation (動畫): 例如卡通/日本動畫。
Grain (膠片顆粒): 顆粒感很重的影片。
Still Image (靜止影像): 例如幻燈片效果的影片。
PSNR: 優化 PSNR 值。 Wiki
SSIM: 優化 SSIM 值。 Wiki
Fast Decode (快速解碼): 用於低性能播放設備。 (※ 壓縮率極低)
Zero Latency (零延遲): 處裡時間低延遲。主要用於直播等。 (※ 壓縮率極低)


H.264 Level


Level 、 MaxDpbMbs 直接表示了對播放設備的解碼性能要求
值越高,代表播放設備解碼性能要求越高,相對的輸出影片的壓縮率也越越高

MaxDpbMbs 對應的 Level


舉例說明:
Level 3.2: MaxDpbMbs 20480 以下
Level 4.1: MaxDpbMbs 32768 以下


關係方程式:

強制指定 Level (限制 MaxDpbMbs),則
ref = Min(Floor(MaxDpbMbs / (PicWidthInMbs * FrameHeightInMbs)), 16)

ps. 1. Floor(x): 取整數,小數位直接捨去。 ex. Floor(1.9) = 1
ps. 2. Min(x, y): 取比較小的數值。 ex. Min(2, 5) = 2

強制指定 ref,則
MaxDpbMbs = PicWidthInMbs * FrameHeightInMbs * ref

PicWidthInMbs = Width / 16
FrameHeightInMbs = Height / 16
(小數直接進位)

舉例 1:
當我設定輸出為
‧Resolution: 1280x720
‧Level: 不指定(自動)
‧Reference frame (ref): 4

則 MaxDpbMbs = 80 * 45 * 4 = 14400
對照上表,得 Level = 3.1

舉例 2:
當設定輸出為
‧Resolution: 1280x720
‧Level: 3.1
‧Reference frame (ref): 不指定(自動)

ref = Min(Floor(18000 / (80 * 45)), 16) = Min(Floor(5.0), 16) = Min(5, 16) = 5

則輸出 H.264 的 ref 可能為 4 或 5

同上,如果要同時強制指定 ref 與 level
則 ref 設定值不能大於 5
(強制指定 ref 不能大於 Level 的限制)

詳細說明(Wiki)


x264 Bitrate Control


指定輸出品質: QP (VBR) 、 CRF (VBR)
指定輸出 Bitrate / 檔案大小: Single pass (ABR) 、 2-pass (VBR)

通常只會使用兩種速率控制: Constant Rate Factor (CRF) 或 2-Pass Bitrate。速率控制是指決定多少位元將被用於每個畫格的方法。這將決定檔案大小且品質如何分布。而 CRF 的位元率分配效果是最佳的,若無控制輸出大小的需求則使用 CRF 即可。

Constant Quantizer (QP)

設定x264以恆定量化值(Constant Quantizer)模式來編碼視訊。此方法可以讓每一個畫格獲得相同品質 (設定值)。
設定值範圍為 0–69,0 為最無損,預設值為 23。比較低的數值會得到比較高的品質,合理的範圍 21 - 28。

Constant Ratefactor (CRF)

此方法允許編碼器自動分配位元速率來試著達到一定輸出品質。讓每個畫格得到它需要的位元數來保持所需的品質等級。CRF 會得到最佳的位元速率分配結果,缺點是你不能直接指定一個目標位元率或是檔案大小。
設定值範圍為 0–51.0,0 為最高品質,預設值為 23。比較低的數值會得到比較高的品質,合理的範圍 18 - 28。考慮 18 為視覺無損 (或接近),所以它看起來應該與輸入相同 (或接近) 但它技術上不是無損。

Bitrate

自訂 Bitrate 控制輸出 Size,直接編碼輸出視訊。由於沒有先掃描過一次,x264 無法得知影片各時間點的複雜程度。所以 x264 只能在編碼中不斷猜後之後的複雜程度,這樣將不能精準依各時間點的複雜程度等比例分配位元率,因為如果之前分配了過多流量,那麼之後就必下修流量來使輸出位元率平均值等於使用者設定值。

Bitrate, 2-Pass

此方法令編碼器 1st-Pass 將會得知影片各個畫格的複雜程度,2nd-Pass 時依照輸入視訊各個畫格的複雜程度等比例分配位元數輸出,並且最終平均位元速率會等於設定值。2-Pass 位元速率分配結果會接近 CRF,缺點是耗費大量時間。

1st-Pass CRF + 2-Pass Bitrate

此方法令編碼器在 1st-Pass 時將會得知影片各個畫格所需要的位元數,2nd-Pass 時依照各個畫格所需要的位元數等比例分配使最終位元速率總平均值會等於設定值。2-Pass 位元速率分配結果會接近 CRF,缺點是耗費大量時間。


x264 設定優先順序


preset -> tune -> 使用者設定選項 -> fast first pass -> profile -> level

當參數衝突時,後者會取代前者或是影響前者

preset slower 的參數為:
--b-adapt 2 --direct auto --me umh
--partitions all --rc-lookahead 60
--ref 8 --subme 9 --trellis 2

當我設定:
‧ x264 Preset: Slower
‧ Reference frame (ref): 4

等同於:
--b-adapt 2 --direct auto --me umh
--partitions all --rc-lookahead 60
--ref 4 --subme 9 --trellis 2

輸出 H.264 的 Reference frame (ref) 為 4

當我設定
‧x264 Preset: Slower
‧Level: 3.2

輸出 H.264 的 Reference frame (ref) 為 5
(請參考上文 "H.264 Level" 部分)


參考資料


wiki/H.264/MPEG-4_AVC
NMM-x264設定
http://www.cnblogs.com/zyl910/archive/2011/12/04/x264_presets.html