この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
この文書の目的のために、ISO/IEC 23008-12 および以下で指定されている用語、定義、および略語が適用されます。
ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。
注疑義を避けるため、曖昧な点がある場合には、附属書 F で指定されたファイル形式を除き、この文書の定義が ISO/IEC 23008-12 の定義より優先されます。 ISO/IEC 23008-12 および附属書 F のコンテキストにおけるサンプルは、「単一の時間に関連付けられたすべてのデータ」です。付属書 G では、これは 1 つのコード化画像に関連付けられたすべてのデータを意味し、「画像平面を構成する 2 次元画像配列の要素」ではありません。
3.1
適応係数正規化
VLC 符号where 部分を表すために使用されるビットを制御 (つまり「正規化」) するように設計された方法で、 変換係数(3.75) が VLC符号化 (3.77) 部分と 固定長符号化(3.28 ) 部分に動的に分割される解析サブプロセス
注記 1: DC 係数およびローパス係数の固定長コード化部分は FLC リファインメントと呼ばれ、ハイパス係数の固定長コード化部分はフレックスビットと呼ばれます。
3.2
適応型逆スキャン
解析サブプロセス 。変換係数セット (3.75 ) に関連付けられたジグザグ スキャン順序(3.80 ) where 、以前に解析された変換係数の統計に基づいて動的に変更されます。
3.3
アダプティブ VLC
特定の構文要素の VLC (3.77) 解析に関連付けられたコード テーブルwhere 、この構文要素の以前に解析されたインスタンスの統計に基づいて、固定テーブルの有限セット間で切り替えられる解析サブプロセス
3.4
アルファイメージプレーン
プライマリ イメージ プレーン (3.57) のルミナンス(3.45) コンポーネントと同じ次元のイメージに関連付けられたオプションのセカンダリ イメージ プレーン(3.36)
注記 1: アルファ イメージ プレーンには、輝度コンポーネントという 1 つのコンポーネントがあります。
3.5
ブロック
サンプルの m×n 配列 (3.64) または 変換係数の m×n 配列 (3.75)
3.6
ブロックインデックス
ラスター スキャン順序(3.61) での位置によって、16 × 16 ブロックを 16 個の 4 × 4 ブロックに分割した内の特定の 4 × 4 ブロック ( 3.5) を識別する 0 から 15 の範囲の整数
3.7
バイト
8ビットのシーケンス
3.8
バイトアライン
コードストリーム(3.13) 内のビット。そのwhere はコードストリームの先頭から 8 ビットの整数倍でありここで, コードストリームの最初のビットは位置 0 にあります。
3.9
彩度
ゼロ以外のインデックスを持つ 主イメージ プレーン(3.57) の コンポーネント(3.14) 、またはこのコンポーネントに関連付けられた 変換係数(3.75) とサンプル値
3.10
コード化されたブロック パターンのハイパス
マクロブロック(3.46) 内の ブロック(3.5) のそれぞれについて、 符号化されたブロックのステータス(3.12) 、すなわち非ゼロの ハイパス係数(3.34) の有無を示す構文要素。
3.11
コード化されたブロック パターンのローパス
マクロブロック(3.46) 内の非ゼロの ローパス係数(3.44) の有無を示す構文要素
3.12
コード化されたブロックのステータス
その ブロック(3.5) 内の非ゼロ 変換係数(3.75) の有無の表示
3.13
コードストリーム
構文要素が解析される バイトシーケンス (3.7) に含まれるビットのシーケンス
項目への注記 1:最初のバイトの最上位ビットはコードストリームの最初のビットであり、最初のバイトの次の最上位ビットはコードストリームの 2 番目のビットであり、以下同様に最初のバイトの最下位ビット (コードストリームの 8 番目のビット)、続いて 2 番目のバイトの最上位ビット (コードストリームの 9 番目のビット) というように、バイトシーケンスの最後のバイトの最下位ビットまで続きます。 (これはコード ストリームの最後のビットです)
3.14
コンポーネント.コンポーネント
イメージ プレーンに関連付けられたサンプルの配列 (3.36)
3.15
コンテクスト
コンテキスト変数の特定のインスタンスの取り得る値 (3.16)
3.16
コンテキスト変数
特定の構文要素の 適応 VLC (3.3) 解析にどのデータ構造を使用するかを選択するために 解析プロセス(3.54) で使用される変数
3.17
DC係数
特定の マクロブロック(3.46) と特定の コンポーネント(3.14) に含まれる 変換係数(3.75) が 3 つのサブセットに分割されるときの最初のサブセット
3.18
DC-LPアレイ
特定の コンポーネント(3.14) に関連付けられたすべての マクロブロック(3.46) の、すべての DC (3.17) および ローパス(3.44) 変換係数(3.75) の配列
3.19
デコーダ
解析プロセス(3.54) および 復号プロセス(3.20) の実施形態
3.20
デコード処理
コードストリームの解析された構文要素から出力サンプル値を計算するプロセス (3.13)
3.21
逆量子化
コードストリーム(3.13) から値が解析された後、 逆変換プロセス(3.41) に渡される前に、量子化された 変換係数(3.75 ) を再スケーリングするプロセス。
3.22
差別的な
DiscrimVal1 または DiscrimVal2 のいずれか。これらは 、アダプティブ VLC (3.3) データ構造のインスタンスの 2 つのメンバー変数です。
注記 1:適応型 VLC データ構造は、5.5.5 項で規定されています。
3.23
エンコーダ
符号化プロセスの実施形態(3.24)
3.24
エンコード処理
ソースサンプル値を コードストリームに変換するプロセス (3.13)
3.25
拡張イメージ
ウィンドウ処理(3.79) の前に デコード プロセス(3.20) によって生成された 画像(3.35 )
注記 1: 拡張されたイメージには、幅と高さが 16 の整数倍である luma (3.45) 配列があります。
3.26
ファイル
デコーダがバイト シーケンス内の指定された位置にあるデータにアクセスできるように、 デコーダ(3.19) がアクセスできる有限長の バイトシーケンス (3.7)
例:
データへのアクセスは、バイト シーケンス全体をランダム アクセス メモリに保存するか、バイト シーケンス内の指定された位置に「位置シーク」操作を実行することによって実現できます。
3.27
ファイル形式
ファイルの内容に指定された構造 (3.26)
3.28
固定長コード
FLC
許容可能なビット パターンの有限セットを特定の値のセットに割り当てるコードここで, 各ビット パターンは同じ長さ
3.29
FLC精製
適応 固定長コード を使用して解析される DC 係数(3.17) or ローパス係数(3.44) の固定長コード化 (3.28) 部分
3.30
フレックスビット
適応 固定長 コードを使用して解析される ハイパス係数(3.34) 情報の固定長コード化 (3.28) 部分。
3.31
周波数帯域
画像(3.35) の 変換係数(3.75) の 3 つのサブセットのうちの 1 つ。これらは個別に解析されます: DC 係数(3.17) 、 ローパス係数(3.44) 、およびハイパス係数 (3.34)
3.32
周波数モード
コードストリーム(3.13) 構造where 各 タイル( 3.72) の DC (3.17) 、 ローパス(3.44) 、 ハイパス(3.34) および フレックスビット(3.30) の 周波数帯域(3.31) が個別にグループ化されます。
3.33
硬いタイル
codestream (3.13) 構造モードwhere オーバーラップ演算子はタイル境界を越えて適用されません。代わりに、境界オーバーラップ演算子がタイル境界に適用されます。
3.34
ハイパス係数
第3のサブセット、特定の マクロブロック(3.46) および特定の コンポーネント(3.14) に含まれる 変換係数(3.75 )を3つのサブセットに分割する場合
3.35
画像
プライマリ イメージ プレーン(3.57) とオプションの アルファ イメージ プレーン(3.4) で構成される 復号化プロセス(3.20) の結果。
3.36
イメージプレーン
画像(3.35) の 構成要素(3.14) をグループ化した総称。
3.37
初期レベル値
変換係数( 3.75) のVLCコード化 (3.77) 部分を計算するために使用される 2 つの値のうちの 1 つ
3.38
インターリーブされたアルファ イメージ プレーン
プライマリ イメージ プレーン (3.57) とともにインターリーブ方式で コードストリーム(3.13) に符号化されるアルファ イメージ プレーン(3.4)
3.39
内部カラーフォーマット
逆変換プロセス(3.40) および サンプル再構成プロセス(3.65) を通じて取得された空間領域サンプルに関連付けられたカラー フォーマットであり、出力フォーマット プロセス (3.50) に関連付けられた 出力カラーフォーマット (3.49) とは区別さ れます。
3.40
逆コア変換
ICT
逆変換プロセス(3.40) の 2 つのステップ。これには、オーバーラップ フィルタリング (3.53) を行わずに、各 マクロブロック(3.46) に関連付けられた 変換係数(3.75 )を個別に処理することが含まれます。
3.41
逆変換処理
逆量子化された (3.21) 変換係数(3.75) のセットが空間領域値に変換される 復号化プロセス(3.20) の一部。
3.42
逆スキャン
コードストリーム(3.13) から解析された構文要素の順序付きセットを並べ替えて、特定の コンポーネント(3.14) および マクロブロック(3.46) に関連付けられた 変換係数(3.75) の配列を形成するプロセス
3.43
リトルエンディアン形式
数値をバイトの整数として表す バイトの順序付け (3.7) 数値を表すバイトは重要度の昇順です。
注 1:最下位バイトが最初で、次に最下位バイトが続きます。
3.44
ローパス係数
第2のサブセット、特定の マクロブロック(3.46) および特定の コンポーネント(3.14) に含まれる 変換係数(3.75 )が3つのサブセットに分割される場合
3.45
ルマ
インデックス 0 の イメージ プレーン(3.36) の コンポーネント(3.14) 、およびこのコンポーネントに関連付けられた 変換係数(3.75) とサンプル値
注記 1:この用語は一般に知覚的な明るさ情報を伝える信号に関連付けられていますが、この文書で使用される場合、この用語は主にサンプルの特定の配列の識別子または 画像(3.35) の変換係数です。
3.46
マクロブロック
マクロブロック パーティション(3.47) に関して同じインデックスi およびj を持つ、すべての コンポーネント(3.14) にわたる 変換係数(3.75) またはサンプルのコレクション。
3.47
マクロブロックパーティション
各 コンポーネント(3.14) を、 内部カラー形式(3.39) に応じて 16×16, 8×8, または 16×8 ブロック(3.5) に分割します。
3.48
出力ビット深度
デコードプロセス(3.20) の結果である出力 画像(3.35) のサンプル値に使用される、ビット数とビットパターンの解釈を含む表現。
3.49
出力カラーフォーマット
デコードプロセス(3.20) の結果である出力 画像(3.35) に関連付けられたカラーフォーマット
3.50
出力フォーマットプロセス
サンプルの配列( サンプル再構成プロセス(3.65) の結果である)を 、復号化プロセス(3.20) の出力を構成する出力サンプルに変換するプロセス。
注記 1:これは、適切な 出力カラー形式(3.49) および 出力ビット深度(3.48) への変換 (必要な場合) を指定します。
3.51
出力画像の高さ
復号化プロセス(3.20) によって出力される 主画像プレーン(3.57) の 輝度(3.45) コンポーネント(3.14) のサブ配列の高さ
3.52
出力画像の幅
デコードプロセス(3.20) によって出力される 主イメージプレーン(3.57) の ルミナンス(3.45) コンポーネント(3.14) のサブアレイの幅
3.53
オーバーラップフィルタリング
隣接する ブロック(3.5) および マクロブロック(3.46 )にわたる 変換係数(3.75) の処理を含む 逆変換プロセス(3.41) のステップ。
注 1:オーバーラップ・フィルタリングが適用される場合、ブロック境界だけでなくマクロブロック境界にも適用されます。 コードストリーム(3.13) が ソフト タイル(3.67) を使用する場合、オーバーラップ フィルタリングは タイル(3.72) の境界を越えて適用されます。それ以外の場合、タイル境界を越えてオーバーラップ フィルタリングは発生しません。
3.54
解析プロセス
コードストリームからビットシーケンスを抽出し(3.13) 、これらのビットシーケンスを構文要素の値に変換し、 デコードプロセスで使用するグローバル変数の値を設定するプロセス(3.20)
3.55
予測
現在デコード中のサンプル値またはデータ要素の推定値を計算するプロセス
3.56
予測残差
サンプルまたはデータ要素に対して呼び出された 予測(3.55) プロセスの結果と、その意図された値との差。
3.57
一次像面
アルファ イメージ プレーン(3.4) の一部ではないすべての イメージ(3.35) コンポーネント(3.14) で構成される イメージ プレーン(3.36)
3.58
QPインデックス
特定の 周波数帯域(3.31) および マクロブロック(3.46) に対して、この周波数帯域および タイル(3.72) で使用可能な 量子化パラメーター(3.60) のテーブルへのインデックスを指定する整数。
注記 1: QP インデックス(3.58) は、このマクロブロックに対して、特定の 周波数帯域(3.31) における 変換係数(3.75) の 逆量子化 (3.21) に使用される量子化パラメータを選択します。
3.59
QPセット
特定の 周波数帯域(3.31) に関連付けられた 量子化パラメータ(3.60) のセット。 輝度(3.45) および 彩度(3.9) 成分(3.14) に対応します。
3.60
量子化パラメータ
QP
逆変換プロセス (3.41) が適用される前に、 変換係数(3.75) の 逆量子化 ( 3.21) のスケーリング係数を計算するために使用される値
3.61
ラスタースキャンの順序
値の 2 次元配列が左から右に行単位でスキャンされ、行が上の行から下の行にスキャンされるスキャン順序
3.62
洗練
予測された、または部分的に計算された 変換係数を変更するプロセス (3.75)
3.63
走る
逆スキャン(3.42) プロセス中に 、ジグザグ スキャン順序(3.80) で非ゼロ値の係数レベルに先行するゼロ値の係数レベルの数。
3.64
サンプル
画像平面を構成する二次元画像配列の要素 (3.36)
3.65
サンプル再構成プロセス
逆量子化された(3.21) 変換係数(3.75) を 画像のサンプル (3.35) に変換するプロセス
3.66
個別のアルファ イメージ プレーン
プライマリ イメージ プレーン (3.57) とは別にコードストリームで符号化されるアルファ イメージ プレーン(3.4)
3.67
柔らかいタイル
codestream (3.13) 構造モードwhere オーバーラップ演算子がタイル境界を越えて適用されます。
3.68
空間的コロケーション
サンプルのサブ配列は、コンポーネント (3.14) がデコードされた画像 (3.35) の同じ空間領域に対応する場合 、コンポーネント(3.14) 全体にわたって 空間的に同じ場所に配置されます ( 3.68)
注記 1:画像の マクロブロック分割(3.47) は、 すべてのコンポーネントにわたってi 番目の マクロブロック(3.46) が 水平方向に、 j 番目のマクロブロックが垂直方向に空間的に同じ位置に配置されることを保証します。
3.69
空間モード
コードストリーム(3.13) 構造where 各特定の マクロブロック(3.46) の DC (3.17) 、 ローパス(3.44) 、 ハイパス(3.34) および フレックスビット(3.30) の 周波数帯域(3.31) がグループ化されます。
3.70
空間変換
デコードされた 画像(3.35) の最終的な表示方向を示す コードストリーム(3.13) 内の要素。
注記 1: 8.3.8 項に規定されているとおり。
注記 2: 空間変換(3.70) は 単なる提案であり、 デコーダ(3.19) の 適合性は、この変換を適用する前 (つまり方向 0 の場合) にデコードされた 画像(3.35) に対してのみチェックされます。
3.71
スタートコード
タイル パケット(3.73) の始まりを指定するビット パターン、または コードストリーム内のその他の区別された連続した構文要素セット (3.13)
3.72
タイル
タイル パーティション(3.74) に関して同じインデックスi およびj を持つ マクロブロック(3.46) のコレクション
注記 1:各 タイル(3.72) は、 画像(3.35) の長方形領域のマクロブロックに対応します。
3.73
タイルパッケージ
コードストリーム(3.13) の連続したサブセット。これには、特定の タイル(3.72) に関連付けられたコード化された構文要素が含まれます。
3.74
タイルパーティション
画像(3.35) を マクロブロックの長方形配列 (3.46) に分割します。
注記 1: 6.4 項に規定されている通り。
3.75
変換係数
各特定の マクロブロック(3.46) および特定の コンポーネント(3.14) に関連付けられた値。 逆量子化(3.21) 後、 逆変換プロセス(3.41) への入力配列を形成します。
3.76
ユニバーサル複数オクテットコード化文字セット変換形式 8
UTF-8
8ビット文字セットエンコーディング
注記 1: ISO/IEC 10646:2017, 附属書 D に規定されているとおり。
3.77
可変長コード
VLC
許容可能なビット パターンの有限セットを特定の値セットに割り当てるコードここで, 各ビット パターンは潜在的に異なる長さになる
3.78
VLCリファインメント
変換係数( 3.75) のVLCコード化 (3.76) 部分を計算するために使用される 2 つの値のうちの 1 つ
注記 1: VLC 改良を指定するために必要なビット数は 、初期レベル値(3.37) の値によって異なります。 VLC リファインメントは初期レベル値に追加され、変換係数の VLC コード化された部分が生成されます。
3.79
ウィンドウ処理
復号プロセス(3.20) によって出力される 画像( 3.35)に関連付けられたすべての現在の 画像平面(3.36) の 成分(3.14) の 空間的に同じ場所にある(3.68) サブアレイの選択
3.80
ジグザグスキャン順序
逆スキャン(3.42) プロセスの適応順序付け。 コードストリーム(3.13) から解析された後続の各 変換係数(3.75) に配列インデックスを割り当てます。
参考文献
| 1 | 勧告 ITU-T T.81 (1992) | ISO/IEC 10918-1:1994, 情報技術 — 連続階調静止画像のデジタル圧縮およびコーディング — 要件とガイドライン |
| 2 | ISO/IEC 9899:2011, プログラミング言語 — C |
| 3 | ISO/IEC 11578:1996, 情報技術 — オープン システム相互接続 — リモート プロシージャ コール (RPC) |
| 4 | ISO 12234-2:2001, 電子静止画イメージング — リムーバブル メモリ — Part 2: TIFF/EP 画像データ形式 |
| 5 | ISO 12639:2004, グラフィックテクノロジー — プリプレスデジタルデータ交換 — 画像テクノロジー用のタグ画像ファイル形式 (TIFF/IT) |
| 6 | JEITA CP-3451:2002-04, デジタルスチルカメラ用交換可能画像ファイルフォーマット:Exifバージョン2.2 |
| 7 | Adobe TIFF リビジョン 6., アドビ システムズ社 ( http://partners.adobe.com/public/developer/en/tiff/TIFF6.pdf で入手可能) http://partners.adobe.com/public/developer/tiff/index.html ) および |
| 8 | Adobe Extensible Metadata Platfor, アドビ システムズ社 ( http://www.adobe.com/xmp で入手可能) |
| 9 | ISO 11664-1:2007, 測色 — Part 1: CIE 標準測色オブザーバー |
| 10 | ISO 15076-1:2010, 画像技術のカラー管理 — アーキテクチャ、プロファイル形式およびデータ構造 — Part 1: ICC.1:2004-10 に基づく |
| 11 | ISO 16684-1, グラフィック テクノロジー–拡張可能なメタデータ プラットフォーム (XMP) — Part 1: データ モデル、シリアル化、およびコア プロパティ |
| 12 | ICC ICC.1:2001-04, カラー プロファイルのファイル形式 |
| 13 | 勧告 ITU-R BT.470-, 従来のテレビ システム |
| 14 | 勧告 ITU-R BT.601-, 標準 4:3 およびワイド スクリーン 16:9 アスペクト比のデジタル テレビのスタジオ エンコード パラメータ |
| 15 | 勧告 ITU-R BT.709-, 制作および国際番組交換のための HDTV 標準のパラメータ値 |
| 16 | 勧告 ITU-R BT.1358-, 625 および 525 ライン プログレッシブ スキャン テレビ システムのスタジオ パラメータ |
| 17 | 勧告 ITU-R BT.1358-, 625 および 525 ライン プログレッシブ スキャン テレビ システムのスタジオ パラメータ |
| 18 | 勧告 ITU-R BT.1361-, 将来のテレビおよび画像システムの世界統一測色および関連特性 |
| 19 | 勧告 ITU-R BT.1700-, 従来のアナログ テレビ システムのコンポジット ビデオ信号の特性 |
| 20 | 勧告 ITU-R BT.2020-, 制作および国際番組交換用の超高解像度テレビ システムのパラメータ値 |
| 21 | 勧告 ITU-R BT.2100-, 制作および国際番組交換で使用するための高ダイナミック レンジ テレビの画像パラメーター値 |
| 22 | IEC 61966-2-1:1999, マルチメディア システムおよび機器 — 色の測定と管理 — Part 2-1: カラー管理 — デフォルトの RGB カラー スペース — sRGB |
| 23 | IEC 61966-2-1:1999/Amd.1:2003, マルチメディア システムおよび機器 — 色の測定と管理 — Part 2-1: カラー管理 — デフォルトの RGB 色空間 — sRGB — 修正 1, 付録 F: 標準輝度-彩度-彩度色空間のデフォルト YCC エンコード変換: sYCC |
| 24 | IEC 61966-2-2:2003, マルチメディア システムおよび機器 – 色の測定および管理 – Part 2-2: カラー管理 – 拡張 RGB 色空間 – scRGB |
| 25 | IEC 61966-2-4:2006, マルチメディア システムおよび機器 — 色の測定と管理 — Part 2-4: カラー管理 — ビデオ アプリケーション用の拡張色域 YCC カラー スペース — xvYCC |
| 26 | SMPTE RP 177-1993, 基本的なテレビの色方程式の導出 |
| 27 | SMPTE ST 17, テレビ用 SMPTE 標準 — コンポジット アナログ ビデオ信号 — スタジオ アプリケーション用の NTSC |
| 28 | SMPTE ST 24, テレビ用 SMPTE 標準 — 1125 ラインの高解像度制作システム — 信号パラメータ |
| 29 | SMPTE ST 208, マスタリングリファレンスディスプレイのハイダイナミックレンジ電気光学伝達関数 |
| 30 | 米国国家テレビジョン システム委員会、カラー テレビの伝送規格に関する勧告(1953 年) |
| 31 | 米国連邦通信委員会、連邦規則集タイトル 47 (2003) 73.682 (a) (20) |
| 32 | International Digital Enterprise Alliance, SWOP 仕様第 11 版、月刊 Graphic Arts の付録、2007 年 5 月( http://www.swop.org/specation で入手可能) |
| 33 | ANSI CGATS/SWOP TR 003-2007 CMYK, グラフィック技術— SWOP 校正および米国グレード 3 コート出版用紙への印刷のための色特性データ |
| 34 | ARIB STD-B6, 番組制作のためのハイブリッド ログガンマ (HLG) ハイ ダイナミック レンジ テレビ (HDR-TV) システムのパラメータ値 |
| 35 | IDEAlliance, SWOP2006_Coated3v2.icc, プロファイル ID: F7B89B0445878F17EBB85D7515DA9A98 ( http://www.color.org/registry/SWOP2006_Coated3v2.xalter で入手可能) |
| 36 | IETF RFC 4337, MPEG-4 の MIME Type 登録 |
| 37 | IETF RFC 6838, メディアType 仕様と登録手順 |
| 38 | IETF RFC 6381, 「バケット」メディア タイプの「コーデック」および「プロファイル」パラメータ |
3 Terms and definitions
For the purposes of this document, the terms, definitions and abbreviated terms specified in ISO/IEC 23008-12 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
NOTE For the avoidance of doubt, in case of ambiguities, the definitions in this document take precedence over the definitions of ISO/IEC 23008-12 except in regard to the file format specified in Annex F. A sample in the context of ISO/IEC 23008-12 and in Annex F is"all the data associated with a single time". In Annex G, this is meant as all data associated with one coded image, not"element in a two-dimensional image array that comprises an image plane".
3.1
adaptive coefficient normalization
parsing sub-process where transform coefficients(3.75) are dynamically partitioned into a VLC-coded (3.77) part and a fixed-length coded(3.28) part, in a manner designed to control (i.e.,"normalize") bits used to represent the VLC-coded part
Note 1 to entry: The fixed-length coded part of DC coefficients and low-pass coefficients is called FLC refinement and the fixed-length coded part of high-pass coefficients is called flexbits.
3.2
adaptive inverse scanning
parsing sub-process where the zigzag scan order(3.80) associated with a set of transform coefficients(3.75) is dynamically modified, based on the statistics of previously-parsed transform coefficients
3.3
adaptive VLC
parsing sub-process where the code table associated with VLC(3.77) parsing of a particular syntax element is switched, among a finite set of fixed tables, based on the statistics of previously-parsed instances of this syntax element
3.4
alpha image plane
optional secondary image plane(3.36) associated with an image of the same dimensions as the luma(3.45) component of the primary image plane(3.57)
Note 1 to entry: The alpha image plane has one component, a luma component.
3.5
block
m×n array of samples(3.64) , or an m×n array of transform coefficients(3.75)
3.6
block index
integer in the range 0 to 15 identifying, by its position in raster scan order(3.61) , a particular 4×4 block(3.5) within a partition of a 16×16 block into 16 4×4 blocks
3.7
byte
sequence of 8 bits
3.8
byte-aligned
bit in a codestream(3.13) where its position is an integer multiple of 8 bits from the beginning of the codestream ここで, the first bit in the codestream is at position 0
3.9
chroma
component(3.14) of the primary image plane(3.57) with non-zero index, or the transform coefficients(3.75) and sample values associated with this component
3.10
coded block pattern high-pass
syntax element indicating the coded block status(3.12) , i.e. the presence or absence of non-zero high-pass coefficients(3.34) , for each of the blocks(3.5) in the macroblock(3.46)
3.11
coded block pattern low-pass
syntax element indicating the presence or absence of non-zero low-pass coefficients(3.44) in the macroblock(3.46)
3.12
coded block status
indication of the presence or absence of non-zero transform coefficients(3.75) in that block(3.5)
3.13
codestream
sequence of bits contained in a sequence of bytes(3.7) from which syntax elements are parsed
Note 1 to entry: The most significant bit of the first byte is the first bit of the codestream, the next most significant bit of the first byte is the second bit of the codestream, and so on, to the least significant bit of the first byte (which is the eighth bit of the codestream), followed by the most significant bit of the second byte (which is the ninth bit of the codestream), and so on, up to and including the least significant bit of the last byte of the sequence of bytes (which is the last bit of the codestream).
3.14
component
array of samples associated with an image plane(3.36)
3.15
context
possible value of a specific instance of a context variable(3.16)
3.16
context variable
variable used in the parsing process(3.54) to select which data structure is to be used for the adaptive VLC(3.3) parsing of a given syntax element
3.17
DC coefficient
first subset when the transform coefficients(3.75) , that are contained in a specific macroblock(3.46) and a specific component(3.14) , are partitioned into 3 subsets
3.18
DC-LP array
array of all DC(3.17) and low-pass(3.44) transform coefficients(3.75) , for all macroblocks(3.46) associated with a specific component(3.14)
3.19
decoder
embodiment of a parsing process(3.54) and decoding process(3.20)
3.20
decoding process
process of computing output sample values from the parsed syntax elements of the codestream(3.13)
3.21
dequantization
process of rescaling the quantized transform coefficients(3.75) after their value has been parsed from the codestream(3.13) and before they are presented to the inverse transform process(3.41)
3.22
discriminant
one of DiscrimVal1 or DiscrimVal2, which are the two member variables of an instance of the adaptive VLC(3.3) data structure
Note 1 to entry: The adaptive VLC data structure is specified in subclause 5.5.5.
3.23
encoder
embodiment of an encoding process(3.24)
3.24
encoding process
process of converting source sample values into a codestream(3.13)
3.25
extended image
image(3.35) produced by the decoding process(3.20) prior to windowing(3.79)
Note 1 to entry: The extended image has a luma(3.45) array that is an integer multiple of 16 in width and height.
3.26
file
finite-length sequence of bytes(3.7) that is accessible to a decoder(3.19) in a manner such that the decoder can obtain access to the data at specified positions within the sequence of bytes
EXAMPLE:
Access to the data can be achieved by storing the entire sequence of bytes in random access memory or by performing"position seek" operations to specified positions within the sequence of bytes.
3.27
file format
specified structure for the content of a file(3.26)
3.28
fixed-length code
FLC
code which assigns a finite set of allowable bit patterns to a specific set of values ここで, each bit pattern has the same length
3.29
FLC refinement
fixed-length coded(3.28) part of a DC coefficient(3.17) or low-pass coefficient(3.44) that is parsed using adaptive fixed-length codes
3.30
flexbits
fixed-length coded(3.28) part of the high-pass coefficient(3.34) information which is parsed using adaptive fixed-length codes
3.31
frequency band
one of three subsets of the transform coefficients(3.75) for an image(3.35) , which are separately parsed: DC coefficients(3.17) , low-pass coefficients(3.44) and high-pass coefficients (3.34)
3.32
frequency mode
codestream(3.13) structure mode where the DC(3.17) , low-pass(3.44) , high-pass(3.34) and flexbits(3.30) frequency bands(3.31) for each tile(3.72) are grouped separately
3.33
hard tiles
codestream(3.13) structure mode where the overlap operators are not applied across tile boundaries; instead, boundary overlap operators are applied at tile boundaries
3.34
high-pass coefficient
third subset, when the transform coefficients(3.75) that are contained in a specific macroblock(3.46) and a specific component(3.14) are partitioned into 3 subsets
3.35
image
result of the decoding process(3.20) consisting of a primary image plane(3.57) and an optional alpha image plane(3.4)
3.36
image plane
collective term for a grouping of the components(3.14) of the image(3.35)
3.37
initial level value
one of two values used to compute the VLC-coded (3.77) part of a transform coefficient(3.75)
3.38
interleaved alpha image plane
alpha image plane(3.4) that is coded in a codestream(3.13) in an interleaved manner together with the primary image plane(3.57)
3.39
internal colour format
colour format associated with the spatial-domain samples obtained through the inverse transform process(3.40) and the sample reconstruction process(3.65) , and distinguished from the output colour format(3.49) associated with the output formatting process(3.50)
3.40
inverse core transform
ICT
two steps of the inverse transform process(3.40) that involve processing of transform coefficients(3.75) associated with each macroblock(3.46) independently, with no overlap filtering(3.53)
3.41
inverse transform process
part of the decoding process(3.20) by which a set of dequantized(3.21) transform coefficients(3.75) are converted into spatial-domain values
3.42
inverse scanning
process of reordering an ordered set of parsed syntax elements from the codestream(3.13) to form an array of transform coefficients(3.75) associated with a specific component(3.14) and macroblock(3.46)
3.43
little-endian form
ordering of the bytes(3.7) that represent a numerical value as an integer number of bytes in which the bytes representing the number are in ascending order of significance
Note 1 to entry: With the least significant byte first, followed by the next least significant byte, etc.
3.44
low-pass coefficient
second subset, when the transform coefficients(3.75) that are contained in a specific macroblock(3.46) and a specific component(3.14) are partitioned into 3 subsets
3.45
luma
component(3.14) of an image plane(3.36) with index zero, and the transform coefficients(3.75) and sample values associated with this component
Note 1 to entry: Although this term is commonly associated with a signal that conveys perceptual brightness information, as used in this document the term is primarily an identifier of a particular array of samples or transform coefficients for an image(3.35) .
3.46
macroblock
collection of transform coefficients(3.75) or samples, across all components(3.14) , that have the same indices i and j with respect to a macroblock partition(3.47)
3.47
macroblock partition
partitioning of each component(3.14) , into 16×16, 8×8, or 16×8 blocks(3.5) , depending on the internal colour format(3.39)
3.48
output bit depth
representation, including the number of bits and the interpretation of the bit pattern, used for the sample values of the output image(3.35) that are the result of the decoding process(3.20)
3.49
output colour format
colour format associated with the output image(3.35) that is the result of the decoding process(3.20)
3.50
output formatting process
process of converting the arrays of samples (that are the result of the sample reconstruction process(3.65) ) into the output samples that constitute the output of the decoding process(3.20)
Note 1 to entry: This specifies a conversion (if necessary) into the appropriate output colour format(3.49) and output bit depth(3.48) .
3.51
output image height
height of the sub-array of the luma(3.45) component(3.14) of the primary image plane(3.57) that is output by the decoding process(3.20)
3.52
output image width
width of the sub-array, of the luma(3.45) component(3.14) of the primary image plane(3.57) that is output by the decoding process(3.20)
3.53
overlap filtering
steps of the inverse transform process(3.41) that involve processing of transform coefficients(3.75) across adjacent blocks(3.5) and macroblocks(3.46)
Note 1 to entry: When overlap filtering is applied, it is applied across macroblock boundaries as well as block boundaries. When the codestream(3.13) uses soft tiles(3.67) , the overlap filtering is also applied across tile(3.72) boundaries. Otherwise, overlap filtering does not occur across tile boundaries.
3.54
parsing process
process of extracting bit sequences from the codestream(3.13) , converting these bit sequences to syntax element values, and setting the values of global variables for use in the decoding process(3.20)
3.55
prediction
process of computing an estimate of the sample value or data element that is currently being decoded
3.56
prediction residual
difference between the result of the prediction(3.55) process invoked for a sample or data element, and its intended value
3.57
primary image plane
image plane(3.36) that consists of all image(3.35) components(3.14) that are not a part of the alpha image plane(3.4)
3.58
QP index
integer, which for a particular frequency band(3.31) and macroblock(3.46) specifies the index into the table of quantization parameters(3.60) available for this frequency band and tile(3.72)
Note 1 to entry: The QP index(3.58) thereby selects, for this macroblock, the quantization parameter used for the dequantization(3.21) of the transform coefficients(3.75) in the specific frequency band(3.31) .
3.59
QP set
set of quantization parameters(3.60) associated with a particular frequency band(3.31) , corresponding to the luma(3.45) and chroma(3.9) components(3.14)
3.60
quantization parameter
QP
value used to compute the scaling factor for the dequantization(3.21) of a transform coefficient(3.75) , before the inverse transform process(3.41) is applied
3.61
raster scan order
scan order in which a two-dimensional array of values is scanned row-wise from left to right, and the rows are scanned from the top row to the bottom
3.62
refinement
process of modifying a predicted or partially-computed transform coefficient(3.75)
3.63
run
number of zero valued coefficient levels that precede a non-zero valued coefficient level in the zigzag scan order(3.80) during the inverse scanning(3.42) process
3.64
sample
element in a two-dimensional image array that comprises an image plane(3.36)
3.65
sample reconstruction process
process of converting dequantized(3.21) transform coefficients(3.75) into samples of the image(3.35)
3.66
separate alpha image plane
alpha image plane(3.4) that is coded in a codestream separately from the primary image plane(3.57)
3.67
soft tiles
codestream(3.13) structure mode where the overlap operators are applied across tile boundaries
3.68
spatial co-location
sub-arrays of samples are spatially co-located(3.68) across components(3.14) when they correspond to the same spatial region of the decoded image(3.35)
Note 1 to entry: The macroblock partition(3.47) of the image ensures that the i-th macroblock(3.46) horizontally and j-th macroblock vertically across all components are spatially co-located.
3.69
spatial mode
codestream(3.13) structure mode where the DC(3.17) , low-pass(3.44) , high-pass(3.34) and flexbits(3.30) frequency bands(3.31) for each specific macroblock(3.46) are grouped together
3.70
spatial transformation
element in the codestream(3.13) indicating the preferred final displayed orientation of the decoded image(3.35)
Note 1 to entry: As specified in subclause 8.3.8.
Note 2 to entry: The spatial transformation(3.70) is only a suggestion, and decoder(3.19) conformance is checked only for the decoded image(3.35) prior to the application of this transformation (i.e. for orientation 0).
3.71
start code
bit pattern that specifies the beginning of a tile packet(3.73) or other distinguished, contiguous set of syntax elements in the codestream(3.13)
3.72
tile
collection of macroblocks(3.46) that have the same indices i and j with respect to a tile partition(3.74)
Note 1 to entry: Each tile(3.72) corresponds to the macroblocks for a rectangular region of the image(3.35) .
3.73
tile packet
contiguous subset of the codestream(3.13) , which contains the coded syntax elements associated with a specific tile(3.72)
3.74
tile partition
partition of the image(3.35) into rectangular arrays of macroblocks(3.46)
Note 1 to entry: As specified in subclause 6.4.
3.75
transform coefficient
values, associated with each specific macroblock(3.46) and specific component(3.14) , that – after dequantization(3.21) – form the input arrays into the inverse transform process(3.41)
3.76
universal multiple-octet coded character set transformation format 8
UTF-8
8-bit character set encoding
Note 1 to entry: As specified in ISO/IEC 10646:2017, Annex D.
3.77
variable-length code
VLC
code which assigns a finite set of allowable bit patterns to a specific set of values ここで, each bit pattern is potentially of a different length
3.78
VLC refinement
one of two values used to compute the VLC-coded (3.76) part of a transform coefficient(3.75)
Note 1 to entry: The number of bits required to specify the VLC-refinement is dependent on the value of the initial level value(3.37) . The VLC refinement is added to the initial level value to produce the VLC-coded part of the transform coefficient.
3.79
windowing
selection of spatially co-located(3.68) sub-arrays of the components(3.14) of all present image planes(3.36) associated with an image(3.35) that are output by the decoding process(3.20)
3.80
zigzag scan order
adaptive ordering for the inverse scanning(3.42) process, which assigns array indices to each subsequent transform coefficient(3.75) parsed from the codestream(3.13)
Bibliography
| 1 | Recommendation ITU-T T.81 (1992) | ISO/IEC 10918-1:1994, Information technology — Digital compression and coding of continuous-tone still images — Requirements and guidelines |
| 2 | ISO/IEC 9899:2011, Programming languages — C |
| 3 | ISO/IEC 11578:1996, Information technology — Open System Interconnection — Remote Procedure Call (RPC) |
| 4 | ISO 12234-2:2001, Electronic still-picture imaging — Removable memory — Part 2: TIFF/EP image data format |
| 5 | ISO 12639:2004, Graphic technology — Prepress digital data exchange — Tag image file format for image technology (TIFF/IT) |
| 6 | JEITA CP-3451:2002-04, Exchangeable image file format for digital still cameras: Exif version 2.2 |
| 7 | Adobe TIFF Revision 6.0 (1992), Adobe Systems Incorporated (available at http://partners.adobe.com/public/developer/en/tiff/TIFF6.pdf http://partners.adobe.com/public/developer/tiff/index.html ) and |
| 8 | Adobe Extensible Metadata Platform (XMP) Specification (2005), Adobe Systems Incorporated (available at http://www.adobe.com/xmp ) |
| 9 | ISO 11664-1:2007, Colorimetry — Part 1: CIE standard colorimetric observers |
| 10 | ISO 15076-1:2010, Image technology colour management — Architecture, profile format and data structure — Part 1: Based on ICC.1:2004-10 |
| 11 | ISO 16684-1, Graphic technology – Extensible metadata platform (XMP) — Part 1: Data model, serialization and core properties |
| 12 | ICC ICC.1:2001-04, File format for color profiles |
| 13 | Recommendation ITU-R BT.470-6 (1998) (historical), Conventional television systems |
| 14 | Recommendation ITU-R BT.601-7 (2011), Studio encoding parameters of digital television for standard 4:3 and wide screen 16:9 aspect ratios |
| 15 | Recommendation ITU-R BT.709-6 (2015), Parameter values for the HDTV standards for production and international programme exchange |
| 16 | Recommendation ITU-R BT.1358-0 (1998) (historical), Studio parameters of 625 and 525 line progressive scan television systems |
| 17 | Recommendation ITU-R BT.1358-1 (2007), Studio parameters of 625 and 525 line progressive scan television systems |
| 18 | Recommendation ITU-R BT.1361-0 (1998) (historical), Worldwide unified colorimetry and related characteristics of future television and imaging systems |
| 19 | Recommendation ITU-R BT.1700-0 (2005), Characteristics of composite video signals for conventional analogue television systems |
| 20 | Recommendation ITU-R BT.2020-2 (2015), Parameter values for ultra-high definition television systems for production and international programme exchange |
| 21 | Recommendation ITU-R BT.2100-2 (2018), Image parameter values for high dynamic range television for use in production and international programme exchange |
| 22 | IEC 61966-2-1:1999, Multimedia systems and equipment — Colour measurement and management — Part 2-1: Colour management — Default RGB colour space — sRGB |
| 23 | IEC 61966-2-1:1999/Amd.1:2003, Multimedia systems and equipment — Colour measurement and management — Part 2-1: Colour management — Default RGB colour space — sRGB — Amendment 1, Annex F: Default YCC encoding transformation for a standard luma-chroma-chroma colour space: sYCC |
| 24 | IEC 61966-2-2:2003, Multimedia systems and equipment – Colour measurement and management – Part 2-2: Colour management — Extended RGB colour space — scRGB |
| 25 | IEC 61966-2-4:2006, Multimedia systems and equipment — Colour measurement and management — Part 2-4: Colour management — Extended-gamut YCC colour space for video applications — xvYCC |
| 26 | SMPTE RP 177-1993, Derivation of basic television color equations |
| 27 | SMPTE ST 170 (2004), SMPTE Standard for Television — Composite analog video signal — NTSC for studio applications |
| 28 | SMPTE ST 240 (1999), SMPTE Standard for Television — 1125-line high-definition production systems — Signal parameters |
| 29 | SMPTE ST 2084 (2014), High Dynamic Range Electro-Optical Transfer Function of Mastering Reference Displays |
| 30 | United States National Television System Committee, Recommendation for transmission standards for colour television (1953) |
| 31 | United States Federal Communications Commission, Title 47 Code of Federal Regulations (2003) 73.682 (a) (20) |
| 32 | International Digital Enterprise Alliance, SWOP Specifications 11th Edition, supplement to Graphic Arts Monthly, May 2007 (available at http://www.swop.org/specification ) |
| 33 | ANSI CGATS/SWOP TR 003-2007 CMYK, Graphic technology — Color characterization data for SWOP proofing and printing on U.S. Grade 3 coated publication paper |
| 34 | ARIB STD-B67 (2018), Parameter Values for the Hybrid Log-Gamma (HLG) High Dynamic Range Television (HDR-TV) System for Programme Production |
| 35 | IDEAlliance, SWOP2006_Coated3v2.icc, Profile ID: F7B89B0445878F17EBB85D7515DA9A98 (available at http://www.color.org/registry/SWOP2006_Coated3v2.xalter ) |
| 36 | IETF RFC 4337, MIME Type Registration for MPEG-4 |
| 37 | IETF RFC 6838, Media Type Specifications and Registration Procedures |
| 38 | IETF RFC 6381, The 'Codecs' and 'Profiles' Parameters for"Bucket" Media Types |