この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義、略語、記号
3.1 用語と定義
このドキュメントでは、次の定義が適用されます。
3.1.1
交流係数
少なくとも 1 つの次元で周波数がゼロでない任意の DCT 係数
3.1.2
アスキーエンコーディング
ISO/IEC 10646-1 に準拠したテキスト文字とテキスト文字列のエンコード
3.1.3
ベースデコードパス
残差データが残差コードストリームから得られた値に追加されるまで、すべての以降のステップと一緒に、レガシーコードストリームとリファインメントデータをベース画像にデコードするプロセス
3.1.4
ベース画像
レガシーコードストリームとリファインメントコードストリームのDCT係数をエントロピー復号し、逆DCT変換して得られるサンプル値の集合
3.1.5
バイナリ決定
2 つの選択肢からの選択
3.1.6
ビットストリーム
エントロピー符号化されたセグメントを構成する、部分的に符号化または復号化されたビットのシーケンス
3.1.7
ブロック
サンプルの 8 × 8 配列または 1 つの成分の DCT 係数値の 8 × 8 配列
3.1.8
箱
1 つまたは複数の APP 11マーカー セグメントに埋め込まれた画像または画像デコード プロセスを記述する構造化されたデータの集合。
注記 1:ボックスの定義については、ISO/IEC 18477-3:2015, 附属書 B を参照してください。
3.1.9
バイト
8 ビットのグループ
3.1.10
コーダー
コーディングプロセスの具体化
3.1.11
コード
エンコードまたはデコード
3.1.12
コーディングモデル
入力データを符号化するシンボルに変換する手順
3.1.13
(コーディング)プロセス
符号化プロセス、復号化プロセス、またはその両方を指す一般的な用語
3.1.14
圧縮
ソース画像データを表すために使用されるビット数の削減
3.1.15
成分
出力または表示装置で同じ名称を持つサンプルの二次元配列。
注記 1画像は通常、赤、緑、青などの複数のコンポーネントで構成されます。
3.1.16
連続階調画像
コンポーネントがサンプルごとに複数のビットを持つイメージ
3.1.17
直流係数
両方の次元で周波数がゼロである DCT 係数
3.1.18
デコーダ
復号化プロセスの実施形態
3.1.19
デコード処理
圧縮された画像データを入力として受け取り、連続階調画像を出力するプロセス。
3.1.20
逆量子化
デコーダが DCT 係数の表現を復元する量子化の逆手順
3.1.21
離散コサイン変換
DCT
順離散コサイン変換または逆離散コサイン変換のいずれか
3.1.22
ダウンサンプリング
コンポーネントの空間解像度を下げる手順
3.1.23
エンコーダー
符号化プロセスの実施形態
3.1.24
エンコード処理
連続階調画像を入力として受け取り、圧縮された画像データを出力するプロセス。
3.1.25
エントロピー符号化 (データ) セグメント
圧縮された画像データのエントロピーでエンコードされたバイトの個別にデコード可能なシーケンス
3.1.26
エントロピーデコーダー
エントロピー復号手順の実施形態
3.1.27
エントロピー復号化
エントロピーエンコーダーによって生成されたビットのシーケンスからシンボルのシーケンスを復元する無損失手順。
3.1.28
エントロピーエンコーダ
エントロピー符号化手順の実施形態
3.1.29
エントロピー符号化
シンボルあたりの平均ビット数が入力シンボルのエントロピーに近づくように、入力シンボルのシーケンスをビットのシーケンスに変換する無損失手順。
3.1.30
グレースケール画像
成分が 1 つだけの連続階調画像
3.1.31
高ダイナミックレンジ
サンプルあたり 8 ビットを超える画像または画像データ
3.1.32
ハフマン復号器
ハフマン復号手順の実施形態
3.1.33
ハフマン復号化
ハフマンエンコーダーによって生成された各可変長コードからシンボルを復元するエントロピー復号化手順
3.1.34
ハフマンエンコーダ
ハフマン符号化手順の具体化
3.1.35
ハフマン符号化
各入力シンボルに可変長コードを割り当てるエントロピー符号化手順
3.1.36
中ダイナミックレンジ
サンプルあたり 8 ビットを超える画像または画像データ
3.1.37
共同写真専門家グループ
JPEG
ISO/IEC 18477 のこの部分を作成した委員会の非公式名
注記 1: 「ジョイント」は ITU-T と ISO/IEC のコラボレーションに由来する。
3.1.38
従来のコードストリーム
Rec. ITU-T T.81 によって定義されたマーカーと構文要素のコレクション | ISO/IEC 10918-1 は、ファミリー ISO/IEC 18477 標準によって定義された追加の構文要素を裸にします。つまり、レガシー コードストリームは、ISO/IEC で定義された構文によって JPEG XT ボックスを記述する APP 11マーカーを除くすべてのマーカーのコレクションで構成されます。 18477-3:2015, 附属書 A
3.1.39
従来のデコード パス
Rec. ITU-T T.81 | ISO/IEC 10918-1 と Legacy Refinement を組み合わせてスキャンしてから、このデータを残りのデータとマージして最終的な出力画像を形成します。
3.1.40
レガシーデコーダ
T.81 | Rec. ITU-T T.81に準拠した復号プロセスの実施形態ISO/IEC 10918-1, 可逆 DCT プロセスおよびベースライン、シーケンシャル、またはプログレッシブ モードに限定され、最大 4 つのコンポーネントをコンポーネントあたり 8 ビットにデコード
3.1.41
従来のイメージ
Rec. ITU-T T.81 | ISO/IEC 10918-1 で定義されたエントロピー符号化データに関する規格
3.1.42
無損失の
復号化手順の出力が符号化手順への入力と同一である、符号化および復号化プロセスおよび手順を表す用語。
3.1.43
ロスレスコーディング
すべての手順がロスレスである、ISO/IEC 18477 のこの部分で定義されたコーディング プロセスのいずれかを参照する動作モード。
注記 1: ISO/IEC 18477-8 を参照。
3.1.44
ロッシー
無損失ではない符号化および復号化プロセスの記述用語
3.1.45
低ダイナミックレンジ
画像またはサンプルあたり 8 ビット以下のデータで構成される画像データ
3.1.46
マーカー
最初のバイトが 16 進数の FF で、2 番目のバイトが 1 と 16 進数の FE の間の値である 2 バイト コード
3.1.47
マーカー セグメント
マーカーとそれに関連付けられたパラメーターのセット
3.1.48
ピクセル
すべて同じサンプル座標を持つ空間画像ドメインのサンプル値のコレクション。たとえば、ピクセルは、赤、緑、青の値を表す 3 つのサンプルで構成されます。
3.1.49
正確
特定のサンプルまたは DCT 係数に割り当てられたビット数
3.1.50
手順
符号化または復号化プロセスを構成するタスクの 1 つを達成する一連のステップ
3.1.51
量子化値
量子化手順で使用される整数値
3.1.52
クオンタイズ
DCT係数の量子化手順を実行する行為
3.1.53
残差復号化パス
残差データ ボックスと残差精査スキャン ボックスに含まれるエントロピー符号化データに、このデータがベース イメージとマージされて最終的な出力イメージを形成するポイントまで適用される操作の集合。
3.1.54
残像
延長イメージ
残差スキャンおよび残差精緻化スキャンによって記述されたエントロピー復号化係数に適用される逆量子化および逆 DCT 変換によって再構築されたサンプル値
3.1.55
残留スキャン
高ダイナミック レンジまたは広色域データの再生を可能にする、従来のスキャンの加法的および/または乗法的補正データを提供する、従来のデコーダには見えない画像データに対する追加のパス
3.1.56
精緻化スキャン
DCT変換された係数の精度を拡張するために追加の最下位ビットを提供するレガシーデコーダには見えない画像データの追加パス
3.1.57
サンプル
コンポーネントを構成する 2 次元画像配列の 1 つの要素
3.1.58
サンプルグリッド
画像のすべてのサンプルに共通の座標系
注記 1:画像の左上端にあるサンプルの座標は (0,0) で、最初の座標は右に向かって増加し、2 番目の座標は下に向かって増加します。
3.1.59
スキャン
画像内の 1 つ以上のコンポーネントのデータを 1 回通過する
3.1.60
ヘッダーをスキャン
スキャンの開始マーカーと、スキャンの開始時にコード化される関連するスキャン パラメータを含むマーカー セグメント。
3.1.61
スーパーボックス
他のボックスをペイロード データとして運ぶボックス
3.1.62
テーブル仕様データ
エンコーダとデコーダで使用されるテーブルが生成され、それらの宛先が指定されるコード化表現
3.1.63
(一様) 量子化
圧縮を実現するために DCT 係数を線形にスケーリングする手順
3.1.64
アップサンプリング
コンポーネントの空間分解能を上げる手順
3.1.65
垂直サンプリング係数
フレーム内の他のコンポーネントの垂直データ ユニットの数に対する、特定のコンポーネントの垂直データ ユニットの相対数
3.1.66
ゼロバイト
0x00 バイト
3.1.67
ジグザグ シーケンス
(ほぼ) 最低の空間周波数から最高の空間周波数までの DCT 係数の特定の順序付け
3.2 アイコン
| X | 位置のサンプル グリッドの幅 |
| Y | 位置のサンプル グリッドの高さ |
| nf | 画像内のコンポーネント数 |
| 六 | 水平方向成分のサブサンプリング係数 |
| シ、イ | 垂直方向成分のサブサンプリング係数 |
| i | フレーム ヘッダーのコンポーネントのサブサンプリング インジケータ |
| i | フレーム ヘッダーのコンポーネントのサブサンプリング インジケータ |
| v x,y | サンプル グリッド位置 x,y でのサンプル値 |
| R h | 従来のデコード パスでリファインメント スキャンによって表される DCT 係数ビットの追加数である 8+R hは、従来のデコード パスでの逆 DCT プロセスの出力の非分数ビット (つまり、「バイナリ ドット」の前のビット) の数です。レガシーデコードパス。 |
| r | 残差デコーディング パスのリファインメント スキャンによって表される DCT 係数ビットの追加数. P+R rは、残差デコーディング パスの逆 DCT プロセスの出力の非分数ビットの数です。ここで、P はフレーム精度です。残差コード ストリームのフレーム ヘッダーに記録されている残差画像。 |
| R b | HDR 画像の追加ビット。 8+Rb は、再構成された HDR 画像のサンプル精度です。 |
3.3 略語
ISO/IEC 18477 のこの部分では、次の略語が適用されます。
| アスキー | 情報交換用米国標準コード |
| LSB | 最下位ビット |
| MSB | 上位ビット |
| HDR | 高ダイナミックレンジ |
| IDR | 中ダイナミックレンジ |
| LDR | 低ダイナミックレンジ |
| TMO | トーン マッピング オペレータ |
| DCT | 離散コサイン変換 |
参考文献
| [1] | ISO/IEC 10646-1, 情報技術 — Universal multiple-octet coded character set (UCS) — 1: アーキテクチャと基本的な多言語面 |
| [2] | ISO/IEC/IEEE 60559, 情報技術 - マイクロプロセッサ システム - 浮動小数点演算 |
| [3] | IEC 61966-2-1, マルチメディア システムおよび機器 — 色の測定と管理 — 2-1: カラーマネジメント — デフォルトの RGD 色空間 — sRGB |
| [4] | Rec. ITU-T T.86 | ISO/IEC 10918‑4, 情報技術 — 連続階調静止画像のデジタル圧縮およびコーディング — JPEG プロファイル、SPIFF プロファイル、SPIFF タグ、SPIFF 色空間、APPn マーカー、SPIFF 圧縮タイプ、および登録機関の登録 |
| [5] | Rec. ITU-T T.871 | ISO/IEC 10918‑5, 情報技術 — 連続階調静止画像のデジタル圧縮およびコーディング — JPEG ファイル交換フォーマット |
3 Terms and definitions, abbreviated terms, and symbols
3.1 Terms and definitions
For the purposes of this document, the following definitions apply.
3.1.1
AC coefficient
any DCT coefficient for which the frequency is not zero in at least one dimension
3.1.2
ASCII encoding
encoding of text characters and text strings according to ISO/IEC 10646-1
3.1.3
base decoding path
process of decoding legacy codestream and refinement data to the base image, jointly with all further steps until residual data is added to the values obtained from the residual codestream
3.1.4
base image
collection of sample values obtained by entropy decoding the DCT coefficients of the legacy codestream and the refinement codestream, and inversely DCT transforming them jointly
3.1.5
binary decision
choice between two alternatives
3.1.6
bitstream
partially encoded or decoded sequence of bits comprising an entropy-coded segment
3.1.7
block
8 × 8 array of samples or an 8 × 8 array of DCT coefficient values of one component
3.1.8
box
structured collection of data describing the image or the image decoding process embedded into one or multiple APP11 marker segments
Note 1 to entry: See ISO/IEC 18477-3:2015, Annex B for the definition of boxes.
3.1.9
byte
group of 8 bits
3.1.10
coder
embodiment of a coding process
3.1.11
coding
encoding or decoding
3.1.12
coding model
procedure used to convert input data into symbols to be coded
3.1.13
(coding) process
general term for referring to an encoding process, a decoding process, or both
3.1.14
compression
reduction in the number of bits used to represent source image data
3.1.15
component
two-dimensional array of samples having the same designation in the output or display device
Note 1 to entry: An image typically consists of several components, e.g. red, green, and blue.
3.1.16
continuous-tone image
image whose components have more than one bit per sample
3.1.17
DC coefficient
DCT coefficient for which the frequency is zero in both dimensions
3.1.18
decoder
embodiment of a decoding process
3.1.19
decoding process
process which takes as its input compressed image data and outputs a continuous-tone image
3.1.20
dequantization
inverse procedure to quantization by which the decoder recovers a representation of the DCT coefficients
3.1.21
discrete cosine transform
DCT
either the forward discrete cosine transform or the inverse discrete cosine transform
3.1.22
downsampling
procedure by which the spatial resolution of a component is reduced
3.1.23
encoder
embodiment of an encoding process
3.1.24
encoding process
process which takes as its input a continuous-tone image and outputs compressed image data
3.1.25
entropy-coded (data) segment
independently decodable sequence of entropy encoded bytes of compressed image data
3.1.26
entropy decoder
embodiment of an entropy decoding procedure
3.1.27
entropy decoding
lossless procedure which recovers the sequence of symbols from the sequence of bits produced by the entropy encoder
3.1.28
entropy encoder
embodiment of an entropy encoding procedure
3.1.29
entropy encoding
lossless procedure which converts a sequence of input symbols into a sequence of bits such that the average number of bits per symbol approaches the entropy of the input symbols
3.1.30
grayscale image
continuous-tone image that has only one component
3.1.31
high dynamic range
image or image data comprised of more than eight bits per sample
3.1.32
Huffman decoder
embodiment of a Huffman decoding procedure
3.1.33
Huffman decoding
entropy decoding procedure which recovers the symbol from each variable length code produced by the Huffman encoder
3.1.34
Huffman encoder
embodiment of a Huffman encoding procedure
3.1.35
Huffman encoding
entropy encoding procedure which assigns a variable length code to each input symbol
3.1.36
intermediate dynamic range
image or image data comprised of more than eight bits per sample
3.1.37
joint photographic experts group
JPEG
informal name of the committee which created this part of ISO/IEC 18477
Note 1 to entry: The “joint” comes from the ITU-T and ISO/IEC collaboration.
3.1.38
legacy codestream
collection of markers and syntax elements defined by Rec. ITU-T T.81 | ISO/IEC 10918-1 bare any additional syntax elements defined by the family ISO/IEC 18477 standards, i.e. the legacy codestream consists of the collection of all markers except those APP11 markers that describe JPEG XT boxes by the syntax defined in ISO/IEC 18477-3:2015, Annex A
3.1.39
legacy decoding path
collection of operations to be performed on the entropy coded data as described by Rec. ITU-T T.81 | ISO/IEC 10918-1 jointly with the Legacy Refinement scans before this data is merged with the residual data to form the final output image
3.1.40
legacy decoder
embodiment of a decoding process conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1, confined to the lossy DCT process and the baseline, sequential, or progressive modes, decoding at most four components to eight bits per component
3.1.41
legacy image
arrangement of sample values as described by applying the decoding process described by Rec. ITU-T T.81 | ISO/IEC 10918-1 on the entropy coded data as defined by said standard
3.1.42
lossless
descriptive term for encoding and decoding processes and procedures in which the output of the decoding procedure(s) is identical to the input to the encoding procedure(s)
3.1.43
lossless coding
mode of operation which refers to any one of the coding processes defined in this part of ISO/IEC 18477 in which all of the procedures are lossless
Note 1 to entry: See ISO/IEC 18477-8.
3.1.44
lossy
descriptive term for encoding and decoding processes which are not lossless
3.1.45
low dynamic range
image or image data comprised of data with no more than eight bits per sample
3.1.46
marker
two-byte code in which the first byte is hexadecimal FF and the second byte is a value between 1 and hexadecimal FE
3.1.47
marker segment
marker together with its associated set of parameters
3.1.48
pixel
collection of sample values in the spatial image domain having all the same sample coordinates, e.g. a pixel may consist of three samples describing its red, green, and blue value
3.1.49
precision
number of bits allocated to a particular sample or DCT coefficient
3.1.50
procedure
set of steps which accomplishes one of the tasks which comprise an encoding or decoding process
3.1.51
quantization value
integer value used in the quantization procedure
3.1.52
quantize
act of performing the quantization procedure for a DCT coefficient
3.1.53
residual decoding path
collection of operations applied to the entropy coded data contained in the residual data box and residual refinement scan boxes up to the point where this data is merged with the base image to form the final output image
3.1.54
residual image
extension image
sample values as reconstructed by inverse quantization and inverse DCT transformation applied to the entropy-decoded coefficients described by the residual scan and residual refinement scans
3.1.55
residual scan
additional pass over the image data invisible to legacy decoders which provides additive and/or multiplicative correction data of the legacy scans to allow reproduction of high dynamic range or wide colour gamut data
3.1.56
refinement scan
additional pass over the image data invisible to legacy decoders which provides additional least significant bits to extend the precision of the DCT transformed coefficients
3.1.57
sample
one element in the two-dimensional image array which comprises a component
3.1.58
sample grid
common coordinate system for all samples of an image
Note 1 to entry: The samples at the top left edge of the image have the coordinates (0,0), the first coordinate increases towards the right, the second towards the bottom.
3.1.59
scan
single pass through the data for one or more of the components in an image
3.1.60
scan header
marker segment that contains a start-of-scan marker and associated scan parameters that are coded at the beginning of a scan
3.1.61
superbox
box that carries other boxes as payload data
3.1.62
table specification data
coded representation from which the tables used in the encoder and decoder are generated and their destinations specified
3.1.63
(uniform) quantization
procedure by which DCT coefficients are linearly scaled in order to achieve compression
3.1.64
upsampling
procedure by which the spatial resolution of a component is increased
3.1.65
vertical sampling factor
relative number of vertical data units of a particular component with respect to the number of vertical data units in the other components in the frame
3.1.66
zero byte
0x00 byte
3.1.67
zig-zag sequence
specific sequential ordering of the DCT coefficients from (approximately) lowest spatial frequency to highest
3.2 Symbols
| X | Width of the sample grid in positions |
| Y | Height of the sample grid in positions |
| Nf | Number of components in an image |
| si,x | Subsampling factor of component in horizontal direction |
| si,y | Subsampling factor of component in vertical direction |
| Hi | Subsampling indicator of component in the frame header |
| Vi | Subsampling indicator of component in the frame header |
| vx,y | Sample value at the sample grid position x,y |
| Rh | Additional number of DCT coefficient bits represented by refinement scans in the legacy decoding path, 8+Rh is the number of non-fractional bits (i.e. bits in front of the “binary dot”) of the output of the inverse DCT process in the legacy decoding path. |
| Rr | Additional number of DCT coefficient bits represented by refinement scans in the residual decoding path. P+Rr is the number of non-fractional bits of the output of the invers DCT process in the residual decoding path, where P is the frame-precision of the residual image as recorded in the frame header of the residual codestream. |
| Rb | Additional bits in the HDR image. 8+Rb is the sample precision of the reconstructed HDR image. |
3.3 Abbreviated terms
For the purposes of this part of ISO/IEC 18477, the following abbreviated terms apply.
| ASCII | American Standard Code for Information Interchange |
| LSB | Least Significant Bit |
| MSB | Most Significant Bit |
| HDR | High Dynamic Range |
| IDR | Intermediate Dynamic Range |
| LDR | Low Dynamic Range |
| TMO | Tone Mapping Operator |
| DCT | Discrete Cosine Transformation |
Bibliography
| [1] | ISO/IEC 10646-1, Information Technology — Universal multiple-octet coded character set (UCS) — 1: Architecture and basic multilingual plane |
| [2] | ISO/IEC/IEEE 60559, Information technology — Microprocessor systems — Floating-point arithmetic |
| [3] | IEC 61966-2-1, Multimedia systems and equipment — Colour measurement and management — 2-1: Colour management — default RGD colour space —sRGB |
| [4] | Rec. ITU-T T.86 | ISO/IEC 10918‑4, Information technology — Digital compression and coding of continuous-tone still images — Registration of JPEG profiles, SPIFF profiles, SPIFF tags, SPIFF colour spaces, APPn markers, SPIFF compression types, and Registration Authorities |
| [5] | Rec. ITU-T T.871 | ISO/IEC 10918‑5, Information technology — Digital compression and coding of continuous-tone still images — JPEG File Interchange Format |