※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。
国際規格は、ISO/IEC 指令で指定された規則に従って起草されます。 2.
合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。
このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。
ISO/IEC 23002-1 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。
ISO/IEC 23002 は、次の部分で構成されており、一般的なタイトルは「情報技術 — MPEG ビデオ技術」です。
- Part 1: 整数出力 8x8 逆離散コサイン変換を実装するための精度要件
次の部分は準備中です。
- Part 3: 補助ビデオ データの表現
1 スコープ
多くの画像およびビデオ コーディング関連の標準 (参考文献を参照) には、-2 B ~ (2 B )–1 はビットBの整数で、 Bは 8 以上です。ISO/IEC 23002 のこの部分では、このような整数出力 IDCT 実装で十分な精度を確立するための適合要件を指定しています。これは、IDCT の使用を必要とする他の規格に適合するための IDCT 精度の部分的または完全な要件を確立するための参照に適していることを意図しています。
ISO/IEC 23002 のこの部分の本体で指定されている精度要件は、[7], [1] の附属書 A, および [5] の附属書 A で以前に指定されたものと本質的に同じです。これらの要件は、撤回後の MPEG 標準における [7] への規範的参照を解決し、IDCT 精度要件の仕様をより明確にするために指定されています。
符号化されたビットストリームのイントラ リフレッシュ頻度に関する追加の要件も [7] で以前に指定されており、各マクロブロックが予測ピクチャでコード化される 132 回の各シリーズ内で少なくとも 1 回イントラ符号化されるというビットストリーム適合性の要件を確立します。イントラピクチャの介在。この追加要件は、ISO/IEC 23002 のこの部分では指定されていません。これは、その範囲をデコーダー適合仕様のドメインに限定するためです。
ISO/IEC 23002 のこの部分では、指定された精度の精度要件を変更するためのいくつかの許容範囲が設けられています。参照仕様によって呼び出される可能性のある追加の要件は、附属書 A および B で指定されています。
2 用語と定義
このドキュメントでは、次の用語と定義が適用されます。
2.1
配列
スカラー値のインデックス付きコレクション
注記 1角括弧は、配列の指標付けを示すために使用されます。たとえば、 s [5] は、配列s のインデックス 5 のエントリを示します。
2.2
離散コサイン変換
DCT
5.1または5.2で指定されたプロセスの近似を使用して、サンプルの入力行列から変換係数の出力行列を生成する変換。
2.3
順離散コサイン変換
離散コサイン変換
注記1用語に「前方」という語を追加したのは,逆離散コサイン変換の概念との対比を強調する意図がある場合に使用される
2.4
逆離散コサイン変換
IDCT
5.3または5.4で指定されたプロセスの近似を使用して、変換係数の入力マトリックスからサンプルの出力マトリックスを生成する変換。
2.5
マトリックス
2 次元インデックスの配列
注記 1:行列が空間サンプリング グリッドのサンプルを表す場合、指数の最初 (最も左) の成分は指数の垂直成分であると見なされ、指数の 2 番目 (最も右) の成分は次のようになります。インデックスの水平成分と見なされます。たとえば、サンプルの行列fのエントリf [3] [5] は、垂直位置 3 および水平位置 5 のエントリを示します。行列が変換係数を表す場合、インデックスの最初の (左端の) コンポーネントが考慮されます。垂直周波数インデックスを表し、インデックスの 2 番目 (最も右) のコンポーネントは水平周波数インデックスを表すと見なされます。たとえば、変換係数の行列FのエントリF [3] [5] は、垂直周波数インデックス 3 と水平周波数インデックス 5 を持つエントリを示します。
2.6
サンプル
離散コサイン変換の入力または逆離散コサイン変換の出力である行列のエントリ
注記 1サンプルはスカラー値である。
2.7
スカラー値
整数または実数値
2.8
変換係数
順離散コサイン変換の出力または逆離散コサイン変換の入力である行列のエントリ
注記 1変換係数はスカラー値である。
参考文献
| [1] | ITU-T 勧告 H.26, px64 kbit/s の視聴覚サービス用ビデオ コーデック。 |
| [2] | ITU-T 勧告 T.81 (1992) | ISO/IEC 10918-1:1994, 情報技術 — 連続階調静止画像のデジタル圧縮とコーディング: 要件とガイドライン。 |
| [3] | ISO/IEC 11172-2:1993, 情報技術 — 約 1.5 Mbits/s までのデジタル ストレージ メディア用の動画および関連するオーディオのコーディング — 2: ビデオ。 |
| [4] | ITU-T 勧告 H.262 (2000) | ISO/IEC 13818-2:2000, 情報技術 — 動画および関連する音声情報の一般的なコーディング: ビデオ。 |
| [5] | ITU-T Rec. H.26, 低ビット レート通信のビデオ コーディング。 |
| [6] | ISO/IEC 14496-2:2004, 情報技術 — 視聴覚オブジェクトのコーディング — 2: ビジュアル。 |
| [7] | IEEE 1180-199, 8x8 逆離散コサイン変換の実装に関する IEEE 標準仕様。 |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, 2.
The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.
ISO/IEC 23002-1 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information Technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.
ISO/IEC 23002 consists of the following parts, under the general title Information technology — MPEG video technologies:
- Part 1: Accuracy requirements for implementation of integer-output 8x8 inverse discrete cosine transform
The following part is under preparation:
- Part 3: Auxiliary video data representation
1 Scope
A number of image and video coding related standards (see Bibliography) include a requirement for decoders to implement an integer-output 8x8 inverse discrete cosine transform (IDCT) for the generation of inverse-transformed sample differences with a nominal range from –2 B to (2 B )–1 for some integer number of bits B, where B is greater than or equal to 8. This part of ISO/IEC 23002 specifies conformance requirements for establishing sufficient accuracy in such an integer-output IDCT implementation. It is intended to be suitable for reference to establish partial or complete requirements for IDCT accuracy for conformance to other standards that require IDCT use.
The accuracy requirements specified in the main body of this part of ISO/IEC 23002 are essentially the same as those previously specified in [7], in Annex A of [1], and in Annex A of [5]. These requirements have been specified herein to resolve normative references to [7] in MPEG standards after its withdrawal and to provide improved clarity for the specification of IDCT accuracy requirements.
An additional requirement on encoded-bitstream intra refresh frequency was also previously specified in [7], establishing a requirement of bitstream conformance that each macroblock be intra-coded at least once within each series of 132 times that it is coded in a predicted picture without an intervening intra picture. That additional requirement is not specified in this part of ISO/IEC 23002, in order to confine its scope to the domain of decoder conformance specification.
Some allowances for modification of the specified accuracy requirements are made within this part of ISO/IEC 23002. Additional accuracy requirements that may be invoked by a referencing specification are specified in Annexes A and B.
2 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
2.1
array
indexed collection of scalar values
Note 1 to entry: Square parentheses are used to indicate the indexing of arrays. For example, s [5] denotes the entry at index 5 in the array s.
2.2
discrete cosine transform
DCT
transformation that produces an output matrix of transform coefficients from an input matrix of samples using some approximation of the process specified in 5.1 or 5.2
2.3
forward discrete cosine transform
discrete cosine transform
Note 1 to entry: The addition of the word “forward” in the term is used when a contrast with the concept of an inverse discrete cosine transform is intended to be emphasized
2.4
inverse discrete cosine transform
IDCT
transformation that produces an output matrix of samples from an input matrix of transform coefficients using some approximation of the process specified in 5.3 or 5.4
2.5
matrix
array with a two-dimensional index
Note 1 to entry: When the matrix represents samples in a spatial sampling grid, the first (left-most) component of the index is considered to be the vertical component of the index and the second (right-most) component of the index is considered to be the horizontal component of the index. For example, entry f [3] [5] in a matrix f of samples would denote the entry at vertical position 3 and horizontal position 5. When the matrix represents transform coefficients, the first (left-most) component of the index is considered to represent a vertical frequency index and the second (right-most) component of the index is considered to represent a horizontal frequency index. For example, entry F [3] [5] in a matrix F of transform coefficients would denote the entry with vertical frequency index 3 and horizontal frequency index 5.
2.6
sample
entry in a matrix that is the input of a discrete cosine transform or the output of an inverse discrete cosine transform
Note 1 to entry: A sample is a scalar value.
2.7
scalar value
integer or real-valued number
2.8
transform coefficient
entry in a matrix that is the output of a forward discrete cosine transform or the input of an inverse discrete cosine transform
Note 1 to entry: A transform coefficient is a scalar value.
Bibliography
| [1] | ITU-T Recommendation H.261 (1993), Video codec for audiovisual services at px64 kbit/s. |
| [2] | ITU-T Rec. T.81 (1992) | ISO/IEC 10918-1:1994, Information technology — Digital compression and coding of continuous-tone still images: Requirements and guidelines. |
| [3] | ISO/IEC 11172-2:1993, Information technology — Coding of moving picture and associated audio for digital storage media at up to about 1,5 Mbits/s — 2: Video. |
| [4] | ITU-T Rec. H.262 (2000) | ISO/IEC 13818-2:2000, Information technology — Generic coding of moving pictures and associated audio information: Video. |
| [5] | ITU-T Rec. H.263 (2000), Video coding for low bit rate communication. |
| [6] | ISO/IEC 14496-2:2004, Information technology — Coding of audio-visual objects — 2: Visual. |
| [7] | IEEE 1180-1990 (withdrawn), IEEE standard specifications for the implementations of 8x8 inverse discrete cosine transform. |