※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。
国際規格は、ISO/IEC 指令で指定された規則に従って起草されます。 2.
合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。
このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。
ISO/IEC 23002-2 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。
ISO/IEC 23002 は、次の部分で構成されており、一般的なタイトルは「情報技術 — MPEG ビデオ技術」です。
- Part 1: 整数出力 8×8逆離散コサイン変換Part実装の精度要件
- Part 2: 固定小数点8×8逆離散コサイン変換と離散コサイン変換
- Part 3: 補助ビデオと補足情報の表現
序章
多くのビジュアル コーディング関連の仕様 (文献目録の参考文献 [1] から [6] を参照) には、逆変換を生成するために整数出力 8×8 逆離散コサイン変換 (IDCT) を実装するためのデコーダの要件が含まれています。 -2 B から (2 B )–1 までの公称範囲を持つ変換されたサンプル、または -2 Bから (2 B )–1 までの公称範囲を持つサンプル差、ビットBの整数数、ここでBは より大きい8に等しい。
ISO/IEC 23002 のこの部分には、次の利点があります。
- – IDCT の例 (および順方向 DCT の例) の近似方法を提供し、デコーダとエンコーダの設計における実装コミュニティを容易にします。
- –関連するビデオおよび画像コーディング仕様 (参考文献の参考文献 [2] から [6] にリストされているものなど) に完全に準拠してデコーダが実装されていることを確認するのに役立ちます。指定された方法を使用するように設計されたデコーダーは、関連する画像およびビデオ コーディング規格の IDCT 適合要件に準拠することが保証されます。
- –画像またはビデオのデコード プロセスの出力として単一の決定論的結果を指定し、ビデオ分析ツールが正確に予測可能な結果でデコードされたビデオを操作できるようにします。これにより、たとえば、ビデオ ターゲット検出器、セグメンテーション マスク オペレーター、またはデコードされたビデオで動作するその他の分類、分析、または後処理プロセスから正確にどのような結果が得られるかについて、ソース マテリアル プロバイダーに保証が提供されます。このような確実性は、決定論的に指定されたデコード結果なしでは達成できません。
- で指定された IDCT 近似のエンコード プロセスを対象とするように設計されたエンコーダーは、これに準拠するすべてのデコーダーで、デコード プロセスにエンコーダー デコーダー ドリフト エラーがないことを保証できるため、配信されるビデオおよび画像表現の品質を向上させることができます。 ISO/IEC 23002 の一部。
1 スコープ
ISO/IEC 23002 のこの部分は、ISO/IEC 23002-1 で指定された精度要件 (参考文献の参考文献 [7] を参照) に完全に準拠し、さらに以下を満たす整数出力 8×8 IDCT の特定の実装を指定します。多数の国際的なビデオ コーディング標準で IDCT 精度に指定されているすべての精度要件を上回っています (参考文献の参考文献 [2] から [6] を参照)さらに、同じ因数分解構造に基づく整数出力 8×8 フォワード DCT の (非規範的な) 仕様を提供します。
2 用語と定義
このドキュメントでは、次の用語と定義が適用されます。
2.1
配列
スカラー値 のインデックス付きコレクション
2.2
離散コサイン変換
DCT
附属書 A で指定されたプロセスによって生成されたものと同様の結果を持つ サンプル の入力行列から 変換係数 の出力 行列 を生成する変換。
2.3
定点
基数点の後に固定桁数を持つ数値表現
注記1基数点の後の桁数がゼロである整数表現と同等。
2.4
順離散コサイン変換
フォワードDCT
離散コサイン変換
注記用語に「前方」という言葉を含めることは、 逆離散コサイン変換 の概念との対比を強調する意図がある場合に使用される。
2.5
逆離散コサイン変換
IDCT
変換 係数 の入力行列から サンプル の出力 行列 を生成し、箇条 5 で指定されたプロセスによって生成されたものと同様の結果を生成する変換。
2.6
マトリックス
2 次元インデックスの 配列
2.7
サンプル
離散コサイン変換 の入力または 逆離散コサイン変換 の出力である 行列 のエントリ
2.8
スカラー値
整数または実数値
2.9
変換係数
順離散コサイン変換 の出力または 逆離散コサイン変換 の入力である 行列 のエントリ
参考文献
| [1] | ISO/IEC 10918-1:1994, 情報技術 — 連続階調静止画像のデジタル圧縮とコーディング: 要件とガイドライン |
| [2] | ISO/IEC 11172-2:1993, 情報技術 — 約 1.5 Mbits/s までのデジタル ストレージ メディア用の動画および関連するオーディオのコーディング — 2: 動画 |
| [3] | ISO/IEC 13818-2:2000, 情報技術 — 動画および関連する音声情報の一般的なコーディング: ビデオ |
| [4] | ISO/IEC 14496-2:2004, 情報技術 — 視聴覚オブジェクトのコーディング — 2: ビジュアル |
| [5] | ITU-T 勧告 H.26, px 64 kbit/s の視聴覚サービス用ビデオ コーデック |
| [6] | ITU-T 勧告 H.26, 低ビット レート通信のビデオ符号化 |
| [7] | ISO/IEC 23002-1:2006, 情報技術 — MPEG ビデオ技術 — 1: 整数出力8×8逆離散コサイン変換を実装するための精度要件 |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, 2.
The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.
ISO/IEC 23002-2 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.
ISO/IEC 23002 consists of the following parts, under the general title Information technology — MPEG video technologies:
- Part 1: Accuracy requirements for implementation of integer-output 8×8 inverse discrete cosine transform
- Part 2: Fixed-point 8×8 inverse discrete cosine transform and discrete cosine transform
- Part 3: Representation of auxiliary video and supplemental information
Introduction
A number of visual-coding-related specifications (see Ref. [1] to [6] in the Bibliography) include a requirement for decoders to implement an integer-output 8×8 inverse discrete cosine transform (IDCT) for the generation of inverse-transformed samples with a nominal range from 0 to (2 B )–1, or sample differences with a nominal range from –2 B to (2 B )–1, for some integer number of bits B , where B is greater than or equal to 8.
This part of ISO/IEC 23002 provides the following benefits.
- – It provides an example IDCT (and also an example forward DCT) approximation method to ease the implementation community in their design of decoders and encoders.
- – It can help to ensure that decoders are implemented in full conformance with relevant video and image coding specifications (such as those listed in Refs. [2] to [6] in the Bibliography). Decoders that are designed to use the specified method will be assured to conform to the IDCT conformance requirements of the relevant image and video coding standards.
- – It specifies a single deterministic result as the output of an image or video decoding process, such that video analysis tools can operate on decoded video with precisely predictable results. This provides the assurance to source material providers, for example, of exactly what results will be obtained from a video target detector, segmentation mask operator, or other classification, analysis, or post-processing process that operates on the decoded video. Such certainty is not achievable without a deterministically-specified decoding result.
- – It can improve the quality of delivered video and image representations, as encoders designed to target their encoding process for the IDCT approximation specified herein can be assured that the decoding process will be free of encoder-decoder drift error on all decoders that conform to this part of ISO/IEC 23002.
1 Scope
This part of ISO/IEC 23002 specifies a particular implementation of an integer-output 8×8 IDCT that fully conforms to the accuracy requirements specified in ISO/IEC 23002-1 (see Ref. [7] in the Bibliography) and additionally meets or exceeds all accuracy requirements specified for IDCT precision in a number of international video coding standards (see Ref. [2] to [6] in the Bibliography). It additionally provides a (non-normative) specification of an integer-output 8×8 forward DCT based on the same factorization structure.
2 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
2.1
array
indexed collection of scalar values
2.2
discrete cosine transform
DCT
transformation that produces an output matrix of transform coefficients from an input matrix of samples with results similar to those produced by the process specified in Annex A
2.3
fixed-point
numerical representation that has a fixed number of digits after the radix point
Note 1 to entry: Equivalent to an integer representation herein, for which the number of digits after the radix point is zero.
2.4
forward discrete cosine transform
forward DCT
discrete cosine transform
Note 1 to entry: Inclusion of the word “forward” in the term is used when a contrast with the concept of an inverse discrete cosine transform is intended to be emphasized.
2.5
inverse discrete cosine transform
IDCT
transformation that produces an output matrix of samples from an input matrix of transform coefficients with results similar to those produced by the process specified in Clause 5
2.6
matrix
array with a two-dimensional index
2.7
sample
entry in a matrix that is the input of a discrete cosine transform or the output of an inverse discrete cosine transform
2.8
scalar value
integer or a real-valued number
2.9
transform coefficient
entry in a matrix that is the output of a forward discrete cosine transform or the input of an inverse discrete cosine transform
Bibliography
| [1] | ISO/IEC 10918-1:1994, Information technology — Digital compression and coding of continuous-tone still images: Requirements and guidelines |
| [2] | ISO/IEC 11172-2:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbits/s — 2: Video |
| [3] | ISO/IEC 13818-2:2000, Information technology — Generic coding of moving pictures and associated audio information: Video |
| [4] | ISO/IEC 14496-2:2004, Information technology — Coding of audio-visual objects — 2: Visual |
| [5] | ITU-T Recommendation H.261 (1993), Video codec for audiovisual services at p x 64 kbit/s |
| [6] | ITU-T Recommendation H.263 (2005), Video coding for low bit rate communication |
| [7] | ISO/IEC 23002-1:2006, Information technology — MPEG video technologies — 1: Accuracy requirements for implementation of integer-output 8×8 inverse discrete cosine transform |