※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。
情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。
技術委員会の主な任務は、国際規格を作成することですが、例外的な状況では、技術委員会は、次のいずれかのタイプの技術レポートの発行を提案する場合があります。
- タイプ 1: 国際規格の発行に必要なサポートが得られない場合、何度も努力したにもかかわらず、
- タイプ 2, 主題がまだ技術開発中である場合、またはその他の理由により、国際規格に関する合意の可能性はあるが、すぐには実現できない場合。
- タイプ 3 は、技術委員会が、国際規格として通常公開されているものとは異なる種類のデータを収集した場合 (たとえば、「最新技術」)
タイプ 1 およびタイプ 2 のテクニカル レポートは、発行から 3 年以内に審査され、国際規格に変換できるかどうかが決定されます。タイプ 3 のテクニカル レポートは、それらが提供するデータがもはや有効または有用でないと見なされるまで、必ずしもレビューする必要はありません。
タイプ 3 のテクニカル レポートである ISO/IEC TR 11172-5 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。
ISO/IEC 11172 は、一般的なタイトルである情報技術 — 約 1.5 Mbit/ 秒までのデジタル ストレージ メディア用の動画および関連するオーディオのコーディング:
- Part 1: システム
- Part 2: ビデオ
- Part 3: オーディオ
- Part 4: コンプライアンス テスト
- Part 5: ソフトウェア シミュレーション
序章
目的
この技術報告書は、デジタル記憶媒体、テレビ放送、通信などのさまざまな用途において、動画像およびそれに付随する音声の汎用的な符号化方法に対するニーズの高まりに応えて作成されました。この仕様の使用は、モーション ビデオがコンピュータ データの形式として操作され、さまざまなストレージ メディアに保存され、既存および将来のネットワークを介して送受信され、既存および将来の放送チャネルで配信されることを意味します。
1 スコープ
このテクニカル レポートでは、エンコーダおよびデコーダの C 言語ソフトウェア シミュレーションを提供します。 1(システム)、 , およびISO/IEC 11172 の 3 (オーディオ)
2 参考文献
CCIR の勧告と報告、1990 年第 17 回本会議、デュッセルドルフ、1990 年 第 XI 巻 - 1 放送サービス (テレビ) ITU-R Rec. BT.601-3, スタジオ向けデジタル テレビのエンコード パラメータ。
- CCIR ボリューム X および XI 3 ITU-R Rec. BR.648, 音声信号の記録。
- CCIR ボリューム X および XI 3 レポート ITU-R 955-2 範囲 500 ~ 3000Mhz の車両、携帯および固定受信機への衛星音声放送。
- ISO/IEC 11172-1:1993, 情報技術 — 最大約 1.5 Mbit/s のデジタル ストレージ メディア用の動画および関連する音声のコーディング - 1: システム。
- ISO/IEC 11172-2:1993, 情報技術 — 最大約 1.5 Mbit/s のデジタル ストレージ メディア用の動画および関連オーディオのコーディング - 2: ビデオ。
- ISO/IEC 11172-3:1993, 情報技術 — 最大約 1.5 Mbit/s のデジタル ストレージ メディア用の動画および関連する音声のコーディング - 3: オーディオ。
- ISO/IEC 11172-4:1995, 情報技術 — 約 1.5 Mbit/s までのデジタル ストレージ メディア用の動画および関連オーディオのコーディング — 4: コンプライアンス テスト。
- 8 x 8 逆離散コサイン変換の実装に関する IEEE 標準仕様、 IEEE Std 1180-1990, 1990 年 12 月 6 日。
- IEC 461:1986, ビデオ テープ レコーダーの時間および制御コード。
- IEC 908:1987, コンパクト ディスク デジタル オーディオ システム。
- ITU-T Rec. H.261 (以前の CCITT Rec. H.261) Codes for audiovisual services at px64 kbit/s, Geneva 1990.
- ITU-T 勧告 T.81 | ISO/IEC 10918-1:1994, 情報技術 — 連続階調静止画像のデジタル圧縮とコーディング: 要件とガイドライン。
3 つの定義
このテクニカル レポートの目的のために、ISO/IEC 11172-1, ISO/IEC 11172-2, および ISO/IEC 11172-3 に記載されている定義が適用されます。
参考文献
| 1 | Arun N Netravali & Barry G Haskell「デジタル画像、表現と圧縮」Plenum Press, 1988 |
| 2 | Didier Le Gall「MPEG: A Video Compression Standard for Multimedia Applications」h Trans. ACM, 1991 年 4 月 |
| 3 | C Loeffler, A Ligtenberg, GS Moschytz「Practical fast 1-D DCT algorithm with 11 multiplications」Proceedings IEEE ICASSP-89, Vol. 2, pp 988-991, 1989 年 2 月 |
| 4 | ITU-R Rec 601 (以前の CCIR Rec 601) の規範リファレンスを参照してください。 |
| 5 | IEC 標準出版物 461 の規範的参照を参照してください。 |
| 6 | ITU-T Rec. H.261 の規範リファレンスを参照してください。 |
| 7 | IEEE 標準仕様 P1180-1990 の規範的リファレンスを参照してください。 |
| 8位 | ISO/IEC 10918-1 | ITU-T T.81 (JPEG) |
| 9 | E Viscito および C Gonzales 著、「適応ビット割り当ておよび量子化によるビデオ圧縮アルゴリズム」、Proc SPIE Visual Communications and Image Proc '91, マサチューセッツ州ボストン、1991 年 11 月 10 ~ 15 日、Vol. 1605 205 |
| 10 | A Puri および R Aravind 共著、「適応知覚量子化による動き補償ビデオ コーディング」、IEEE Trans. on Circuits and Systems for Video Technology, Vol. 1 pp 351 Dec. 1991年 |
| 11 | C Gonzales と E Viscito による「柔軟にスケーラブルなデジタル ビデオ コーディング」。イメージコミュニケーションズ Vol.5 Nos. 1993年2月1-2日 |
| 12 | AWJohnson, T. Sikora and TK Tan, "Filters for Drift Reduction in Frequency Scalable Video Coding Schemes" <Electronic Letters への公開のために送信.> |
| 13 | R. Mokry および D. Anastassiou による「モーション補償 DCT コーディングの周波数スケーラビリティにおける最小エラー ドリフト」。ビデオ技術の回路とシステムに関する IEEE トランザクション、<出版が承認されました> |
| 14 | KN Ngan, J Arnold, T Sikora, TK Tan および AW Johnson.「MPEG-2 標準の周波数スケーラビリティ実験」。アジア太平洋通信会議、韓国、1993 年 8 月。 |
| 15 | T Sikora, TK Tan, および KN Ngan による「MPEG フレームワーク内の周波数ドメイン ピラミッド スケーラブル コーディング スキームのパフォーマンス比較」。 pro PCS, Picture Coding Symposium, ローザンヌ、pp. 16.1 - 16.2, スイス、1993 年 3 月。 |
| 16 | 岩橋正博、2:1 縮小動画の動き補償技術Ó。 8-14, 画像符号化シンポジウム'93. |
| 17 | Sikora, T. and Pang, K., Experimental with Optimal Block-Overlapping Filters for Cell Loss Concealment in Packet Video, Proc. IEEE Visual Signal Processing and Communications Workshop, メルボルン、1993 年 9 月 21 ~ 22 日、pp. 247 ~ 25 |
| 18 | A. Puri "Video Coding Using the MPEG-2 Compression Standard", <出演> Proc SPIE Visual Communications and Image Proc '93 Boston MA November, 1993. |
| 19 | A Puri and A Wong "Spatial Domain Resolution Scalable Video Coding", <出演予定> Proc SPIE Visual Communications and Image Proc '93 Boston MA November, 1993. |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.
In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
The main task of technical committees is to prepare International Standards, but in exceptional circumstances a technical committee may propose the publication of a Technical Report of one of the following types:
- type 1, when the required support cannot be obtained for the publication of an International Standard, despite repeated efforts;
- type 2, when the subject is still under technical development or where for any other reason there is the future but not immediate possibility of an agreement on an International Standard;
- type 3, when a technical committee has collected data of a different kind from that which is normally published as an International Standard ("state of the art", for example).
Technical Reports of types 1 and 2 are subject to review within three years of publication, to decide whether they can be transformed into International Standards. Technical Reports of type 3 do not necessarily have to be reviewed until the data they provide are considered to be no longer valid or useful.
ISO/IEC TR 11172-5, which is a Technical Report of type 3, was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.
ISO/IEC 11172 consists of the following parts, under the general title Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/'s:
- Part 1: Systems
- Part 2: Video
- Part 3: Audio
- Part 4: Compliance testing
- Part 5: Software simulation
Introduction
Purpose
This Technical Report was developed in response to the growing need for a generic coding method of moving pictures and of associated sound for various applications such as digital storage media, television broadcasting and communication. The use of this specification means that motion video can be manipulated as a form of computer data and can be stored on various storage media, transmitted and received over existing and future networks and distributed on existing and future broadcasting channels.
1 Scope
This Technical Report provides a C language software simulation of an encoder and decoder for 1 (Systems), 2 (Video), and 3 (Audio) of ISO/IEC 11172.
2 References
Recommendations and reports of the CCIR, 1990 XVIIth Plenary Assembly, Dusseldorf, 1990 Volume XI - 1 Broadcasting Service (Television) ITU-R Rec. BT.601-3, Encoding parameters of digital television for studios.
- CCIR Volume X and XI 3 ITU-R Rec. BR.648, Recording of audio signals.
- CCIR Volume X and XI 3 Report ITU-R 955-2 Satellite sound broadcasting to vehicular, portable and fixed receivers in the range 500 - 3000Mhz.
- ISO/IEC 11172-1:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - 1: Systems.
- ISO/IEC 11172-2:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - 2: Video.
- ISO/IEC 11172-3:1993, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - 3: Audio.
- ISO/IEC 11172-4:1995, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — 4: Compliance testing.
- IEEE Standard Specifications for the Implementations of 8 by 8 Inverse Discrete Cosine Transform, IEEE Std 1180-1990, December 6, 1990.
- IEC 461:1986, Time and control code for video tape recorders.
- IEC 908:1987, Compact disc digital audio system.
- ITU-T Rec. H.261 (Formerly CCITT Rec. H.261) Codes for audiovisual services at px64 kbit/s, Geneva 1990.
- ITU-T Rec. T.81 | ISO/IEC 10918-1:1994, Information technology — Digital compression and coding of continuous-tone still images: Requirements and guidelines.
3 Definitions
For the purposes of this Technical Report, the definitions given in ISO/IEC 11172-1, ISO/IEC 11172-2 and ISO/IEC 11172-3 apply.
Bibliography
| 1 | Arun N. Netravali & Barry G. Haskell"Digital Pictures, representation and compression" Plenum Press, 1988 |
| 2 | Didier Le Gall"MPEG: A Video Compression Standard for Multimedia Applications"h Trans. ACM, April 1991 |
| 3 | C Loeffler, A Ligtenberg, G S Moschytz"Practical fast 1-D DCT algorithms with 11 multiplications" Proceedings IEEE ICASSP-89, Vol. 2, pp 988-991, Feb. 1989 |
| 4 | See the Normative Reference for ITU-R Rec 601 (formerly CCIR Rec 601) |
| 5 | See the Normative Reference for IEC Standard Publication 461 |
| 6 | See the Normative Reference for ITU-T Rec. H.261 |
| 7 | See the Normative reference for IEEE Standard Specification P1180-1990 |
| 8 | ISO/IEC 10918-1 | ITU-T T.81 (JPEG) |
| 9 | E Viscito and C Gonzales"A Video Compression Algorithm with Adaptive Bit Allocation and Quantization", Proc SPIE Visual Communications and Image Proc '91 Boston MA November 10-15 Vol. 1605 205, 1991 |
| 10 | A Puri and R Aravind"Motion Compensated Video Coding with Adaptive Perceptual Quantization", IEEE Trans. on Circuits and Systems for Video Technology, Vol. 1 pp 351 Dec. 1991. |
| 11 | C. Gonzales and E. Viscito,"Flexibly scalable digital video coding". Image Communications, Vol. 5, Nos. 1-2, February 1993 |
| 12 | A.W.Johnson, T.Sikora and T.K. Tan,"Filters for Drift Reduction in Frequency Scalable Video Coding Schemes" <Transmitted for publication to Electronic Letters.> |
| 13 | R.Mokry and D.Anastassiou,"Minimal Error Drift in Frequency Scalability for Motion-Compensated DCT Coding". IEEE Transactions on Circuits and Systems for Video Technology, <accepted for publication> |
| 14 | K.N. Ngan, J. Arnold, T. Sikora, T.K. Tan and A.W. Johnson."Frequency Scalability Experiments for MPEG-2 Standard". Asia-Pacific Conference on Communications, Korea, August 1993. |
| 15 | T. Sikora, T.K. Tan and K.N. Ngan,"A Performance Comparison of Frequency Domain Pyramid Scalable Coding Schemes Within the MPEG Framework". Proc. PCS, Picture Coding Symposium, Lausanne, pp. 16.1 - 16.2, Switzerland March 1993. |
| 16 | Masahiro Iwahashi, Motion Compensation Technique for 2:1 Scaled-down Moving PicturesÓ. 8-14, Picture Coding Symposium '93. |
| 17 | Sikora, T. and Pang, K.,"Experiments with Optimal Block-Overlapping Filters for Cell Loss Concealment in Packet Video", Proc. IEEE Visual Signal Processing and Communications Workshop, Melbourne, 21-22 Sept. 1993, pp. 247-250. |
| 18 | A. Puri"Video Coding Using the MPEG-2 Compression Standard", <to appear> Proc SPIE Visual Communications and Image Proc '93 Boston MA November,1993. |
| 19 | A. Puri and A. Wong"Spatial Domain Resolution Scalable Video Coding", <to appear> Proc SPIE Visual Communications and Image Proc '93 Boston MA November,1993. |