ISO/IEC 11172-1:1993 情報技術—最大約1.5 Mbit / sでのデジタルストレージメディア用の動画および関連オーディオのコーディング—パート1:システム | ページ 2

この規格 プレビューページの目次

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。

情報技術の分野では、ISO と IEC は合同技術委員会 ISO/IEC JTC 1 を設立しました。合同技術委員会によって採択された国際規格の草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

国際標準 ISO/IEC 11172-1 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, 音声、画像、マルチメディア、およびハイパーメディア情報のコード化表現によって作成されました。

ISO/IEC 11172 は、一般的なタイトルである情報技術 — 約 1.5 Mbit/s までのデジタル ストレージ メディア用の動画および関連するオーディオのコーディング:

  • Part 1: システム
  • Part 2: ビデオ
  • Part 3: オーディオ
  • Part 4: コンプライアンス テスト

ISO/IEC 11172 のこの部分の附属書 A および B は、情報提供のみを目的としています。

序章

注 — MPEG システム層の概要に関心のある読者は、この序文を読んでから、条項 1 および 2 に戻る前に、付録 A に進む必要があります。 ISO/IEC 11172 の一部であるため、2.4 節、特にシステム ターゲット デコーダが記述されている 2.4.2 を参照することも役立つ場合があります。

システム仕様は、この国際規格のビデオおよびオーディオ部分からの 1 つまたは複数のデータ ストリームをタイミング情報と組み合わせて単一のストリームを形成する問題に対応しています。 1 つのストリームに結合されると、データはデジタル ストレージまたは送信に適した形式になります。このシステム仕様によって課せられる構文および意味規則により、さまざまなストリームの取得または受信条件の下で、デコーダ バッファのオーバーフローまたはアンダーフローを伴わずに同期再生が可能になります。システム仕様に規定されている構文規則と意味規則の範囲は異なります。構文規則はシステム層コーディングのみに適用され、ビデオおよびオーディオ仕様の圧縮層コーディングには適用されません。対照的に、セマンティック ルールは結合されたストリーム全体に適用されます。

システム仕様では、エンコーダまたはデコーダのアーキテクチャまたは実装は指定されていません。ただし、ビットストリーム プロパティは、エンコーダーとデコーダーに機能とパフォーマンスの要件を課します。たとえば、エンコーダーは最小クロック許容要件を満たす必要があります。この要件やその他の要件にもかかわらず、エンコーダとデコーダの設計と実装にはかなりの自由度が存在します。

ISO/IEC 11172 デコーダの機能を説明するために、プロトタイプのオーディオ/ビデオ デコーダ システムを図 1 に示します。アーキテクチャは一意ではありません -- デコーダのタイミング制御を含むシステム デコーダの機能は、エレメンタリ ストリーム デコーダとメディア固有のデコーダの間で均等に分散される可能性があります -- しかし、この図は議論に役立ちます。プロトタイプのデコーダー設計は、ISO/IEC 11172 デコーダーの設計に関する規範的な要件を意味するものではありません。実際、オーディオ/ビデオ以外のデータも許可されますが、表示されません。

図 1 —プロトタイプの ISO/IEC 11172 デコーダ

図 1 に示す典型的な ISO/IEC 11172 デコーダは、ISO/IEC 11172 のPart 1, 2, および 3 にそれぞれ準拠するシステム、ビデオ、およびオーディオ デコーダで構成されています。オーディオおよび/またはビデオ ストリームは、メディア固有の形式で、デジタル ストレージ メディア (DSM) またはネットワークに格納されていると想定されます。媒体固有の形式は、この国際標準によって管理されておらず、原型的な ISO/EEC 11172 デコーダの媒体固有のデコード部分でもありません。

プロトタイプのデコーダーは、ISO/IEC 11172 多重化ストリームを入力として受け入れ、システム デコーダーに依存してストリームからタイミング情報を抽出します。システム デコーダーはストリームを逆多重化し、そのように生成されたエレメンタリー ストリームはビデオおよびオーディオ デコーダーへの入力として機能し、その出力はデコードされたビデオおよびオーディオ信号です。設計には含まれていますが、図には示されていませんが、システム デコーダー、ビデオおよびオーディオ デコーダー、メディア固有のデコーダー間のタイミング情報のフローです。

ビデオとオーディオのデコーダーは、このタイミング情報を使用して相互に同期され、DSM とも同期されます。

ISO/IEC 11172 多重化ストリームは、システム層と圧縮層の 2 つの層で構成されます。システム デコーダーへの入力ストリームには、圧縮レイヤーにラップされたシステム レイヤーがあります。ビデオおよびオーディオ デコーダーへの入力ストリームには、圧縮レイヤーしかありません。

System Decoder によって実行される操作は、ISO/IEC 11172 多重化ストリーム全体 (「多重化全体の操作」) または個々のエレメンタリー ストリーム (「ストリーム固有の操作」) に適用されます。 ISO/IEC 11172 システム層は、マルチプレックス全体の操作 (パック層) とストリーム固有の操作 (パケット層) の 2 つのサブ層に分割されます。

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnlcal Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.

In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.

International Standard ISO/IEC 11172-1 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Sub-Committee SC 29, Coded representation of audio, picture, multimedia and hypermedia information.

ISO/IEC 11172 consists of the following parts, under the general title Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s:

  • Part 1: Systems
  • Part 2: Video
  • Part 3: Audio
  • Part 4: Compliance testing

Annexes A and B of this part of ISO/IEC 11172 are for information only.

Introduction

Note — Readers interested in an overview of the MPEG Systems layer should read this Introduction and then proceed to annex A, before returning to the clauses 1 and 2. Since the system target decoder concept is referred to throughout both the normative and informative clauses of this part of ISO/IEC 11172, it may also be useful to refer to clause 2.4, and particularly 2.4.2, where the system target decoder is described.

The systems specification addresses the problem of combining one or more data streams from the video and audio parts of this International Standard with timing information to form a single stream. Once combined into a single stream, the data are in a form well suited to digital storage or transmission. The syntactical and semantic rules imposed by this systems specification enable synchronized playback without overflow or underflow of decoder buffers under a wide range of stream retrieval or receipt conditions. The scope of syntactical and semantic rules set forth in the systems specification differ: the syntactical rules apply to systems layer coding only, and do not extend to the compression layer coding of the video and audio specifications; by contrast, the semantic rules apply to the combined stream in its entirety.

The systems specification does not specify the architecture or implementation of encoder or decoders. However, bitstream properties do impose functional and performance requirements on encoders and decoders. For instance, encoders must meet minimum clock tolerance requirements. Notwithstanding this and other requirements, a considerable degree of freedom exists in the design and implementation of encoders and decoders.

A prototypical audio/video decoder system is depicted in figure 1 to illustrate the function of an ISO/IEC 11172 decoder. The architecture is not unique -- System Decoder functions including decoder timing control might equally well be distributed among elementary stream decoders and the Medium Specific Decoder -- but this figure is useful for discussion. The prototypical decoder design does not imply any normative requirement for the design of an ISO/IEC 11172 decoder. Indeed non-audio/video data is also allowed, but not shown.

Figure 1—Prototypical ISO/IEC 11172 decoder

The prototypical ISO/IEC 11172 decoder shown in figure 1 is composed of System, Video, and Audio decoders conforming to Parts 1, 2, and 3, respectively, of ISO/IEC 11172. In this decoder the multiplexed coded representation of one or more audio and/or video streams is assumed to be stored on a digital storage medium (DSM), or network, in some medium-specific format. The medium specific format is not governed by this International Standard, nor is the medium-specific decoding part of the prototypical ISO/EEC 11172 decoder.

The prototypical decoder accepts as input an ISO/IEC 11172 multiplexed stream and relies on a System Decoder to extract timing information from the stream. The System Decoder demultiplexes the stream, and the elementary streams so produced serve as inputs to Video and Audio decoders, whose outputs are decoded video and audio signals. Included in the design, but not shown in the figure, is the flow of timing information among the System Decoder, the Video and Audio Decoders, and the Medium Specific Decoder.

The Video and Audio Decoders are synchronized with each other and with the DSM using this timing information.

ISO/IEC 11172 multiplexed streams are constructed in two layers: a system layer and a compression layer. The input stream to the System Decoder has a system layer wrapped about a compression layer. Input streams to the Video and Audio decoders have only the compression layer.

Operations performed by the System Decoder either apply to the entire ISO/IEC 11172 multiplexed stream ("multiplex-wide operations"), or to individual elementary streams ("stream-specific operations"). The ISO/IEC 11172 system layer is divided into two sub-layers, one for multiplex-wide operations (the pack layer), and one for stream-specific operations (the packet layer).