※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである各国団体は、特定の技術活動分野に対処するためにそれぞれの組織によって設立された技術委員会を通じて国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力します。政府および非政府の他の国際機関も、ISO および IEC と連携してこの作業に参加しています。情報技術の分野では、ISO と IEC は共同技術委員会 ISO/IEC JTC 1 を設立しました。
国際規格は、ISO/IEC 指令Part 2 部に規定されている規則に従って草案されています。
合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国機関に配布されます。国際規格として発行するには、投票を行っている国家機関の少なくとも 75% による承認が必要です。
この文書の要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。
ISO/IEC 23002-3 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、分科会 SC 29, オーディオ、画像、マルチメディアおよびハイパーメディア情報のコーディングによって作成されました。
ISO/IEC 23002は、情報技術 - MPEG ビデオ技術という一般タイトルのもと、次の部分で構成されています。
- Part 1: 整数出力 8×8 逆離散コサイン変換の実装の精度要件
- Part 2: 固定小数点 8×8 IDCT および DCT
- Part 3: 補助ビデオと補足情報の表示
序章
ISO/IEC 23002 のこの部分では、補助ビデオ ストリームはビデオ シーケンスとしてコード化されたデータであり、プライマリ ビデオ シーケンスを補足します。深度マップと視差マップは、立体視ビデオ コンテンツに関連する最初に指定されたタイプの補助ビデオ ストリームです。
これに関連して、ISO/IEC 23002 のこの部分は、補助ビデオ ストリームの解釈を記述する情報を伝達するための構文とセマンティクスを指定します。
このような情報の構文は、補足情報 (SI) メッセージ ストリームと呼ばれるデータ ストリームとして指定されます。 ISO/IEC による現在の SI メッセージ ストリーム構文の将来の拡張で追加のタイプのデータを定義できるように、拡張性の規定が組み込まれています。
SI メッセージ ストリームには、複数の連結された SI メッセージを含めることができるため、さまざまな種類の情報を伝達できます。補助ビデオ SI (AVSI) は、現在定義されている唯一の SI タイプです (ISO/IEC による将来の仕様のために予約されており、存在する場合はデコーダによって無視される予約済み SI メッセージ タイプを除く) AVSI メッセージは、主ビデオ シーケンスに付随する補助ビデオ シーケンスの解釈を特徴付けます。例えば、AVSIは、補助ビデオが奥行きマップ情報を表すことを示すことができ、補助ビデオをそのような奥行き情報として適切に解釈するためのパラメータを提供することができる。これらのメッセージが関係するプライマリ ビデオ ストリームと補助ビデオ ストリームを識別する手段は、システム レベルの問題であり、ISO/IEC 23002 のこの部分の範囲外です。
補助ビデオ SI は現在 で指定されている唯一のタイプの SI ですが、SI メッセージ フォーマットは汎用的な方法で定義されているため、補助ビデオ シーケンスの解釈を支援する以外の目的にも使用できる可能性があります。あらゆる種類のデータが SI メッセージ形式で伝送される可能性があります。
ISO/IEC 23002 のこの部分では、深度と視差という 2 種類の補助ビデオとその補足情報を扱います。これらを使用すると、大型の高品質テレビから小型のモバイル デバイスに至るまで、さまざまな製品のメガネベース ディスプレイと自動立体ディスプレイの両方で立体画像を作成できます。奥行き、視差、およびそれらの関係に関する詳細は、ISO/IEC 23002 のこの部分の付録に記載されています。
他の補助ビデオ タイプおよび補足情報メッセージは、ISO/IEC 23002 のこの部分の将来の拡張で定義される可能性があります。
1 スコープ
ISO/IEC 23002 のこの部分では、補助ビデオ ストリームを、ビデオ シーケンスとしてコード化され、プライマリ ビデオ シーケンスを補足するデータとして定義しています。深度マップと視差マップは、立体視ビデオ コンテンツに関連する最初に指定されたタイプの補助ビデオ ストリームです。
これに関連して、ISO/IEC 23002 のこの部分は、補助ビデオ ストリームの解釈を記述する情報を伝達するための構文とセマンティクスを指定します。
このような情報の構文は、補足情報 (SI) メッセージ ストリームと呼ばれるデータ ストリームとして指定されます。 ISO/IEC による現在の SI メッセージ ストリーム構文の将来の拡張で追加のタイプのデータを定義できるように、拡張性の規定が組み込まれています。
2 用語と定義
この文書の目的上、次の用語と定義が適用されます。
2.1
補助画像
表示プロセスにおいて ISO/IEC 23002 のこの部分で指定されている他のデータと組み合わせて使用できる、主要な画像を補足する画像
注記 1:深度マップは補助画像の一例です。
2.2
補助ビデオシーケンス
補助画像のセット
2.3
ビット深度
整数の値を表すために使用されるデータの量 (ビットで表現)
2.4
ビットストリーム
指定されたフォーマットに従って、1 つまたは複数の主ビデオシーケンス、1 つまたは複数の補助ビデオ シーケンス、または 1 つまたは複数の補足情報メッセージのコード化表現を形成するビットのシーケンス。
2.5
下のフィールド
フレームを構成する 2 つのフィールドのうちの 1 つ。このフィールドの各行は空間的に最上位フィールドの対応する行のすぐ下に位置します。
2.6
できる
許可または有効化されているが、必ずしも必須ではない動作を指すために使用される用語
2.7
チャネル
輝度または彩度の総称
2.8
彩度、形容詞。
原色に関連する 2 つの色差信号の 1 つを表す
注記 1:クロマ配列またはサンプルに使用されるシンボルは、Cb および Cr です。
注記 2:クロミナンスという用語と関連付けられることが多い線形光伝達特性の使用の含意を避けるために、クロミナンスという用語ではなくクロマという用語が使用されています。
2.9
深さ
特定の 2 次元平面に対する物体の相対的な距離
2.10
田畑
フレームの交互の列の組み立て
注記 1:フレームは、トップフィールドとボトムフィールドの 2 つのフィールドで構成されます。
2.11
フレーム
フレームには、輝度サンプルの配列と、対応する色度サンプルの 2 つの配列が含まれています。フレームは、トップ フィールドとボトム フィールドの 2 つのフィールドで構成されます。
2.12
ルマ、形容詞。
原色に関係するモノクロ信号を表す
注記 1: luma に使用される記号または添字は Y です。
注記 2: 輝度という用語と関連付けられることが多い線形光伝達特性の使用の暗示を避けるために、輝度という用語ではなく輝度という用語が使用されています。
2.13
視差
観察者の位置の変化による物体の見かけの移動
2.14
写真
フィールドまたはフレームの総称
2.15
主要な画像
補助画像を添付した画像
2.16
プライマリビデオ
補助ビデオ シーケンスが付加されたビデオ シーケンス
2.17
生のバイト シーケンス ペイロード
RBSP
整数のバイトを含む構文構造
2.18
予約済み
ISO/IEC 23002 のこの部分に準拠するビットストリームでは使用されませんが、ISO/IEC による ISO/IEC 23002 のこの部分の将来の拡張では使用される可能性があります。
2.19
立体画像
立体ディスプレイで表示しているときに立体 (奥行き) 効果を提供する画像。たとえば、主ビデオと、その奥行き(または視差) マップを表す補助ビデオ シーケンスから構築されます。
2.20
するだろう
ISO/IEC 23002 のこの部分に準拠するための必須要件を表すために使用される用語
2.21
したほうがいい
予想される通常の状況下で従うことが推奨される実装の動作を指すために使用される用語ですが、ISO/IEC 23002 のこの部分に準拠するための必須要件ではありません
2.22
構文要素
ビットストリームで表現されるデータの要素
2.23
トップフィールド
フレームを構成する 2 つのフィールドのうちの 1 つ。このフィールドの各行は、空間的に下部フィールドの対応する行のすぐ上に位置します。
2.24
ビデオシーケンス
一連の写真
参考文献
| 1 | ITU-T Rec. H.222.0 | ISO/IEC 13818-1, 情報技術 - 動画および関連するオーディオ情報の汎用コーディング: システム |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.
ISO/IEC 23002-3 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.
ISO/IEC 23002 consists of the following parts, under the general title Information technology — MPEG video technologies:
- Part 1: Accuracy requirements for implementation of integer-output 8×8 inverse discrete cosine transform
- Part 2: Fixed-point 8×8 IDCT and DCT
- Part 3: Representation of auxiliary video and supplemental information
Introduction
In this part of ISO/IEC 23002, auxiliary video streams are data coded as video sequences and supplementing a primary video sequence. Depth maps and parallax maps are the first specified types of auxiliary video streams, relating to stereoscopic-view video content.
In this context, this part of ISO/IEC 23002 specifies syntax and semantics for conveying information describing the interpretation of auxiliary video streams.
Syntax for such information is specified herein as a stream of data referred to as a supplemental information (SI) message stream. Provisions for extensibility have been included, so that additional types of data can be defined in future extensions of the current SI message stream syntax by ISO/IEC.
An SI message stream can contain several concatenated SI messages, hence conveying various types of information. The auxiliary video SI (AVSI) is the only currently-defined type of SI (other than reserved SI message types that are reserved for future specification by ISO/IEC and are to be ignored by decoders if present). An AVSI message characterizes the interpretation of an auxiliary video sequence that accompanies a primary video sequence. For instance, an AVSI can indicate that the auxiliary video represents depth map information, and can provide parameters for the proper interpretation of the auxiliary video as such depth information. The means for identifying the primary video stream and the auxiliary video stream to which these messages pertain is a system-level issue that is outside the scope of this part of ISO/IEC 23002.
Although the auxiliary video SI is the only type of SI that is currently specified herein, the SI message format has been defined in a generic fashion so that it can potentially be used for purposes other than aiding in the interpretation of auxiliary video sequences. Any kind of data could potentially be carried in the SI message format.
This part of ISO/IEC 23002 addresses two types of auxiliary video and their supplemental information: depth and parallax. They can be used to create stereoscopic images for both glasses-based displays and auto-stereoscopic displays in a large variety of products, ranging from large, very high quality television sets to tiny mobile devices. Further information on depth, parallax and the relation between them can be found in the annexes of this part of ISO/IEC 23002.
Other auxiliary video types and supplemental information messages might be defined in future extensions of this part of ISO/IEC 23002.
1 Scope
This part of ISO/IEC 23002 defines auxiliary video streams as data coded as video sequences and supplementing a primary video sequence. Depth maps and parallax maps are the first specified types of auxiliary video streams, relating to stereoscopic-view video content.
In this context, this part of ISO/IEC 23002 specifies syntax and semantics for conveying information describing the interpretation of auxiliary video streams.
Syntax for such information is specified herein as a stream of data referred to as a supplemental information (SI) message stream. Provisions for extensibility have been included, so that additional types of data can be defined in future extensions of the current SI message stream syntax by ISO/IEC.
2 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
2.1
auxiliary picture
picture that supplements a primary picture that may be used in combination with other data specified by this part of ISO/IEC 23002 in the display process
Note 1 to entry:Depth maps are an example of auxiliary pictures.
2.2
auxiliary video sequence
set of auxiliary pictures
2.3
bit depth
amount of data used to represent the value of an integer quantity (expressed in bits)
2.4
bitstream
sequence of bits that forms the coded representation, according to a specified format, of one or more primary video sequences, of one or more auxiliary video sequences, or of one or more supplemental information messages
2.5
bottom field
one of two fields that comprise a frame, each row of this field being spatially located immediately below a corresponding row of the top field
2.6
can
term used to refer to behaviour that is allowed or enabled, but not necessarily required
2.7
channel
collective term for luma or chroma
2.8
chroma, adj.
representing one of the two colour difference signals related to the primary colours
Note 1 to entry: The symbols used for a chroma array or sample are Cb and Cr.
Note 2 to entry: The term chroma is used rather than the term chrominance in order to avoid the implication of the use of linear light transfer characteristics that is often associated with the term chrominance.
2.9
depth
distance of an object relative to a given two-dimensional plane
2.10
field
assembly of alternate rows of a frame
Note 1 to entry: A frame is composed of two fields: a top field and a bottom field.
2.11
frame
A frame contains an array of luma samples and two corresponding arrays of chroma samples. A frame consists of two fields, a top field and a bottom field
2.12
luma, adj.
representing the monochrome signal related to the primary colours
Note 1 to entry: The symbol or subscript used for luma is Y.
Note 2 to entry: The term luma is used rather than the term luminance in order to avoid the implication of the use of linear light transfer characteristics that is often associated with the term luminance.
2.13
parallax
apparent shift of an object due to a change in observer position
2.14
picture
collective term for a field or a frame
2.15
primary picture
picture to which an auxiliary picture is attached
2.16
primary video
video sequence to which an auxiliary video sequence is attached
2.17
raw byte sequence payload
RBSP
syntax structure containing an integer number of bytes
2.18
reserved
not to be used in bitstreams conforming to this part of ISO/IEC 23002, but may be used in future extensions of this part of ISO/IEC 23002 by ISO/IEC
2.19
stereoscopic pictures
pictures that provide a stereoscopic (depth) effect while viewing them on a stereoscopic display, for example constructed from a primary video and from an auxiliary video sequence representing its depth (or a parallax) map
2.20
shall
term used to express mandatory requirements for conformance to this part of ISO/IEC 23002
2.21
should
term used to refer to behaviour of an implementation that is encouraged to be followed under anticipated ordinary circumstances, but is not a mandatory requirement for conformance to this part of ISO/IEC 23002
2.22
syntax element
element of data represented in the bitstream
2.23
top field
one of two fields that comprise a frame, each row of this field being spatially located immediately above the corresponding row of the bottom field
2.24
video sequence
sequence of pictures
Bibliography
| 1 | ITU-T Rec. H.222.0 | ISO/IEC 13818-1, Information technology — Generic coding of moving pictures and associated audio information: Systems |