ISO/IEC 23090-12:2023 情報技術 — イマーシブ メディアのコード化表現 — Part 12: MPEG イマーシブ ビデオ | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである各国機関は、特定の技術活動分野に対処するためにそれぞれの組織によって設立された技術委員会を通じて国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力します。政府および非政府の他の国際機関も、ISO および IEC と連携してこの作業に参加しています。

この文書の作成に使用される手順と、そのさらなる保守を目的とした手順は、ISO/IEC 指令Part 1 部に記載されています。特に、さまざまなタイプの文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令Part 2 部の編集規則に従って起草されました ( www.iso.org/directives or www.iec.ch/members_experts/refdocs を参照)

ISO および IEC は、この文書の実装に特許の使用が含まれる可能性があることに注意を促しています。 ISO および IEC は、請求された特許権の証拠、有効性、または適用性に関していかなる立場もとりません。この文書の発行日の時点で、ISO および IEC は、この文書の実装に必要となる可能性のある特許の通知を受領しています。ただし、実装者は、これが www.iso.org/patents および https://patents.iec.ch で入手可能な特許データベースから取得できる最新情報を表していない可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。

本書で使用されている商号は、ユーザーの便宜のために提供された情報であり、推奨を構成するものではありません。

規格の自主的な性質、適合性評価に関連する ISO 固有の用語と表現の意味、および貿易の技術的障壁 (TBT) における世界貿易機関 (WTO) 原則への ISO の準拠に関する情報については、 www を参照してください。 .iso.org/iso/foreword.html IEC については、 www.iec.ch/ Understanding-standards を参照してください。

この文書は、ISO/IEC JTC 1 合同技術委員会、情報技術、小委員会 SC 29, オーディオ、画像、マルチメディアおよびハイパーメディア情報のコーディングによって作成されました。

ISO/IEC 23090 シリーズのすべての部品のリストは、ISO および IEC の Web サイトでご覧いただけます。

導入

このドキュメントは、現実または仮想の 3D シーンが複数の現実または仮想カメラでキャプチャされるイマーシブ ビデオ コンテンツの圧縮をサポートするために開発されました。この文書を使用すると、既存および将来のネットワーク上でイマーシブ ビデオ コンテンツを保存および配信し、ビューの位置と向きを 6 自由度で再生できるようになります。

1 スコープ

この文書は、ISO/IEC 23090-5 の拡張として、MPEG イマーシブ ビデオ (MIV) の構文、セマンティクス、およびデコード プロセスを指定します。これは、6 自由度 (6DoF) による、限られた範囲の表示位置および方向内での 3 次元 (3D) シーンの再生のサポートを提供します。

2 基準参照

以下の文書は、その内容の一部またはすべてがこの文書の要件を構成する形で本文中で参照されています。日付が記載された参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

  • ISO/IEC 23090-5:—、 1情報技術 — イマーシブ メディアのコード化表現 — Part 5: ビジュアル ボリューム ビデオベース コーディング (V3C) およびビデオベースの点群圧縮 (V-PCC)

3 用語と定義

この文書の目的のために、ISO/IEC 23090-5 および以下に示されている用語と定義が適用されます。

ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。

3.1

アトラスサンプル

アトラスに関連付けられた長方形のフレーム上の位置

3.2

コード化された MIV シーケンス

この文書で指定された制約に準拠するコード化された V3C シーケンス

3.3

デコード処理

このドキュメントで指定されているプロセス。ビットストリームを読み取り、 ビューポート (3.22) のレンダリングに使用できるパッチ データと関連情報を取得します。

3.4

デコード順序

構文要素が デコードプロセスによって処理される順序 (3.3)

3.5

視野

視野

キャプチャ/記録されたコンテンツまたは物理的な表示デバイス内の観察可能な世界の角度領域

3.6

MIVアクセスユニット

同じ デコード順序 (3.4) を共有するすべての サブビットストリーム アクセス ユニット (3.13) のセットであるV3C 構成単位の数

3.7

MIV 符号化サブビットストリーム シーケンス

サブビットストリーム IRAP アクセス ユニット (3.14) の後に 0 個以上の サブビットストリーム アクセス ユニット (3.13) が続く

注記 1:MIV 符号化サブビットストリーム シーケンスは、この文書で指定された制約に準拠する符号化サブビットストリーム シーケンスです

3.8

MIV IRAP アクセス ユニット

すべての サブビットストリーム アクセス ユニット (3.13) が サブビットストリーム IRAP アクセス ユニット (3.14) である MIV アクセス ユニット (3.6)

注記 1:MIV IRAP アクセス単位は、この文書で指定された制約に準拠するV3C IRAP 構成単位です

3.9

マルチプレーン画像

MPI

テクスチャと透明度の属性フレームのペアのセット。それぞれが暗黙的な定数ジオメトリ フレームに関連付けられています。

3.10

レンダラー

観察方向(3.19) および 観察位置(3.20) に対応する体積フレームから ビューポート(3.22) を作成するプロセスの実施形態。

3.11

ソース

1 つ以上のビデオ シーケンス。それぞれにエンコード前のジオメトリまたはテクスチャや透明度情報などの属性が含まれます。

3.12

ソースビュー

ソース (3.11) ビュー (3.15) のフォーマットに対応するエンコード前のビデオ素材。実際のカメラまたは仮想カメラによる 3D シーンのキャプチャによって取得された可能性があります。

3.13

サブビットストリームアクセスユニット

特定の デコード順序 (3.4) カウントを持つサブビットストリームのパーティション

注記 1:サブビットストリーム アクセス ユニットは、サブビットストリーム構成単位です。

3.14

サブビットストリーム IRAP アクセス ユニット

サブ ビットストリームの独立したランダムアクセスポイントを形成するサブビットストリームアクセスユニット(3.13)

注記 1:サブビットストリーム IRAP アクセス単位は、サブビットストリーム IRAP 構成単位です。

3.15

ビュー

属性フレームと、ビュー パラメータ (3.16) を使用したサーフェスへの体積フレームの投影を表す対応するジオメトリフレームで構成されるビュー サンプル (3.18) の 2D 長方形配列。

3.16

ビューパラメータ

内部パラメータと外部パラメータを含む、体積フレームから ビュー (3.15) を生成するために使用される投影のパラメータ

3.17

パラメータリストを表示する

1 つ以上の ビューパラメータのリスト (3.16)

3.18

ビューサンプル

ビューに関連付けられた長方形フレーム上の位置 (3.15)

3.19

見る向き

ビジュアルコンテンツを利用しているユーザーの向きを表す単位四元数

3.20

見る位置

ビジュアルコンテンツを利用しているユーザーのデカルト座標における位置を特徴付ける x, y, z の 3 つの要素

3.21

閲覧スペース

意図した ビューポート (3.22) レンダリングのドメイン制約

注記 1:ドメインは 3D グローバル空間で定義され、 表示方向 (3.19) に関連します。これは、アプリケーションで使用される ビューポート (3.22) の特定の方向の空間内のすべての点に対して 0 と 1 の間のスケールを定義します。

3.22

ビューポート

view (3.15) 表示と閲覧に適しています

参考文献

1ISO/IEC 23090-2, 情報技術 — 没入型メディアのコード化表現 — Part 2: 全方向性メディア形式

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs ).

ISO and IEC draw attention to the possibility that the implementation of this document may involve the use of (a) patent(s). ISO and IEC take no position concerning the evidence, validity or applicability of any claimed patent rights in respect thereof. As of the date of publication of this document, ISO and IEC had received notice of (a) patent(s) which may be required to implement this document. However, implementers are cautioned that this may not represent the latest information, which may be obtained from the patent database available at www.iso.org/patents and https://patents.iec.ch . ISO and IEC shall not be held responsible for identifying any or all such patent rights.

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html . In the IEC, see www.iec.ch/understanding-standards .

This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.

A list of all parts in the ISO/IEC 23090 series can be found on the ISO and IEC websites.

Introduction

This document was developed to support compression of immersive video content, in which a real or virtual 3D scene is captured by multiple real or virtual cameras. The use of this document enables storage and distribution of immersive video content over existing and future networks, for playback with 6 degrees of freedom of view position and orientation.

1 Scope

This document specifies the syntax, semantics and decoding processes for MPEG immersive video (MIV), as an extension of ISO/IEC 23090-5. It provides support for playback of a three-dimensional (3D) scene within a limited range of viewing positions and orientations, with 6 Degrees of Freedom (6DoF).

2 Normative reference

The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

  • ISO/IEC 23090-5:—, 1Information technology — Coded Representation of Immersive Media — Part 5: Visual Volumetric Video-based Coding (V3C) and Video-based Point Cloud Compression (V-PCC)

3 Terms and definitions

For the purposes of this document, the terms and definitions given in ISO/IEC 23090-5 and the following apply.

ISO and IEC maintain terminology databases for use in standardization at the following addresses:

3.1

atlas sample

position on the rectangular frame associated with an atlas

3.2

coded MIV sequence

coded V3C sequence conforming to the constraints specified in this document

3.3

decoding process

process specified in this document that reads a bitstream and derives patch data and related information that can be used to render a viewport (3.22)

3.4

decoding order

order in which syntax elements are processed by the decoding process (3.3)

3.5

field of view

FOV

angular region of the observable world in captured/recorded content or in a physical display device

3.6

MIV access unit

V3C composition unit that is a set of all sub-bitstream access units (3.13) that share the same decoding order (3.4) count

3.7

MIV coded sub-bitstream sequence

sub-bitstream IRAP access unit (3.14) followed by zero or more sub-bitstream access units (3.13)

Note 1 to entry: A MIV coded sub-bitstream sequence is a coded sub-bitstream sequence conforming to the constraints specified in this document.

3.8

MIV IRAP access unit

MIV access unit (3.6) for which all sub-bitstream access units (3.13) are sub-bitstream IRAP access units (3.14)

Note 1 to entry: A MIV IRAP access unit is a V3C IRAP composition unit conforming to the constraints specified in this document.

3.9

multi-plane image

MPI

set of pairs of texture and transparency attribute frames, each associated with an implicit constant geometry frame

3.10

renderer

embodiment of a process to create a viewport (3.22) from a volumetric frame corresponding to a viewing orientation (3.19) and viewing position (3.20)

3.11

source

one or more video sequences, each containing geometry or an attribute such as texture and transparency information before encoding

3.12

source view

source (3.11) video material before encoding that corresponds to the format of a view (3.15) , which may have been acquired by capture of a 3D scene by a real or virtual camera

3.13

sub-bitstream access unit

partition of a sub-bitstream that has a certain decoding order (3.4) count

Note 1 to entry: A sub-bitstream access unit is a sub-bitstream composition unit.

3.14

sub-bitstream IRAP access unit

sub-bitstream access unit (3.13) that forms an independent random-access point for the sub-bitstream

Note 1 to entry: A a sub-bitstream IRAP access unit is a sub-bitstream IRAP composition unit.

3.15

view

2D rectangular arrays of view samples (3.18) consisting of attribute frames and corresponding geometry frame representing the projection of a volumetric frame onto a surface using view parameters (3.16)

3.16

view parameters

parameters of the projection used to generate a view (3.15) from a volumetric frame, including intrinsic and extrinsic parameters

3.17

view parameters list

listing of one or more view parameters (3.16)

3.18

view sample

position on the rectangular frame associated with a view (3.15)

3.19

viewing orientation

unit quaternion representing the orientation of a user who is consuming the visual content

3.20

viewing position

triple of x, y, z characterizing the position in the Cartesian coordinates of a user who is consuming the visual content

3.21

viewing space

domain constraints for an intended viewport (3.22) rendering

Note 1 to entry: The domain is defined in the 3D global space and related to the viewing orientation (3.19) ; it defines a scale between 0 and 1 for every point in space for a given direction of the viewport (3.22) , to be used by the application.

3.22

viewport

view (3.15) suitable for display and viewing

Bibliography

1ISO/IEC 23090-2, Information technology — Coded representation of immersive media — Part 2: Omnidirectional media format