ISO/IEC 21122-3:2022 情報技術— JPEG XS低遅延軽量画像コーディングシステム— Part 3: トランスポートおよびコンテナ形式 | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。

この文書の開発に使用された手順と、今後の維持のために意図された手順は、ISO/IEC 指令で説明されています。 1. 特に、さまざまなタイプの文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令の編集規則に従って作成されました。 2 ( www.iso.org/directives or www.iec.ch/members_experts/refdocs を参照)

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。文書の作成中に特定された特許権の詳細は、序論および/または受信した特許宣言の ISO リスト ( www.iso.org/patents を参照) または受信した特許宣言の IEC リスト ( patents. iec.ch )。

このドキュメントで使用されている商号は、ユーザーの便宜のために提供された情報であり、保証を構成するものではありません。

規格の自主的な性質の説明、適合性評価に関連する ISO 固有の用語と表現の意味、および技術的貿易障壁 (TBT) における世界貿易機関 (WTO) の原則に対する ISO の遵守に関する情報については、 www を参照してください。 .iso.org/iso/foreword.html . IEC については、 www.iec.ch/understanding-standards を参照してください。

このドキュメントは、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。

この第 2 版は、技術的に改訂された第 1 版 (ISO/IEC 21122-3:2019) を取り消して置き換えるものです。

主な変更点は次のとおりです。

  • 正誤表;
  • 4:2:0 イメージをサポートするためのシグナリング。

ISO/IEC 21122 シリーズのすべての部品のリストは、ISO および IEC の Web サイトにあります。

序章

このドキュメントは、JPEG XS と呼ばれる低レイテンシの軽量画像コーディング システムの一連の標準の一部です。

映画の制作または伝送中の多くのユースケースでは、待ち時間と再圧縮損失を制限することが、圧縮効率よりも重要な側面です。 JPEG XS コーディング システムは、非常に適度な計算リソースで画像シーケンスの圧縮と再圧縮を提供すると同時に、複数の圧縮と解凍のサイクルやコンテンツ ソースの混合 (字幕、オーバーレイ、ロゴの埋め込みなど) に対しても堅牢性を維持します。視覚的に無損失の品質を保証する一般的なターゲット圧縮率は、ソース マテリアルの性質に応じて 2:1 から 10:1 の範囲です。エンド ツー エンドのレイテンシは、フレームの一部に限定できます。通常は、少数のライン間から 1 ライン未満までです。

このドキュメントでは、JPEG XS コードストリームのトランスポートおよびコンテナ フォーマットを指定します。また、トランスポート、編集、およびプレゼンテーションを容易にするために、画像シーケンスの伝送用のトランスポート プロトコルを強化するメタデータも定義します。

1 スコープ

このドキュメントは、ISO/IEC 21122-1 で指定されているように、JPEG XS コードストリームのトランスポートおよびコンテナー フォーマットを定義します。コンピューター プラットフォームで静止画像および動画シーケンス ファイルを操作するためのファイル形式を定義し、インターネット ベースの通信を可能にするトランスポート ストリームにコード ストリームを埋め込む方法についてのガイダンスを提供します。

このドキュメントでは、既存のファイル形式の仕様を使用し、JPEG XS コードストリームを埋め込むためにそれらを拡張しています。

2 参考文献

以下のドキュメントは、その内容の一部またはすべてがこのドキュメントの要件を構成するように、本文で参照されています。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

  • ISO 15076-1, 画像技術のカラーマネジメント — アーキテクチャ、プロファイル形式およびデータ構造 — 1: ICC.1: 2010 に基づく
  • ISO/IEC 646, 情報技術 — 情報交換用の ISO 7 ビット コード化文字セット
  • ISO/IEC 10646, 情報技術 — 汎用コード化文字セット (UCS)
  • ISO/IEC 11578, 情報技術 — オープン システム相互接続 — リモート プロシージャ コール (RPC)
  • ISO/IEC 14496-12, 視聴覚オブジェクトのコーディング — 12: ISO ベースのメディア ファイル形式
  • ISO/IEC 21122-1, JPEG XS 低遅延軽量画像符号化システム — 1: コアコーディングシステム
  • ISO/IEC 21122-2, JPEG XS 低遅延軽量画像符号化システム — 2: プロファイルとバッファ モデル
  • ISO/IEC 23008-12:2017, 情報技術 — 異種環境における高効率コーディングとメディア配信 — 12: 画像ファイル形式
  • ISO/CIE 11664-1, 測色 — 1: CIE 標準測色オブザーバー
  • Rec. ITU-T H.273 | ISO/IEC 23091-2, コーディングに依存しないコード ポイント — 2: 動画
  • ANSI/CTA 861-G:2016, 非圧縮高速デジタル インターフェイス用の DTV プロファイル
  • W3C 勧告、Extensible Markup Languag, 2008 年 11 月 26 日 ( https://www.w3.org/TR/REC-xml/ )

3 用語と定義

このドキュメントの目的のために、ISO/IEC 14496-12, ISO/IEC 21122-1, ISO/IEC 21122-2, ISO/IEC 23008-12 および以下に記載されている用語と定義が適用されます。

ISO および IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。

3.1

補助

通常、不透明度チャネルまたはアルファ マスクとして使用される補助コンポーネント チャネル

3.2

ビッグエンディアン

マルチバイト値表現の最上位バイトから最下位バイトへのバイト順

3.3

画像または画像復号化プロセスを記述する構造化されたデータの集合。

3.4

箱の中身

ボックス (3.3) 構造内にラップされたデータ

3.5

ボックスタイプ

ボックスに保存されている情報の種類 (3.3)

3.6

バイト

8 ビットのグループ

3.7

コーディングに依存しないコード ポイント

色空間の定義のための列挙値に基づくコードポイント

注記 1: Rec. ITU-T H.273 | で定義されているコード ポイント。 ISO/IEC 23091-

3.8

高効率画像ファイル形式

静止画像と モーション シーケンスを埋め込むことができる画像ファイル形式 (3.11)

グレード 1 から初級: ISO/IEC 23008-12 に基づく。

3.9

画像集

暗黙的または合図された表示順序または表示タイム スタンプのない順序付けされていない一連の画像

3.10

JXS

JPEG XS 圧縮画像を含む静止画像ファイル形式

3.11

モーションシーケンス

映画

画像の 時間シーケンス (3.15)

3.12

サンプル

<coding> コンポーネントを構成する 2 次元画像配列内の 1 つの要素

注記 1:この定義は附属書 A で使用されている。

[出典: ISO/IEC 21122-1:2022, 3.1.45 が変更されました – エントリにドメインと注 1 が追加されました。]

3.13

サンプル

<ISOBMFF> 単一の時間に関連付けられたすべてのデータ

注記 1:この定義は、シーケンス内の 1 つのコード化された画像に関連付けられたデータとして、附属書 B および C で使用されます。

3.14

スーパーボックス

ペイロードデータとして他のボックスを運ぶ ボックス (3.3)

3.15

時限シーケンス

各エンティティが明確に定義されたタイム スタンプで表示される、イメージなどのメディア エンティティの直線的に順序付けられたシーケンス

参考文献

[1]ISO/CIE 11664-3, 測色 — 3: CIE 三刺激値
[2]IEC 61966-2-1, マルチメディア システムおよび機器 — 色の測定と管理 — 2-1: カラーマネジメント - デフォルトRGB色空間 - sRGB
[3]IEC 61966-2-4, マルチメディア システムおよび機器 — 色の測定と管理 — 2-4: カラーマネジメント — ビデオアプリケーション向け拡張色域 YCC カラースペース — xvYCC
[4]Rec. ITU-T T.800 | ISO/IEC 15444-1:2016, JPEG 2000 画像符号化システム — 1: コアコーディングシステム
[5]Rec. ITU-T T.801 | ISO/IEC 15444-2:2004, JPEG 2000 画像符号化システム — 2: 拡張子
[6]Rec. ITU-R BT.601, 標準 4:3 およびワイド スクリーン 16:9 アスペクト比のデジタル テレビのスタジオ エンコード パラメータ
[7]Rec. ITU-R BT.2020, 制作および国際番組交換用の超高精細テレビ システムのパラメータ値
[8]Rec. ITU-R BT.2100, 制作および国際番組交換で使用する高ダイナミック レンジ テレビの画像パラメータ値
[9]ARIB STD-B67, 番組制作用拡張映像ダイナミックレンジテレビジョン(EIDRTV)システムの必須パラメータ値
[10]CIE 15, 測色
[11]IETF RFC 6838, メディア タイプの仕様と登録手順
[12]SMPTE ST428-1:2006, SMPTE 規格 — D シネマ配信マスター イメージの特性
[13]SMPTE ST2084:2014, SMPTE 規格 — マスタリング リファレンス ディスプレイの高ダイナミック レンジ電気光学伝達関数
[14]SMPTE ST2086:2014, 高輝度および広色域画像をサポートするディスプレイ カラー ボリューム メタデータのマスター
[15]ST 2110-31:2018, SMPTE 規格 — マネージド IP ネットワーク上のプロフェッショナル メディア: AES3 トランスペアレント トランスポート
[16]ST 2110-10:2017, SMPTE 規格 — マネージド IP ネットワーク上のプロフェッショナル メディア: システムのタイミングと定義
[17]ICC, 1:2010 画像技術のカラー管理 - アーキテクチャ、プロファイル形式、およびデータ構造国際カラー コンソーシアム 2010

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, 1. In particular, the different approval criteria needed for the different types of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs ).

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ) or the IEC list of patent declarations received (see patents.iec.ch ).

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html . In the IEC, see www.iec.ch/understanding-standards .

This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.

This second edition cancels and replaces the first edition (ISO/IEC 21122-3:2019), which has been technically revised.

The main changes are as follows:

  • corrigenda;
  • signalling for support of 4:2:0 images.

A list of all parts in the ISO/IEC 21122 series can be found on the ISO and IEC websites.

Introduction

This document is part of a series of standards for a low-latency lightweight image coding system, denoted JPEG XS.

In many use cases during production or transmission of a movie, limiting the latency and the recompression loss is a more important aspect than the compression efficiency. The JPEG XS coding system offers compression and recompression of image sequences with very moderate computational resources while remaining robust under multiple compression and decompression cycles and mixing of content sources, e.g. embedding of subtitles, overlays or logos. Typical target compression ratios ensuring visually lossless quality are in the range of 2:1 to 10:1, depending on the nature of the source material. The end-to-end latency can be confined to a fraction of a frame, typically between a small number of lines down to below a single line.

This document specifies transport and container formats for JPEG XS codestreams. It also defines metadata that enriches transport protocols for transmission of image sequences, in order to facilitate transport, editing and presentation.

1 Scope

This document defines transport and container formats for JPEG XS codestreams as specified in ISO/IEC 21122-1. It defines file formats for working with still image and motion image sequence files on computer platforms and gives guidance on how to embed the codestream in transport streams, allowing internet-based communication.

This document uses already existing specifications for file formats and extends them for the embedding of JPEG XS codestreams.

2 Normative references

The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

  • ISO 15076-1, Image technology colour management — Architecture, profile format and data structure — 1: Based on ICC.1: 2010
  • ISO/IEC 646, Information technology — ISO 7-bit coded character set for information interchange
  • ISO/IEC 10646, Information technology — Universal coded character set (UCS)
  • ISO/IEC 11578, Information technology — Open Systems Interconnection — Remote Procedure Call (RPC)
  • ISO/IEC 14496-12, Coding of audio-visual objects — 12: ISO base media file format
  • ISO/IEC 21122-1, JPEG XS low-latency lightweight image coding system — 1: Core coding system
  • ISO/IEC 21122-2, JPEG XS low-latency lightweight image coding system — 2: Profiles and buffer models
  • ISO/IEC 23008-12:2017, Information technology — High efficiency coding and media delivery in heterogeneous environments — 12: Image File Format
  • ISO/CIE 11664-1, Colorimetry — 1: CIE standard colorimetric observers
  • Rec. ITU-T H.273 | ISO/IEC 23091-2, Coding-independent code points — 2: Video
  • ANSI/CTA 861-G:2016, A DTV Profile for Uncompressed High Speed Digital Interfaces
  • W3C Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 Nov. 2008 ( https://www.w3.org/TR/REC-xml/ )

3 Terms and definitions

For the purposes of this document the terms and definitions given in ISO/IEC 14496-12, ISO/IEC 21122-1, ISO/IEC 21122-2, ISO/IEC 23008-12 and the following apply.

ISO and IEC maintain terminology databases for use in standardization at the following addresses:

3.1

aux

auxiliary component channel typically used as opacity channel or alpha mask

3.2

big-endian

byte ordering from the most significant to the least significant byte of multi-byte value representations

3.3

box

structured collection of data describing the image or the image decoding process

3.4

box content

data wrapped within the box (3.3) structure

3.5

box type

kind of information stored with the box (3.3)

3.6

byte

group of 8 bits

3.7

coding-independent code point

code point based on enumerated values for the definition of the colourspaces

Note 1 to entry: Code points defined in Rec. ITU-T H.273 | ISO/IEC 23091-2.

3.8

high efficiency image file format

image file format which can embed still images and motion sequences (3.11)

Note 1 to entry: Based on ISO/IEC 23008-12.

3.9

image collection

unordered set of images without an implied or signalled presentation order or presentation time stamps

3.10

JXS

still image file format with JPEG XS compressed images

3.11

motion sequence

movie

timed sequence (3.15) of images

3.12

sample

<coding> single element in the two-dimensional image array which comprises a component

Note 1 to entry: This definition is used in Annex A.

[SOURCE:ISO/IEC 21122-1:2022, 3.1.45 modified – the domain and Note 1 to entry have been added.]

3.13

sample

<ISOBMFF> all the data associated with a single time

Note 1 to entry: This definition is used in Annexes B and C as data associated with one coded image in a sequence.

3.14

superbox

box (3.3) that carries other boxes as payload data

3.15

timed sequence

linearly ordered sequence of media entities such as images where each entity is presented at a well defined time stamp

Bibliography

[1]ISO/CIE 11664-3, Colorimetry — 3: CIE tristimulus values
[2]IEC 61966-2-1, Multimedia systems and equipment — Colour measurement and management — 2-1: Colour management - Default RGB colour space - sRGB
[3]IEC 61966-2-4, Multimedia systems and equipment — Colour measurement and management — 2-4: Colour management — Extended-gamut YCC colour space for video applications — xvYCC
[4]Rec. ITU-T T.800 | ISO/IEC 15444-1:2016, JPEG 2000 image coding system — 1: Core coding system
[5]Rec. ITU-T T.801 | ISO/IEC 15444-2:2004, JPEG 2000 image coding system — 2: Extensions
[6]Rec. ITU-R BT.601, Studio encoding parameters of digital television for standard 4:3 and wide screen 16:9 aspect ratios
[7]Rec. ITU-R BT.2020, Parameter values for ultra-high definition television systems for production and international programme exchange
[8]Rec. ITU-R BT.2100, Image parameter values for high dynamic range television for use in production and international programme exchange
[9]ARIB STD-B67, Essential parameter values for the extended image dynamic range television (EIDRTV) system for programme production
[10]CIE 15, Colorimetry
[11]IETF RFC 6838, Media Type Specifications and Registration Procedures
[12]SMPTE ST428-1:2006, SMPTE Standard — D-Cinema Distribution Master Image Characteristics
[13]SMPTE ST2084:2014, SMPTE Standard — High Dynamic Range Electro-Optical Transfer Function of Mastering Reference Displays
[14]SMPTE ST2086:2014, Mastering Display Color Volume Metadata Supporting High Luminance and Wide Color Gamut Image
[15]ST 2110-31:2018, SMPTE Standard — Professional Media Over Managed IP Networks: AES3 Transparent Transport
[16]ST 2110-10:2017, SMPTE Standard — Professional Media Over Managed IP Networks: System Timing and Definitions
[17]ICC, 1:2010 Image technology colour management – Architecture, profile format, and data structure, International Color Consortium, 2010