ISO/IEC 21122-3:2024 情報技術 — JPEG XS 低遅延軽量画像コーディング システム — Part 3:トランスポートおよびコンテナ フォーマット | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである各国団体は、特定の技術活動分野に対処するためにそれぞれの組織によって設立された技術委員会を通じて国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力します。政府および非政府の他の国際機関も、ISO および IEC と連携してこの作業に参加しています。

この文書の作成に使用される手順と、そのさらなる保守を目的とした手順は、ISO/IEC 指令Part に記載されています。特に、さまざまなタイプの文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令第 2 Part の編集規則に従って起草されました ( www.iso.org/directives or www.iec.ch/members_experts/refdocs を参照)

ISO および IEC は、この文書の実装に特許の使用が含まれる可能性があることに注意を促しています。 ISO および IEC は、請求された特許権の証拠、有効性、または適用可能性に関していかなる立場もとりません。この文書の発行日の時点で、ISO および IEC は、この文書の実装に必要となる可能性のある特許の通知を受け取っていません。ただし、実装者は、これが www.iso.org/patents および https://patents.iec.ch で入手可能な特許データベースから取得できる最新情報を表していない可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。

本書で使用されている商号は、ユーザーの便宜のために提供された情報であり、推奨を構成するものではありません。

規格の自主的な性質の説明、適合性評価に関連する ISO 固有の用語と表現の意味、および貿易の技術的障壁 (TBT) における世界貿易機関 (WTO) 原則への ISO の準拠に関する情報については、 www を 参照してください。 .iso.org/iso/foreword.html IEC については、 www.iec.ch/ Understanding-standards を参照してください。

この文書は、ISO/IEC JTC 1 合同技術委員会、情報技術、小委員会 SC 29, オーディオ、画像、マルチメディアおよびハイパーメディア情報のコーディングによって作成されました。

この第 3 版は、技術的に改訂された第 2 版 (ISO/IEC 21122-3:2022) を廃止し、置き換えるものです。

主な変更点は以下のとおりです。

  • 時間差分コーディング (TDC) を使用した JPEG XS コード ストリームのサポート。
  • インターレース信号のコーディングに関する説明。

ISO/IEC 21122 シリーズのすべての部品のリストは、ISO および IEC の Web サイトでご覧いただけます。

導入

この文書は、JPEG XS と呼ばれる、低遅延の軽量画像コーディング システムの一連の規格の一部です。

ムービーの制作または送信中の多くのユースケースでは、遅延と再圧縮損失を制限することが、圧縮効率よりも重要な側面となります。 JPEG XS コーディング システムは、非常に適度な計算リソースで画像シーケンスの圧縮と再圧縮を実現すると同時に、複数の圧縮と解凍サイクルや、字幕、オーバーレイ、ロゴの埋め込みなどのコンテンツ ソースの混合に対しても堅牢性を維持します。視覚的にロスのない品質を保証する一般的な目標圧縮率は、ソース素材の性質に応じて 2:1 ~ 20:1 の範囲になります。エンドツーエンドの遅延は、フレームの一部、通常は少数のライン間から 1 ライン未満までに制限できます。

この文書は、JPEG XS コード ストリームのトランスポートおよびコンテナ形式を指定します。また、転送、編集、プレゼンテーションを容易にするために、画像シーケンスの転送用の転送プロトコルを強化するメタデータも定義します。

1 スコープ

この文書は、ISO/IEC 21122-1 で指定されている JPEG XS コード ストリームのトランスポートおよびコンテナ形式を定義します。これは、コンピュータ プラットフォーム上で静止画像および動画シーケンス ファイルを操作するためのファイル形式を定義し、トランスポート ストリームにコードストリームを埋め込んでインターネット ベースの通信を可能にする方法についてのガイダンスを提供します。

このドキュメントでは、ファイル形式の既存の仕様を使用し、JPEG XS コード ストリームの埋め込み用にそれを拡張します。

2 規範的参照

以下の文書は、その内容の一部またはすべてがこの文書の要件を構成する形で本文中で参照されています。日付が記載された参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

  • ISO 15076-1, 画像技術のカラー管理 — アーキテクチャ、プロファイル形式、およびデータ構造 — Part 1: ICC.1:2010 に基づく
  • ISO/IEC 646, 情報技術 - 情報交換用の ISO 7 ビット コード化文字セット
  • ISO/IEC 10646, 情報技術 - ユニバーサルコード化文字セット (UCS)
  • ISO/IEC 11578, 情報技術 - オープン システム相互接続 - リモート プロシージャ コール (RPC)
  • ISO/IEC 14496-12, オーディオビジュアルオブジェクトのコーディング — Part 12: ISO ベースのメディア ファイル形式
  • ISO/IEC 21122-1, JPEG XS 低遅延軽量画像符号化システム — Part 1: コア符号化システム
  • ISO/IEC 21122-2, JPEG XS 低遅延軽量画像コーディング システム — Part 2: プロファイルとバッファ モデル
  • ISO/IEC 23008-12:2022, 情報技術 — 異種環境での高効率コーディングとメディア配信 — Part 12: 画像ファイル形式
  • ISO/CIE 11664-1, 測色 — Part 1: CIE 標準測色オブザーバー
  • ITU-T H.273 | ISO/IEC 23091-2, コーディングに依存しないコード ポイント — Part 2: ビデオ
  • ANSI/CTA 861-G:2016, 非圧縮高速デジタル インターフェイス用の DTV プロファイル
  • W3C 勧告、拡張マークアップ言語 (XML) 1., 2008 年 11 月 26 日 ( https://www.w3.org/TR/REC-xml/ )

3 用語と定義

この文書の目的のために、ISO/IEC 14496-12, ISO/IEC 21122-1, ISO/IEC 21122-2, ISO/IEC 23008-12, および以下に示されている用語と定義が適用されます。

ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。

3.1

補助

補助コンポーネント チャネルは通常、不透明度チャネルまたはアルファ マスクとして使用されます。

3.2

ビッグエンディアン

マルチバイト値表現の最上位バイトから最下位バイトへのバイト順序付け

3.3

画像または画像のデコードプロセスを記述する構造化されたデータの集合

3.4

ボックスの内容

ボックス (3.3) 構造内でラップされたデータ

3.5

ボックスタイプ

ボックスに保存される情報の種類 (3.3)

3.6

バイト

8ビットのグループ

3.7

コーディングに依存しないコードポイント

色空間の定義の列挙値に基づくコード ポイント

注記 1: ITU-T H.273 | で定義されているコードポイント。 ISO/IEC 23091-

3.8

高効率な画像ファイル形式

静止画や モーションシーケンスを埋め込むことができる画像ファイル形式 (3.11)

注記 1: ISO/IEC 23008-12 に基づく。

3.9

画像コレクション

暗黙的または通知されたプレゼンテーション順序またはプレゼンテーション タイムスタンプのない、順序付けされていない画像のセット

3.10

JXS

JPEG XS圧縮画像を含む静止画像ファイル形式

3.11

モーションシーケンス

映画

画像の 時限シーケンス (3.15)

3.12

サンプル

<coding> コンポーネントを構成する 2 次元画像配列内の単一の要素

注記 1:この定義は付録 A で使用されます。

3.13

サンプル

<ISOBMFF> 単一の時間に関連付けられたすべてのデータ

注記 1:この定義は、付録 B および C で、シーケンス内の 1 つのコード化された画像に関連付けられたデータとして使用されます。

3.14

スーパーボックス

他のボックスをペイロード データとして運ぶ ボックス (3.3)

3.15

時限シーケンス

各エンティティが明確に定義されたタイムスタンプで表示されるwhere 画像などのメディア エンティティの線形に順序付けられたシーケンス

参考文献

1ISO/CIE 11664-3, 測色 - Part 3: CIE 三刺激値
2IEC 61966-2-1, マルチメディア システムおよび機器 - 色の測定と管理 - Part 2-1: カラー管理 - デフォルトの RGB カラー スペース - sRGB
3IEC 61966-2-4, マルチメディア システムおよび機器 — 色の測定と管理 — Part 2-4: カラー管理 — ビデオ アプリケーション用の拡張色域 YCC カラー スペース — xvYCC
4ITU-T T.800 | ISO/IEC 15444-1:2019, JPEG 2000 画像コーディング システム — Part 1: コア コーディング システム
5ITU-T T.801 | ISO/IEC 15444-2:2021, JPEG 2000 画像コーディング システム — Part 2: 拡張機能
6Rec. ITU-R BT.601, 標準 4:3 およびワイド スクリーン 16:9 アスペクト比のデジタル テレビのスタジオ エンコーディング パラメータ
7Rec. ITU-R BT.2020, 制作および国際番組交換用の超高解像度テレビ システムのパラメータ値
8Rec. ITU-R BT.2100, 制作および国際番組交換用の高ダイナミック レンジ テレビの画像パラメータ値
9ARIB STD-B67, 番組制作用拡張画像ダイナミックレンジテレビ(EIDRTV)システムの必須パラメータ値
10CIE 15, 比色分析
11IETF RFC 6838, メディアType 仕様と登録手順
12SMPTE ST 428-1, SMPTE 規格 — D シネマ配信マスター画像の特性
13SMPTE ST 2084, SMPTE 規格 — マスタリング リファレンス ディスプレイのハイ ダイナミック レンジ電気光学伝達関数
14SMPTE ST 2086, 高輝度および広色域画像をサポートするディスプレイ カラー ボリューム メタデータのマスタリング
15SMPTE ST 2110-31, SMPTE 標準 — マネージド IP ネットワーク上のプロフェッショナル メディア: AES3 透過トランスポート
16SMPTE ST 2110-10: SMPTE 標準 — マネージド IP ネットワーク上のプロフェッショナル メディア: システムのタイミングと定義
17ICC1:2010 画像技術のカラー管理 – アーキテクチャ、プロファイル形式、およびデータ構造国際カラー コンソーシアム2010

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs ).

ISO and IEC draw attention to the possibility that the implementation of this document may involve the use of (a) patent(s). ISO and IEC take no position concerning the evidence, validity or applicability of any claimed patent rights in respect thereof. As of the date of publication of this document, ISO and IEC had not received notice of (a) patent(s) which may be required to implement this document. However, implementers are cautioned that this may not represent the latest information, which may be obtained from the patent database available at www.iso.org/patents and https://patents.iec.ch . ISO and IEC shall not be held responsible for identifying any or all such patent rights.

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html . In the IEC, see www.iec.ch/understanding-standards .

This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.

This third edition cancels and replaces the second edition (ISO/IEC 21122-3:2022), which has been technically revised.

The main changes are as follows:

  • support for JPEG XS codestreams using temporal differential coding (TDC).
  • clarifications on coding of interlaced signals.

A list of all parts in the ISO/IEC 21122 series can be found on the ISO and IEC websites.

Introduction

This document is part of a series of standards for a low-latency lightweight image coding system, denoted JPEG XS.

In many use cases during production or transmission of a movie, limiting the latency and the recompression loss is a more important aspect than the compression efficiency. The JPEG XS coding system offers compression and recompression of image sequences with very moderate computational resources while remaining robust under multiple compression and decompression cycles and mixing of content sources, e.g. embedding of subtitles, overlays or logos. Typical target compression ratios ensuring visually lossless quality are in the range of 2:1 to 20:1, depending on the nature of the source material. The end-to-end latency can be confined to a fraction of a frame, typically between a small number of lines down to below a single line.

This document specifies transport and container formats for JPEG XS codestreams. It also defines metadata that enriches transport protocols for transmission of image sequences, in order to facilitate transport, editing and presentation.

1 Scope

This document defines transport and container formats for JPEG XS codestreams as specified in ISO/IEC 21122-1. It defines file formats for working with still image and motion image sequence files on computer platforms and gives guidance on how to embed the codestream in transport streams, allowing internet-based communication.

This document uses already existing specifications for file formats and extends them for the embedding of JPEG XS codestreams.

2 Normative references

The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

  • ISO 15076-1, Image technology colour management — Architecture, profile format and data structure — Part 1: Based on ICC.1:2010
  • ISO/IEC 646, Information technology — ISO 7-bit coded character set for information interchange
  • ISO/IEC 10646, Information technology — Universal coded character set (UCS)
  • ISO/IEC 11578, Information technology — Open Systems Interconnection — Remote Procedure Call (RPC)
  • ISO/IEC 14496-12, Coding of audio-visual objects — Part 12: ISO base media file format
  • ISO/IEC 21122-1, JPEG XS low-latency lightweight image coding system — Part 1: Core coding system
  • ISO/IEC 21122-2, JPEG XS low-latency lightweight image coding system — Part 2: Profiles and buffer models
  • ISO/IEC 23008-12:2022, Information technology — High efficiency coding and media delivery in heterogeneous environments — Part 12: Image File Format
  • ISO/CIE 11664-1, Colorimetry — Part 1: CIE standard colorimetric observers
  • Rec. ITU-T H.273 | ISO/IEC 23091-2, Coding-independent code points — Part 2: Video
  • ANSI/CTA 861-G:2016, A DTV Profile for Uncompressed High Speed Digital Interfaces
  • W3C Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 Nov. 2008 ( https://www.w3.org/TR/REC-xml/ )

3 Terms and definitions

For the purposes of this document the terms and definitions given in ISO/IEC 14496-12, ISO/IEC 21122-1, ISO/IEC 21122-2, ISO/IEC 23008-12 and the following apply.

ISO and IEC maintain terminology databases for use in standardization at the following addresses:

3.1

aux

auxiliary component channel typically used as opacity channel or alpha mask

3.2

big-endian

byte ordering from the most significant to the least significant byte of multi-byte value representations

3.3

box

structured collection of data describing the image or the image decoding process

3.4

box content

data wrapped within the box (3.3) structure

3.5

box type

kind of information stored with the box (3.3)

3.6

byte

group of 8 bits

3.7

coding-independent code point

code point based on enumerated values for the definition of the colourspaces

Note 1 to entry: Code points defined in Rec. ITU-T H.273 | ISO/IEC 23091-2.

3.8

high efficiency image file format

image file format which can embed still images and motion sequences (3.11)

Note 1 to entry: Based on ISO/IEC 23008-12.

3.9

image collection

unordered set of images without an implied or signalled presentation order or presentation time stamps

3.10

JXS

still image file format with JPEG XS compressed images

3.11

motion sequence

movie

timed sequence (3.15) of images

3.12

sample

<coding> single element in the two-dimensional image array which comprises a component

Note 1 to entry: This definition is used in Annex A.

3.13

sample

<ISOBMFF> all the data associated with a single time

Note 1 to entry: This definition is used in Annexes B and C as data associated with one coded image in a sequence.

3.14

superbox

box (3.3) that carries other boxes as payload data

3.15

timed sequence

linearly ordered sequence of media entities such as images where each entity is presented at a well defined time stamp

Bibliography

1ISO/CIE 11664-3, Colorimetry — Part 3: CIE tristimulus values
2IEC 61966-2-1, Multimedia systems and equipment — Colour measurement and management — Part 2-1: Colour management - Default RGB colour space — sRGB
3IEC 61966-2-4, Multimedia systems and equipment — Colour measurement and management — Part 2-4: Colour management — Extended-gamut YCC colour space for video applications — xvYCC
4Rec. ITU-T T.800 | ISO/IEC 15444-1:2019, JPEG 2000 image coding system — Part 1: Core coding system
5Rec. ITU-T T.801 | ISO/IEC 15444-2:2021, JPEG 2000 image coding system — Part 2: Extensions
6Rec. ITU-R BT.601, Studio encoding parameters of digital television for standard 4:3 and wide screen 16:9 aspect ratios
7Rec. ITU-R BT.2020, Parameter values for ultra-high definition television systems for production and international programme exchange
8Rec. ITU-R BT.2100, Image parameter values for high dynamic range television for use in production and international programme exchange
9ARIB STD-B67, Essential parameter values for the extended image dynamic range television (EIDRTV) system for programme production
10CIE 15, Colorimetry
11IETF RFC 6838, Media Type Specifications and Registration Procedures
12SMPTE ST 428-1, SMPTE Standard — D-Cinema Distribution Master Image Characteristics
13SMPTE ST 2084, SMPTE Standard — High Dynamic Range Electro-Optical Transfer Function of Mastering Reference Displays
14SMPTE ST 2086, Mastering Display Color Volume Metadata Supporting High Luminance and Wide Color Gamut Image
15SMPTE ST 2110-31, SMPTE Standard — Professional Media Over Managed IP Networks: AES3 Transparent Transport
16SMPTE ST 2110-10: SMPTE Standard — Professional Media Over Managed IP Networks: System Timing and Definitions
17ICC.1:2010 Image technology colour management – Architecture, profile format, and data structure,International Color Consortium,2010