ISO/IEC 18477-3:2023 情報技術 | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

導入

この文書は、連続階調デジタル静止画像用の圧縮システムである ISO/IEC 18477-1 の拡張版であり、Rec. ITU-T T.81 | との下位互換性があります。 ISO/IEC 10918-これは、レガシー アプリケーションが Rec. ITU-T T.81 | に準拠していることを意味します。 ISO/IEC 10918-1 は、この文書に準拠するエンコーダによって生成されたストリームを再構築できますが、完全なダイナミック レンジや品質で、またはこの文書で定義されている他の機能を使用してそのようなストリームを再構築できない可能性があります。

このドキュメントは、ISO/IEC 18477-1 に準拠したコード ストリームをサイドチャネルとメタデータで強化するための柔軟で拡張可能なフレームワークを提供します。この文書で選択された構文は、「ボックス」として示される構文要素を Rec. ITU-T T.81 | に埋め込むメカニズムを定義します。 ISO/IEC 10918-1 準拠のコード ストリーム。この文書で使用されるボックス構文は、JPEG シリーズ、たとえば JPEG 2000 画像符号化システム (Rec. ITU-T T.800 | ISO/IEC 15444-1) で定義されているものと同じです。ボックスは、アルファ チャネルなどを含む、より高いビット深度、ハイ ダイナミック レンジ (HDR) の画像のエンコードを可能にする追加の画像データ、またはレガシー Rec. ITU-T T のデコード プロセスを記述するメタデータのいずれかを伝送します。 .81 | ISO/IEC 10918-1 コード ストリームと拡張イメージまたは HDR イメージへのサイド チャネル。

この文書は、既存の Rec. ITU-T T.81 | 上に構築された、JPEG XT と呼ばれる拡張可能なファイル形式を指定します。 ISO/IEC 10918-1 コード ストリーム定義。通常、ファイル フォーマットはボックスなどの追加の構文要素を使用してコードストリームをカプセル化しますが、この文書で指定されているファイル フォーマット構造は、ボックスと呼ばれるファイル フォーマットの構文要素をコードストリームに埋め込みます。この珍しい取り決めの必要性は、レガシー標準とそれを中心に構築されたアプリケーション ツールチェーンに対する下位互換性です。これは、レガシー アプリケーションが Rec. ITU-T T.81 | に準拠していることを意味します。 ISO/IEC 10918-1 は、この文書に準拠するファイルに埋め込まれた画像情報をデコードできますが、復元できるのは、完全なファイルで記述されている画像の 3 つのコンポーネント、サンプルあたり 8 ビットの低品質バージョンのみです。

より要求の厳しいアプリケーションでは、ビット深度 16 を使用することも珍しくありません。これにより、ピクセル内の各チャネルを記述するために 65,536 個の表現可能な値が提供され、結果として 2.8 × 10 14を超える表現可能な色値が得られます。あまり一般的ではないシナリオでは、さらに大きなビット深度が使用され、画像のダイナミック レンジが非常に高くなるため、浮動小数点ベースのエンコードが望ましい場合もあります。一部のアプリケーションでは、画像情報に加えて、追加の不透明度チャネルも必要になりますが、これは従来の標準では利用できない機能です。

最も一般的な写真および画像形式は、8 ビットまたは 16 ビットの符号なし整数値を使用して、各カラー チャネルの強度の関数を表します。現実世界の色に特定の数値を割り当てる 1 つの方法について合意することは理論的には可能ですが、それは現実的ではありません。特定のデバイスには独自の限られた色再現範囲があるため、デバイスの範囲は合意された普遍的な色範囲のごく一部になる可能性があります。結果として、このようなアプローチは、特にチャネルごとに 8 ビット (または 256 個の一意の値) のみを使用する場合、利用可能な数値を非常に非効率的に使用することになります。ピクセル値をできるだけ効率的に表現するために、デバイスは、可能な色または色域の独自の範囲に合わせて最適化された数値エンコードを使用します。

JPEG XT は、従来の JPEG 標準をより高いビット深度、より高いダイナミック レンジ、および広色域コンテンツに向けて拡張すると同時に、従来のアプリケーションがコードストリーム内の画像データを標準的な低ダイナミック レンジ (LDR) 画像にデコードできるように設計されています。チャネルあたりわずか 8 ビットです。目標は、レガシー アプリケーションと既存のツールチェーンがこのドキュメントに準拠したコードストリーム上で動作し続けることを可能にする、下位互換性のあるコーディング仕様を提供することです。

JPEG XT は、レガシー アプリケーションとの下位互換性を持ちながら、同時にコーディングの複雑さが少なくなるように設計されています。 JPEG XT は、可能な限り、Rec. ITU-T T.81 | の機能ブロックを使用します。 ISO/IEC 10918-1 は、従来の JPEG コーディング システムの機能を拡張します。

Introduction

This document is an extension of ISO/IEC 18477-1, a compression system for continuous-tone digital still images, which is backwards compatible with Rec. ITU-T T.81 | ISO/IEC 10918-1. This means that legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to reconstruct streams generated by an encoder conforming to this document, although it is possible that they will not be able to reconstruct such streams in full dynamic range or quality or using other features defined in this document.

This document provides a flexible and extensible framework to enrich ISO/IEC 18477-1 conforming codestreams with side-channels and metadata. The syntax chosen in this document defines a mechanism to embed syntax elements denoted as “boxes” into Rec. ITU-T T.81 | ISO/IEC 10918-1 conforming codestreams. The box syntax used in this document is identical to that defined in the JPEG series, for example JPEG 2000 image coding system (Rec. ITU-T T.800 | ISO/IEC 15444-1). Boxes will then carry either additional image data, to enable encoding of images of higher bit depth, high-dynamic range (HDR), including alpha channels, etc., or metadata that describes the decoding process of the legacy Rec. ITU-T T.81 | ISO/IEC 10918-1 codestream and the side channels to an extended or HDR image.

This document specifies an extensible file format, denoted as JPEG XT, which is built on top of the existing Rec. ITU-T T.81 | ISO/IEC 10918-1 codestream definition. While typically, file formats encapsulate codestreams by means of additional syntax elements such as boxes, the file format structure specified in this document embeds the syntax elements of the file format, called boxes, into the codestream. The necessity for this unusual arrangement is the backwards compatibility to the legacy standard and the application toolchain built around it. This means that legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to decode image information embedded in files conforming to this document, although they will only be able to recover a three component, 8 bit per sample, lower quality version of the image described by the full file.

For more demanding applications, it is not uncommon to use a bit depth of 16, providing 65 536 representable values to describe each channel within a pixel, resulting on over 2.8 × 1014 representable colour values. In some less common scenarios, even greater bit depths are used, and sometimes the dynamic range of the image is so high that a floating-point based encoding is desirable. In addition to image information, some applications also require an additional opacity channel, a feature not available from the legacy standard.

Most common photo and image formats use an 8-bit or 16-bit unsigned integer value to represent some function of the intensity of each colour channel. While it can be theoretically possible to agree on one method for assigning specific numerical values to real world colours, doing so is not practical. Since any specific device has its own limited range for colour reproduction, the device’s range can be a small portion of the agreed-upon universal colour range. As a result, such an approach is an extremely inefficient use of the available numerical values, especially when using only 8 bits (or 256 unique values) per channel. To represent pixel values as efficiently as possible, devices use a numeric encoding optimized for their own range of possible colours or gamut.

JPEG XT is designed to extend the legacy JPEG standard towards higher bit depth, higher dynamic range, and wide colour gamut content, while simultaneously allowing legacy applications to decode the image data in the codestream to a standard low-dynamic range (LDR) image represented by only 8 bits per channel. The goal is to provide a backwards compatible coding specification that allows legacy applications and existing toolchains to continue to operate on codestreams conforming to this document.

JPEG XT has been designed to be backwards compatible to legacy applications while at the same time having a small coding complexity. JPEG XT uses, whenever possible, functional blocks of Rec. ITU-T T.81 | ISO/IEC 10918-1 to extend the functionality of the legacy JPEG coding system.