ISO/IEC 18477-3:2015 情報技術—連続トーン静止画像のスケーラブルな圧縮とコーディング—パート3:ボックスファイル形式 | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序章

ISO/IEC 18477 のこの部分は、既存の Rec. ITU-T T.81 | ISO/IEC 10918-1 コード ストリーム定義。通常、ファイル形式はボックスなどの追加の構文要素によってコード ストリームをカプセル化しますが、ここで指定されたファイル形式構造は、ボックスと呼ばれるファイル形式の構文要素をコード ストリームに埋め込みます。この通常とは異なる配置の必要性は、レガシー標準とそれを中心に構築されたアプリケーション ツールチェーンとの後方互換性です。つまり、Rec. ITU-T T.81 | 準拠のレガシー アプリケーションです。 ISO/IEC 10918-1 は、ISO/IEC 18477 標準のファミリーに準拠するファイルに埋め込まれた画像情報をデコードできますが、3 つのコンポーネント、サンプルあたり 8 ビット、説明されている画像の低品質バージョンのみを復元できます。完全なファイルによって。

より要求の厳しいアプリケーションでは、ビット深度 16 を使用して、ピクセル内の各チャネルを表すために 65 536 の表現可能な値を提供し、2.8 × 10 14を超える表現可能な色の値を提供することは珍しくありません。あまり一般的ではないシナリオでは、さらに大きなビット深度が使用され、画像のダイナミック レンジが非常に高いため、浮動小数点ベースのエンコーディングが望ましい場合があります。画像情報に加えて、一部のアプリケーションでは追加の不透明度チャネルも必要になります。これは、従来の標準では利用できない機能です。

最も一般的な写真および画像形式では、8 ビットまたは 16 ビットの符号なし整数値を使用して、各カラー チャネルの強度の関数を表します。理論的には、特定の数値を現実世界の色に割り当てる 1 つの方法に合意することは可能かもしれませんが、そうするのは現実的ではありません。特定のデバイスには、色再現の範囲が限られているため、デバイスの範囲は、合意されたユニバーサル カラー範囲のごく一部である可能性があります。結果として、このようなアプローチは、特にチャネルごとに 8 ビット (または 256 の一意の値) しか使用しない場合、使用可能な数値の使用が非常に非効率的になります。ピクセル値を可能な限り効率的に表現するために、デバイスは、可能な色または色域の独自の範囲に合わせて最適化された数値エンコーディングを使用します。

JPEG XT は、従来の JPEG 標準をより高いビット深度、より高いダイナミック レンジ、広い色域コンテンツに拡張すると同時に、従来のアプリケーションがコードストリーム内の画像データをチャネルあたりわずか 8 ビットで表される標準の低ダイナミック レンジ画像にデコードできるように設計されています。目標は、旧式のアプリケーションと既存のツールチェーンが、ISO/IEC 18477 標準のファミリーに準拠したコードストリームで動作し続けることを可能にする後方互換性のあるコーディング仕様を提供することです。

JPEG XT は、レガシー アプリケーションと下位互換性を持つように設計されていると同時に、コーディングの複雑さを軽減するように設計されています。 JPEG XT は、可能な限り、Rec. ITU-T T.81 | の機能ブロックを使用します。 ISO/IEC 10918-1 は、従来の JPEG コーディング システムの機能を拡張します。

ISO/IEC 18477 のこの部分は、ISO/IEC 18477-1 の拡張であり、Rec. ITU-T T.81 と下位互換性のある連続階調デジタル静止画像の圧縮システムです。 ISO/IEC 10918-つまり、Rec. ITU-T T.81 | 準拠のレガシー アプリケーションです。 ISO/IEC 10918-1 は、ISO/IEC 18477 のこの部分に準拠するエンコーダーによって生成されたストリームを再構築できますが、この部分で定義されている完全なダイナミック レンジ、完全な品質、またはその他の機能では、そのようなストリームを再構築できない可能性があります。 ISO/IEC 18477 の。

ISO/IEC 18477 のこの部分の目的は、柔軟で拡張可能なフレームワークを提供して、ISO/IEC 18477-1 準拠のコード ストリームをサイドチャネルとメタデータで強化することです。 ISO/IEC 18477 のこの部分で選択された構文は、「ボックス」として示される構文要素を Rec. ITU-T T.81 | に埋め込むメカニズムを定義します。 ISO/IEC 10918-1 準拠のコード ストリーム。ここで使用されるボックスの構文は、JPEG ファミリの標準 (たとえば、JPEG 2000 (Rec. ITU-T T. 800 | ISO/IEC 15444-1)) で定義されているものと同じです。ボックスは、より高いビット深度、高ダイナミック レンジの画像のエンコードを可能にし、アルファ チャネルなどを含めるために追加の画像データを運ぶか、レガシー Rec. ITU-T T.81 | のデコード プロセスを記述するメタデータを運ぶ。 ISO/IEC 10918-1 コード ストリームとサイド チャネルを拡張または高ダイナミック レンジ イメージに変換します。

Introduction

This part of ISO/IEC 18477 specifies an extensible file format, denoted as JPEG XT, which is built on top of the existing Rec. ITU-T T.81 | ISO/IEC 10918-1 codestream definition. While typically file formats encapsulate codestreams by means of additional syntax elements such as boxes, the file format structure specified here rather embeds the syntax elements of the file format, called boxes, into the codestream. The necessity for this unusual arrangement is the backwards compatibility to the legacy standard and the application toolchain built around it; that is, legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to decode image information embedded in files conforming to the family of ISO/IEC 18477 standards, though will only be able to recover a three component, 8 bits per sample, lower quality version of the image described by the full file.

For more demanding applications, it is not uncommon to use a bit depth of 16, providing 65 536 representable values to describe each channel within a pixel, resulting on over 2,8 × 1014 representable colour values. In some less common scenarios, even greater bit depths are used, and sometimes the dynamic range of the image is so high that a floating point based encoding is desirable. In addition to image information, some applications also require an additional opacity channel, a feature not available from the legacy standard.

Most common photo and image formats use an 8-bit or 16-bit unsigned integer value to represent some function of the intensity of each colour channel. While it might be theoretically possible to agree on one method for assigning specific numerical values to real world colours, doing so is not practical. Since any specific device has its own limited range for colour reproduction, the device’s range may be a small portion of the agreed-upon universal colour range. As a result, such an approach is an extremely inefficient use of the available numerical values, especially when using only 8 bits (or 256 unique values) per channel. To represent pixel values as efficiently as possible, devices use a numeric encoding optimized for their own range of possible colours or gamut.

JPEG XT is designed to extend the legacy JPEG standard towards higher bitdepth, higher dynamic range, wide colour gamut content while simultaneously allowing legacy applications to decode the image data in the codestream to a standard low dynamic range image represented by only eight bits per channel. The goal is to provide a backwards compatible coding specification that allows legacy applications and existing toolchains to continue to operate on codestreams conforming to the family of ISO/IEC 18477 standards.

JPEG XT has been designed to be backwards compatible to legacy applications while at the same time having a small coding complexity; JPEG XT uses, whenever possible, functional blocks of Rec. ITU-T T.81 | ISO/IEC 10918-1 to extend the functionality of the legacy JPEG Coding System.

This part of ISO/IEC 18477 is an extension of ISO/IEC 18477-1, a compression system for continuous tone digital still images which is backwards compatible with Rec. ITU-T T.81 | ISO/IEC 10918-1. That is, legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to reconstruct streams generated by an encoder conforming to this part of ISO/IEC 18477, though will possibly not be able to reconstruct such streams in full dynamic range, full quality or other features defined in this part of ISO/IEC 18477.

The aim of this part of ISO/IEC 18477 is to provide a flexible and extensible framework to enrich ISO/IEC 18477-1 compliant codestreams with side-channels and metadata. The syntax chosen in this part of ISO/IEC 18477 defines a mechanism to embed syntax elements denoted as “Boxes” into Rec. ITU-T T.81 | ISO/IEC 10918-1 compliant codestreams. The box syntax used here is identical to that defined in the JPEG family of standards, for example JPEG 2000 (Rec. ITU-T T. 800 | ISO/IEC 15444-1). Boxes will then carry either additional image data, to enable encoding of images of higher bitdepth, high dynamic range, include alpha channels etc., or will carry metadata that describes the decoding process of the legacy Rec. ITU-T T.81 | ISO/IEC 10918-1 codestream and the side channels to an extended or high dynamic range image.