この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序章
このドキュメントは ISO/IEC 18477-1 の拡張であり、Rec. ITU-T T.81 | と下位互換性のある連続階調デジタル静止画像の圧縮システムです。 ISO/IEC 10918-つまり、Rec. ITU-T T.81 | 準拠のレガシー アプリケーションです。 ISO/IEC 10918-1 は、このドキュメントに準拠するエンコーダによって生成されたストリームを再構築できますが、そのようなストリームを完全なダイナミック レンジ、完全な品質、またはこのドキュメントで定義されているその他の機能で再構築できない可能性があります。
このドキュメントの目的は、レガシ アプリケーションが高ダイナミック レンジ イメージのコーディングをサポートするための移行パスを提供することです。既存の標準に依存する既存のツールは引き続き機能しますが、コードストリームに含まれる画像の非可逆バージョンおよび/または低ダイナミック レンジ バージョンのみを再構築できます。このドキュメントでは、JPEG XT と呼ばれるコードストリームを指定します。これは、主に連続階調の写真コンテンツの保存と交換のために設計されています。
このドキュメントでは、連続階調の高ダイナミック レンジおよび低ダイナミック レンジの写真コンテンツを格納するためのコード化されたコードストリーム形式を指定します。 JPEG XT 2 は、浮動小数点で複数のコンポーネント イメージをサポートするスケーラブルなイメージ コーディング システムです。それ自体は、ISO/IEC 18477-1 で定義されているコーディング ツールの拡張です。コード ストリームは、レガシー アプリケーションが Rec. ITU-T T.81 に準拠するように構成されています。 ISO/IEC 10918-1 は、低品質、低ダイナミック レンジ、サンプルあたり 8 ビットのイメージ バージョンを再構築できます。
今日、最も広く使用されているデジタル写真形式である JPEG の最小限の実装 (Rec. ITU-T T.81 | ISO/IEC 10918-1 で指定) は、8 のビット深度を使用します。一緒に画像ピクセルを構成する 3 つのチャネルはそれぞれ 8 ビットで表され、チャネルごとに 256 の表現可能な値を提供します。より要求の厳しいアプリケーションでは、16 以上のビット深度を使用することは珍しくなく、ピクセル内の各チャネルを表すために 65 536 を超える表現可能な値を提供し、2.8 × 10 14を超える表現可能な色値をもたらします。あまり一般的でないシナリオでは、さらに大きなビット深度が使用されます。
最も一般的な写真および画像形式では、8 ビットまたは 16 ビットの符号なし整数値を使用して、各カラー チャネルの強度の関数を表します。理論的には、特定の数値を現実世界の色に割り当てる 1 つの方法に合意することは可能かもしれませんが、そうするのは現実的ではありません。特定のデバイスには、色再現の範囲が限られているため、デバイスの範囲は、合意されたユニバーサル カラー範囲のごく一部である可能性があります。結果として、このようなアプローチは、特にチャネルごとに 8 ビット (または 256 の一意の値) しか使用しない場合、利用可能な数値の使用が非常に非効率的です。ピクセル値を可能な限り効率的に表現するために、デバイスは、可能な色または色域の独自の範囲に合わせて最適化された数値エンコーディングを使用します。
JPEG XT は主に、ISO/IEC 18477-1 で定義されたツールを使用して、ハイ ダイナミック レンジと広色域コンテンツを含むコード化データを提供すると同時に、ピクセルあたり 8 ビットのロー ダイナミック レンジ イメージを提供するように設計されています。目標は、レガシー アプリケーションと既存のツールチェーンが、このドキュメントに準拠したコード ストリームで動作し続けることを可能にする下位互換性のあるコーディング仕様を提供することです。
JPEG XT は、レガシー アプリケーションと下位互換性を持つように設計されていると同時に、コーディングの複雑さを軽減するように設計されています。 JPEG XT は、可能な限り、Rec. ITU-T T.81 | の機能ブロックを使用します。 ISO/IEC 10918-1 は、従来の JPEG コーディング システムの機能を拡張します。高ダイナミック レンジと広色域の 32 ビット フロート イメージの保存と転送に最適化されていると同時に、複雑さの少ないエンコーダとデコーダの実装も可能になります。
Introduction
This document is an extension of ISO/IEC 18477-1, a compression system for continuous tone digital still images which is backward compatible with Rec. ITU-T T.81 | ISO/IEC 10918-1. That is, legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to reconstruct streams generated by an encoder conforming to this document, but will possibly not be able to reconstruct such streams in full dynamic range, full quality or other features defined in this document.
The aim of this document is to provide a migration path for legacy applications to support coding of high-dynamic range images. Existing tools depending on the existing standards will continue to work, but will only be able to reconstruct a lossy and/or a low-dynamic range version of the image contained in the codestream. This document specifies a codestream, referred to as JPEG XT, which is designed primarily for storage and interchange of continuous-tone photographic content.
This document specifies a coded codestream format for storage of continuous-tone high and low dynamic range photographic content. JPEG XT 2 is a scalable image coding system supporting multiple component images in floating point. It is by itself an extension of the coding tools defined in ISO/IEC 18477-1; the codestream is composed in such a way that legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 are able to reconstruct a lower quality, low dynamic range, eight bits per sample version of the image.
Today, the most widely used digital photography format, a minimal implementation of JPEG (specified in Rec. ITU-T T.81 | ISO/IEC 10918-1), uses a bit depth of 8; each of the three channels that together compose an image pixel is represented by 8 bits, providing 256 representable values per channel. For more demanding applications, it is not uncommon to use a bit depth of 16 or higher, providing greater than 65 536 representable values to describe each channel within a pixel, resulting on over 2.8 × 1014 representable colour values. In some less common scenarios, even greater bit depths are used.
The most common photo and image formats use an 8-bit or 16-bit unsigned integer value to represent some function of the intensity of each colour channel. While it might be theoretically possible to agree on one method for assigning specific numerical values to real world colours, doing so is not practical. Since any specific device has its own limited range for colour reproduction, the device’s range may be a small portion of the agreed-upon universal colour range. As a result, such an approach is an extremely inefficient use of the available numerical values, especially when using only 8 bits (or 256 unique values) per channel. To represent pixel values as efficiently as possible, devices use a numeric encoding optimized for their own range of possible colours or gamut.
JPEG XT is primarily designed to provide coded data containing high dynamic range and wide colour gamut content while simultaneously providing 8 bits per pixel low dynamic range images using tools defined in ISO/IEC 18477-1. The goal is to provide a backward compatible coding specification that allows legacy applications and existing toolchains to continue to operate on codestreams conforming to this this document.
JPEG XT has been designed to be backward compatible to legacy applications while at the same time having a small coding complexity; JPEG XT uses, whenever possible, functional blocks of Rec. ITU-T T.81 | ISO/IEC 10918-1 to extend the functionality of the legacy JPEG Coding System. It is optimized for storage and transmission of high dynamic range and wide colour gamut 32 bit float images while also enabling low-complexity encoder and decoder implementations.