ISO/IEC 18477-8:2020 情報技術—連続トーン静止画像のスケーラブルな圧縮とコーディング—パート8:ロスレスおよびほぼロスレスコーディング | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

導入

この文書は、連続階調の高ダイナミック レンジおよび低ダイナミック レンジの写真コンテンツを保存するためのコード化されたコードストリーム形式を指定します。これは、8 ~ 16 ビット解像度の整数サンプル、または 16 ビット解像度の浮動小数点サンプルで構成される複数のコンポーネント画像をサポートする、スケーラブルな非可逆画像コーディング システムです。これ自体は、中間レンジおよび高ダイナミック レンジの画像復号化アルゴリズムを指定する ISO/IEC 18477-6 および ISO/IEC 18477-7 の拡張です。これらはどちらも ISO/IEC 18477-3 で指定されたボックスベースのファイル形式に基づいており、これも ISO/IEC 18477-1 の拡張版です。コードストリームは、レガシー アプリケーションが Rec. ITU-T T.81 | ISO/IEC 10918-1 は、損失の多い、低ダイナミック レンジの画像のサンプル バージョンごとに 8 ビットを再構築できます。

現在、最も広く使用されているデジタル写真形式である JPEG (Rec. ITU-T T.81 | ISO/IEC 10918-1 で規定) の最小限の実装では、ビット深度 8 が使用されます。画像ピクセルを構成する 3 つのチャネルはそれぞれ 8 ビットで表され、チャネルごとに 256 個の表現可能な値が提供されます。より要求の厳しいアプリケーションでは、ビット深度 16 を使用することも珍しくありません。これにより、ピクセル内の各チャネルを記述するために 65,536 個の表現可能な値が提供され、結果として 2.8×10 14を超える表現可能な色値が得られます。あまり一般的ではないシナリオでは、さらに大きなビット深度が使用され、浮動小数点サンプル表現が必要になります。

最も一般的な写真および画像形式は、8 ビットまたは 16 ビットの符号なし整数値を使用して、各カラー チャネルの強度の関数を表します。現実世界の色に特定の数値を割り当てる 1 つの方法について合意することは理論的には可能かもしれませんが、それは現実的ではありません。特定のデバイスには色再現の制限された範囲があるため、そのデバイスの範囲は合意された普遍的な色範囲のごく一部である可能性があります。結果として、このようなアプローチは、特にチャネルごとに 8 ビット (または 256 個の一意の値) のみを使用する場合、利用可能な数値を非常に非効率的に使用することになります。ピクセル値をできるだけ効率的に表現するために、デバイスは、可能な色または色域の独自の範囲に合わせて最適化された数値エンコードを使用します。

このドキュメントは主に、ISO/IEC 18477-1 で定義されたツールとそれらのツールの最小限の拡張機能を使用して、 損失なし 、または正確に制御可能な有界損失で中間または高度の動的画像サンプル値をエンコードするように設計されています。目標は、レガシー アプリケーションと既存のツールチェーンがこのドキュメントに準拠したコードストリーム上で動作し続けることを可能にする、下位互換性のあるコーディング仕様を提供することです。

JPEG XT は、レガシー アプリケーションとの下位互換性を持ちながら、同時にコーディングの複雑さが少ないように設計されています。 JPEG XT は、可能な限り Rec. の機能ブロックを使用します。 ITU-T T.81 | ISO/IEC 10918-1 は、従来の JPEG コーディング システムの機能を拡張します。これは、中および高ダイナミック レンジおよび広色域の 8 ~ 16 ビット整数または 16 ビット浮動小数点画像のストレージと送信用に最適化されており、同時に低複雑さのエンコーダおよびデコーダの実装も可能にします。

この文書は ISO/IEC 18477-1 の拡張版であり、Rec. と下位互換性のある連続階調デジタル静止画像用の圧縮システムです。 ITU-T T.81 | ISO/IEC 10918-つまり、Rec. に準拠するレガシー アプリケーションです。 ITU-T T.81 | ISO/IEC 10918-1 は、この文書に準拠するエンコーダによって生成されたストリームを再構築できますが、そのようなストリームを完全なダイナミック レンジ、完全な品質、または損失なしで再構築することはできない可能性があります。

この文書自体は、他の JPEG 標準と同様のボックスベースのファイル形式を定義する ISO/IEC 18477-3 に基づいています。 ISO/IEC 18477-6 および ISO/IEC 18477-7 の要素も含まれています。このドキュメントの目的は、中間および高ダイナミック レンジの画像、つまり 8 ~ 16 ビットの精度を必要とするサンプル値で表される画像、または 16 ビット浮動小数点サンプル解像度を使用する画像のロスレス コーディングをサポートするための移行パスをレガシー アプリケーションに提供することです。録音中。 ITU-T T.81 | ISO/IEC 10918-1 では、整数サンプルの可逆モードがすでに定義されており、このモードでエンコードされた画像は、非可逆 8 ビット モードのみをサポートするアプリケーションではデコードできません。 Rec のロスレス コーディングのためのコーディング エンジン。 ITU-T T.81 | ISO/IEC 10918-1 は非可逆符号化モードとはまったく異なります。従来の標準とは異なり、このドキュメントでは、従来のアプリケーションとの互換性を維持しながら、16 ビット浮動小数点サンプルを含む、サンプルあたり 8 ~ 16 ビットのすべてのビット深度をサポートするロスレス スケーラブル コーディング エンジンを定義します。このようなアプリケーションは引き続き動作しますが、再構築できるのは、コードストリームに含まれる完全なイメージの非可逆 8 ビット標準低ダイナミック レンジ (LDR) バージョンのみです。 ISO/IEC 18477 シリーズは、JPEG XT と呼ばれるコード化されたファイル形式を指定します。この形式は、主に連続階調の写真コンテンツの保存と交換のために設計されています。

Introduction

This document specifies a coded codestream format for storage of continuous-tone high and low dynamic range photographic content. This is a scalable lossy to lossless image coding system supporting multiple component images consisting of integer samples between 8- and 16-bit resolution, or floating point samples of 16-bit resolution. It is by itself an extension of ISO/IEC 18477-6 and ISO/IEC 18477-7, which specify intermediate range and high-dynamic range image decoding algorithms. Both of these are based on the box-based file format specified in ISO/IEC 18477-3, which is again an extension of ISO/IEC 18477-1; the codestream is composed in such a way that legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 are able to reconstruct a lossy, low dynamic range, 8 bits per sample version of the image.

Today, the most widely used digital photography format, a minimal implementation of JPEG (specified in Rec. ITU-T T.81 | ISO/IEC 10918-1), uses a bit depth of 8; each of the three channels that together compose an image pixel is represented by 8 bits, providing 256 representable values per channel. For more demanding applications, it is not uncommon to use a bit depth of 16, providing 65 536 representable values to describe each channel within a pixel, resulting in over 2.8×1014 representable colour values. In some less common scenarios, even greater bit depths are used, requiring a floating-point sample representation.

Most common photo and image formats use an 8-bit or 16-bit unsigned integer value to represent some function of the intensity of each colour channel. While it might be theoretically possible to agree on one method for assigning specific numerical values to real world colours, doing so is not practical. Since any specific device has its own limited range for colour reproduction, the device’s range may be a small portion of the agreed-upon universal colour range. As a result, such an approach is an extremely inefficient use of the available numerical values, especially when using only 8 bits (or 256 unique values) per channel. To represent pixel values as efficiently as possible, devices use a numeric encoding optimized for their own range of possible colours or gamut.

This document is primarily designed to encode intermediate or high dynamic image sample values without loss , or with a precisely controllable bounded loss using the tools defined in ISO/IEC 18477-1 and some minimal extensions of those tools. The goal is to provide a backwards-compatible coding specification that allows legacy applications and existing toolchains to continue to operate on codestreams conforming to this document.

JPEG XT has been designed to be backwards compatible to legacy applications while at the same time having a small coding complexity; JPEG XT uses, whenever possible, functional blocks of Rec. ITU-T T.81 | ISO/IEC 10918-1 to extend the functionality of the legacy JPEG coding system. It is optimized for storage and transmission of intermediate and high dynamic range and wide colour gamut 8- to 16-bit integer or 16-bit floating point images while also enabling low-complexity encoder and decoder implementations.

This document is an extension of ISO/IEC 18477-1, a compression system for continuous tone digital still images which is backwards compatible with Rec. ITU-T T.81 | ISO/IEC 10918-1. That is, legacy applications conforming to Rec. ITU-T T.81 | ISO/IEC 10918-1 will be able to reconstruct streams generated by an encoder conforming to this document, though will possibly not be able to reconstruct such streams in full dynamic range, full quality or without loss.

This document is itself based on ISO/IEC 18477-3 that defines a box-based file format similar to other JPEG standards. It also contains elements of ISO/IEC 18477-6 and ISO/IEC 18477-7. The aim of this document is to provide a migration path for legacy applications to support lossless coding of intermediate and high dynamic range images, that is images that are either represented by sample values requiring 8- to 16-bit precision, or even using 16-bit floating point sample resolution. While Rec. ITU-T T.81 | ISO/IEC 10918-1 already defines a lossless mode for integer samples, images encoded in this mode cannot be decoded by applications only supporting the lossy 8-bit-mode; the coding engine for lossless coding in Rec. ITU-T T.81 | ISO/IEC 10918-1 is completely different from the lossy coding mode. Unlike the legacy standard, this document defines a lossless scalable coding engine supporting all bit depths between 8 and 16 bits per sample, including 16-bit floating point samples, while also staying compatible with legacy applications. Such applications will continue to work, but will only able to reconstruct a lossy 8-bit standard low dynamic range (LDR) version of the full image contained in the codestream. The ISO/IEC 18477 series specifies a coded file format, referred to as JPEG XT, which is designed primarily for storage and interchange of continuous-tone photographic content.