ISO/IEC 15938-14:2018 情報技術—マルチメディアコンテンツ記述インターフェース—パート14:視覚探索用のコンパクト記述子のリファレンスソフトウェア、適合性および使用ガイドライン | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである各国団体は、特定の技術活動分野に対処するためにそれぞれの組織によって設立された技術委員会を通じて国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力します。政府および非政府の他の国際機関も、ISO および IEC と連携してこの作業に参加しています。情報技術の分野では、ISO と IEC は共同技術委員会 ISO/IEC JTC 1 を設立しました。

この文書の作成に使用される手順と、そのさらなる保守を目的とした手順は、ISO/IEC 指令Part 1 部に記載されています。特に、さまざまなタイプの文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令Part 2 部の編集規則に従って起草されました ( www.iso.org/directives を参照)

この文書の要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。文書の作成中に特定された特許権の詳細は、序論および/または受け取った特許宣言の ISO リストに記載されます ( www.iso.org/patents を 参照)

本書で使用されている商号は、ユーザーの便宜のために提供された情報であり、推奨を構成するものではありません。

規格の自主的な性質、適合性評価に関連する ISO 固有の用語と表現の意味、および貿易の技術的障壁 (TBT) における世界貿易機関 (WTO) 原則への ISO の準拠に関する情報については、以下を参照してください。次の URL: www.iso.org/iso/foreword.html

この文書は、ISO/IEC JTC 1, 情報技術、サブ委員会 SC 29, オーディオ、画像、マルチメディアおよびハイパーメディア情報のコーディングによって作成されました。

ISO/IEC 15938 シリーズのすべての部品のリストは、ISO の Web サイトでご覧いただけます。

序章

ISO/IEC 15938 (すべての部分) は「マルチメディア コンテンツ記述インターフェイス」としても知られ、マルチメディア コンテンツを記述するための標準化された一連のテクノロジを提供します。マルチメディア コンテンツの機能を記述するためのメタデータ システムを提供することで、幅広いマルチメディア アプリケーションと要件に対応します。

ISO/IEC 15938(全部)では以下のことが規定されています。

  • 記述スキーム (DS) は、 マルチメディア コンテンツに関連するエンティティまたは関係を記述します。記述スキームは、記述スキーム、記述子、またはデータ型などのコンポーネントの構造とセマンティクスを指定します。
  • 記述子 (D) は、 マルチメディア コンテンツの機能、属性、または属性のグループを記述します。
  • データ型は 、記述スキームと記述子で使用される基本的な再利用可能なデータ型です。
  • システム ツールは、 説明の配信、マルチメディア コンテンツとの説明の多重化、同期、ファイル形式などをサポートします。

ISO/IEC 15938 は 14 の部分から構成されます。

  • Part 1 – システム : 効率的な転送と保存のために説明を準備し、説明を圧縮し、コンテンツと説明の間の同期を可能にするためのツールを指定します。
  • Part 2 – 記述定義言語 : 記述ツールの国際標準セット (DS, D, およびデータ型) を定義するための言語と、新しい記述ツールを定義するための言語を指定します。
  • Part 3 – Visual : ビジュアル コンテンツに関連する記述ツールを指定します。
  • Part 4 – オーディオ : オーディオ コンテンツに関連する説明ツールを指定します。
  • Part 5 – マルチメディア記述スキーム : オーディオおよびビジュアル コンテンツを含むマルチメディアに関連する一般的な記述ツールを指定します。
  • Part 6 – 参照ソフトウェア : ISO/IEC 15938 のソフトウェア実装を提供します。
  • Part 7 – 適合性テスト : ISO/IEC 15938 の実装の適合性をテストするためのガイドラインと手順を指定します。
  • Part 8 – MPEG-7 記述の抽出と使用 : 記述の抽出と使用のガイドラインと例を示します。
  • Part 9 – プロファイルとレベル : ガイドラインと標準プロファイルを提供します。
  • Part 10 – スキーマ定義 : 記述定義言語を使用してスキーマを指定します。
  • Part 11 – プロファイル スキーマ : 記述定義言語を使用したプロファイル スキーマのリスト。
  • Part 12 – クエリ フォーマット : MPEG クエリ フォーマット (MPQF) のツールが含まれています。
  • Part 13 – ビジュアル検索用のコンパクト記述子 : ビジュアル検索アプリケーション用の画像記述ツールを指定します。
  • Part 14 – 参照ソフトウェア、ビジュアル検索用コンパクト記述子の適合性および使用ガイドライン : リファレンス ソフトウェアを提供し、適合性テストを指定し、ビジュアル検索用コンパクト記述子の使用ガイドラインを示します。

ISO/IEC 15938-13 で指定されているビジュアル検索用コンパクト記述子 (CDVS)​​ ツールは、効率的で相互運用可能なビジュアル検索アプリケーションを実現し、画像内のビジュアル コンテンツのマッチングを可能にするように設計されています。ビジュアル コンテンツのマッチングには、オブジェクト、ランドマーク、印刷文書のビューのマッチングが含まれますが、部分的なオクルージョンや視点、カメラ パラメーター、照明条件の変化に対しても堅牢です。

ISO/IEC 15938-14:

  • CDVS の参照ソフトウェアを指定します (第 5 項)
  • CDVS の適合性テスト データセット、参照記述子、および条件を指定します (第 6 条)
  • CDVS の使用に関するガイドラインを提供します (第 7 条)

CDVS リファレンス ソフトウェアは、 http://standards.iso.org/iso-iec/15938/-14/ed-1/en で提供されています。

1 スコープ

この文書は、リファレンス ソフトウェアを提供し、適合性テストを指定し、ISO/IEC 15938-13 の使用ガイドラインを示します。

2 規範的参照

この文書には規範的な参照はありません。

3 用語と定義

この文書の目的上、次の用語と定義が適用されます。

ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。

3.1

画像記述子

1 つの画像から抽出された記述子

3.2

画像記述子の長さ

画像記述子のバイト単位のサイズ

注1: ​​ISO/IEC 15938-13は、6つの平均(すなわち、多数の画像にわたる)画像記述子長、すなわち、512バイト、1024バイト、2048バイト、4096バイト、8192バイトおよび16384バイトを規定している。

3.3

関心点

透視変換、画像スケールの変化、照明の変化など、画像領域内の局所的および全体的な摂動下での検出の安定性を示す画像内の点

3.4

地方

局所特徴記述子の生成に使用される、関心点の近くの画像内の領域

3.5

局所特徴記述子

ローカル領域の記述子

3.6

グローバル記述子

局所特徴記述子を画像のコンパクトな表現に集約

3.7

圧縮された局所特徴記述子

局所特徴記述子の圧縮表現

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the different types of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives ).

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation on the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see the following URL: www.iso.org/iso/foreword.html .

This document was prepared by ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.

A list of all parts in the ISO/IEC 15938 series can be found on the ISO website.

Introduction

ISO/IEC 15938 (all parts) also known as “Multimedia Content Description Interface,” provides a standardized set of technologies for describing multimedia content. It addresses a broad spectrum of multimedia applications and requirements by providing a metadata system for describing the features of multimedia content.

The following are specified in ISO/IEC 15938 (all parts).

  • Description schemes (DS) describe entities or relationships pertaining to multimedia content. Description schemes specify the structure and semantics of their components, which may be Description Schemes, descriptors, or datatypes.
  • Descriptors (D) describe features, attributes, or groups of attributes of multimedia content.
  • Datatypes are the basic reusable datatypes employed by description schemes and descriptors
  • Systems tools support delivery of descriptions, multiplexing of descriptions with multimedia content, synchronization, file format, and so forth.

ISO/IEC 15938 consists of 14 parts.

  • Part 1 – Systems : specifies the tools for preparing descriptions for efficient transport and storage, compressing descriptions, and allowing synchronization between content and descriptions.
  • Part 2 – Description definition language : specifies the language for defining the International Standard set of description tools (DSs, Ds, and datatypes) and for defining new description tools.
  • Part 3 – Visual : specifies the description tools pertaining to visual content.
  • Part 4 – Audio : specifies the description tools pertaining to audio content.
  • Part 5 – Multimedia description schemes : specifies the generic description tools pertaining to multimedia including audio and visual content.
  • Part 6 – Reference software : provides a software implementation of ISO/IEC 15938.
  • Part 7 – Conformance testing : specifies the guidelines and procedures for testing conformance of implementations of ISO/IEC 15938.
  • Part 8 – Extraction and use of MPEG-7 descriptions : provides guidelines and examples of the extraction and use of descriptions.
  • Part 9 – Profiles and levels : provides guidelines and standard profiles.
  • Part 10 – Schema definition : specifies the schema using description definition language.
  • Part 11 – Profile Schemas : listing of profile schemas using description definition language.
  • Part 12 – Query format : contains the tools of the MPEG Query Format (MPQF).
  • Part 13 – Compact descriptors for visual search : specifies an image description tool for visual search applications.
  • Part 14 – Reference software, conformance and usage guidelines for compact descriptors for visual search : provides the reference software, specifies the conformance testing, and gives usage guidelines for compact descriptors for visual search.

The compact descriptors for visual search (CDVS) tool specified in ISO/IEC 15938-13 is designed to enable efficient and interoperable visual search applications, allowing visual content matching in images. Visual content matching includes matching of views of objects, landmarks, and printed documents, while being robust to partial occlusions as well as changes in viewpoint, camera parameters, and lighting conditions.

ISO/IEC 15938-14:

  • specifies the reference software for CDVS (Clause 5);
  • specifies the conformance testing dataset, reference descriptors and conditions for CDVS (Clause 6);
  • provides guidelines for the usage of CDVS (Clause 7).

The CDVS reference software is provided at http://standards.iso.org/iso-iec/15938/-14/ed-1/en .

1 Scope

This document provides the reference software, specifies the conformance testing, and gives usage guidelines for ISO/IEC 15938-13.

2 Normative references

There are no normative references in this document.

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

3.1

image descriptor

descriptor extracted from one image

3.2

image descriptor length

size of an image descriptor in bytes

Note 1 to entry: ISO/IEC 15938-13 specifies six average (i.e. over a large number of images) image descriptor lengths, i.e. 512 bytes, 1024 bytes, 2048 bytes, 4096 bytes, 8192 bytes and 16384 bytes.

3.3

interest point

point in an image showing detection stability under local and global perturbations in the image domain, including perspective transformations, changes in image scale, and illumination variations

3.4

local region

area in an image in the neighbourhood of an interest point, used to generate local feature descriptors

3.5

local feature descriptor

descriptor of a local region

3.6

global descriptor

aggregation of local feature descriptors into a compact representation of the image

3.7

compressed local feature descriptor

compressed representation of a local feature descriptor