この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。
この文書の開発に使用された手順と、今後の維持のために意図された手順は、ISO/IEC 指令で説明されています。 1. 特に、さまざまなタイプの ISO 文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令の編集規則に従って作成されました。 2 ( www.iso.org/directives を参照)
このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO は、そのような特許権の一部または全部を特定する責任を負わないものとします。ドキュメントの開発中に特定された特許権の詳細は、序文および/または受信した特許宣言の ISO リストに記載されます ( www.iso.org/patents を参照)
このドキュメントで使用されている商号は、ユーザーの便宜のために提供された情報であり、保証を構成するものではありません。
規格の自主的な性質に関する説明、適合性評価に関連する ISO 固有の用語と表現の意味、および技術的貿易障壁 (TBT) における世界貿易機関 (WTO) の原則への ISO の準拠に関する情報については、次を参照してください。次の URL: www.iso.org/iso/foreword.html
このドキュメントは、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 29, オーディオ、画像、マルチメディア、およびハイパーメディア情報のコーディングによって作成されました。
この第 2 版は、技術的に改訂された第 1 版 (ISO/IEC 23000-13:2014) を取り消して置き換えるものです。
また、改正 ISO/IEC 23000-13:2014/Amd も組み込まれています。 1:201
ISO/IEC 23000 シリーズのすべての部品のリストは、ISO Web サイトで見つけることができます。
序章
拡張現実 (AR) アプリケーションは、実世界環境 (RWE) のビューを指し、その要素は、コンピューター主導のプロセスでグラフィックスやサウンドなどのコンテンツによって拡張されます。 Augmented Reality Application Format (ARAF) は、ISO/IEC 14496-11 Scene Description and Application Engine 標準のサブセットのコレクションであり、他の関連する MPEG 標準 (ISO/IEC 23005, MPEG-V など) と組み合わせて、 2D/3D マルチメディア コンテンツの消費。したがって、このドキュメントでは、クライアントまたはサーバーの手順ではなく、拡張現実のプレゼンテーションを提供するために使用されるデータ形式に焦点を当てています。
1 スコープ
このドキュメントでは、次のことを指定します。
- AR コンテンツを表現するためのシーン記述要素。
- ローカルおよびリモートのセンサーとアクチュエーターに接続するメカニズム。
- 統合された圧縮メディア (画像、オーディオ、ビデオ、グラフィックス) へのメカニズム。
- マップや圧縮メディアなどのリモート リソースに接続するためのメカニズム。
2 参考文献
以下のドキュメントは、その内容の一部またはすべてがこのドキュメントの要件を構成するように、本文で参照されています。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。
- ISO/IEC 10646-1:2012, 情報技術 — Universal multiple-octet coded character set (UCS) — 1: アーキテクチャと基本的な多言語面
- ISO/IEC 14496-1:2010 + Amd. 2:2014, 情報技術 — 視聴覚オブジェクトのコーディング — 1: システム
- ISO/IEC 14496-3:2009, 情報技術 — 視聴覚オブジェクトのコーディング — 3: オーディオ
- ISO/IEC 14496-11:2015, 情報技術 — 視聴覚オブジェクトのコーディング — 11:シーン記述とアプリケーションエンジン
- ISO/IEC 14496-16:2011, 情報技術 — 視聴覚オブジェクトのコーディング — 16:アニメーションフレームワーク拡張(AFX)
- ISO/IEC 14772-1:1997, 情報技術 — コンピュータ グラフィックスおよび画像処理 — 仮想現実モデリング言語 — 1: 機能仕様とUTF-8エンコーディング
- ISO/IEC 23005-5, 情報技術 — メディアのコンテキストと制御 — 5: インタラクション デバイスのデータ形式
3 用語、定義、略語
3.1 用語と定義
このドキュメントの目的のために、ISO/IEC 23000-1 および以下に記載されている用語と定義が適用されます。
ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
3.1.1
ARAF ブラウザ
拡張現実アプリケーション フォーマットに準拠したブラウザ
3.1.2
3 月のシーン
ARAF ブラウザー (3.1.1) によって再生される、MAREC 作成のテキスト結果
グレード 1 ~ エントリ:結果は 3 月の経験です。
3.1.3
3月の経験
ARAF ブラウザを使用して ARAF シーンを再生する行為 (3.1.1)
注記 1: ARAF ブラウザは ARAF シーンを解釈し、エンドユーザーのデバイスに結果を表示します。
3.1.4
コンテンツクリエータ
MAR エクスペリエンス内で使用されているメディア ファイルの作成者 (3.1.3)
注記 1:メディア ファイルは、2D および/または 3D グラフィックス、画像、ビデオ、および/またはサウンドである場合があります。
3.1.5
エンド ユーザー デバイス
エンドユーザーが MAR シーンを再生するために使用するスマートフォンまたはモバイル デバイス (3.1.2)
注記 1:デバイスには、ARAF ブラウザがインストールされている必要があります。
3.1.6
処理サーバー
MAR エクスペリエンス (3.1.3) に必要な処理機能を少なくとも 1 つ提供し、 ARAF ブラウザー (3.1.1) と通信できるサーバー
3.1.7
ターゲット リソース
ターゲット イメージまたはターゲット イメージ記述子
注記 1:ターゲット画像は、認識ライブラリによって検出および認識される画像を表します。ターゲット イメージ記述子は、ターゲット イメージから抽出された視覚記述子によって表されます。ターゲット リソースは、MAREC によって指定されるか、リモート サーバー上のデータベースに既に格納されている可能性があります。
3.1.8
録画済みビデオ
MARECが場所を指定した収録済みの2D映像
注記 1:ビデオ ファイルは、ローカル (MAR エクスペリエンスが再生されるデバイス) またはリモート (Web 上の任意の場所) に保存できます。動画を構成するフレーム(静止画)に対して認識処理を行うものとする。
3.1.9
ライブビデオカメラ (ストリーム)
ライブ 2D ビデオ カメラ フィード
注記 1:リアルタイム キャプチャを提供するカメラの URL は、MAREC によって指定されます。 URL は、MAR エクスペリエンスが再生されるデバイスのカメラの 1 つ、またはライブ ビデオ ストリームを提供でき、ARAF ブラウザが接続できる他のカメラを指すことができます。
3.1.10
画像認識ライブラリ
ビデオ内の ターゲット リソース (3.1.7) を認識できるライブラリ
注記 1:ライブラリは、ローカル (ARAF ブラウザーに実装) またはリモート (処理サーバー上) で実行できます。画像認識ライブラリの結果は、認識されたターゲット リソースのインデックスの配列です。
3.1.11
画像認識および追跡ライブラリ
ビデオ内の ターゲット リソース (3.1.7) を認識して追跡できるライブラリ
注記 1:ライブラリは、ローカル (ARAF ブラウザーに実装) またはリモート (処理サーバー上) で実行できます。認識および追跡ライブラリの結果は、認識されたターゲット リソースとそれらのポーズ マトリックスのインデックスの配列です。認識された各ターゲット リソースには、関連付けられたポーズ マトリックス、または対応するポーズ マトリックスを計算できなかった場合のデフォルト値があります。
3.1.12
増強資源
MAR エクスペリエンスの拡張に使用されるメディア オブジェクト (3.1.3)
注記 1:有効な拡張リソースは、2D/3D グラフィック要素、画像、ビデオ、サウンド、または BIFS シーンにすることができます。 ARAF ブラウザーがそれらの場所にアクセスできる限り、拡張リソースは MAR シーンにローカルに保存することも、Web 上の任意の場所にリモートに保存することもできます。この場合、拡張リソースを指す URL が MAR シーンに格納されます。
3.2 略語
| ar | 拡張現実 |
| アラフ | 拡張現実アプリケーションのフォーマット |
| URI | 統一資源識別子 |
| URL | ユニフォームリソースロケータ |
| 壷 | 統一リソース名 |
| 3月 | 複合現実と拡張現実 |
| マーレ | 複合現実と拡張現実の体験 |
| マレック | 複合現実と拡張現実のエクスペリエンス クリエイター |
| プロト | PROTOtype は、1 つまたは複数の特定の機能を実装するために、シーン グラフ要素をグループ化するために使用されるメカニズムです。 |
| RTR | 認識されたターゲット リソース |
参考文献
| [1] | ISO/IEC 8859-1, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 1: ラテンアルファベット no. 1 |
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.
The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, 1. In particular the different approval criteria needed for the different types of ISO documents should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, 2 (see www.iso.org/directives ).
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).
Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.
For an explanation on the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT) see the following URL: www.iso.org/iso/foreword.html .
This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 29, Coding of audio, picture, multimedia and hypermedia information.
This second edition cancels and replaces the first edition (ISO/IEC 23000-13:2014), which has been technically revised.
It also incorporates the Amendment ISO/IEC 23000-13:2014/Amd. 1:2015.
A list of all parts in the ISO/IEC 23000 series can be found on the ISO website.
Introduction
Augmented Reality (AR) applications refer to a view of a real-world environment (RWE), whose elements are augmented by content, such as graphics or sound, in a computer driven process. Augmented Reality Application Format (ARAF) is a collection of a subset of the ISO/IEC 14496-11 Scene Description and Application Engine standard, combined with other relevant MPEG standards (e.g. ISO/IEC 23005, MPEG-V), designed to enable the consumption of 2D/3D multimedia content. Consequently, this document focuses not on client or server procedures, but on the data formats used to provide an augmented reality presentation.
1 Scope
This document specifies the following:
- scene description elements for representing AR content;
- mechanisms to connect to local and remote sensors and actuators;
- mechanisms to integrated compressed media (image, audio, video, graphics);
- mechanisms to connect to remote resources such as maps and compressed media.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.
- ISO/IEC 10646-1:2012, Information technology — Universal multiple-octet coded character set (UCS) — 1: Architecture and basic multilingual plane
- ISO/IEC 14496-1:2010 + Amd. 2:2014, Information technology — Coding of audio-visual objects — 1: Systems
- ISO/IEC 14496-3:2009, Information technology — Coding of audio-visual objects — 3: Audio
- ISO/IEC 14496-11:2015, Information technology — Coding of audio-visual objects — 11: Scene description and application engine
- ISO/IEC 14496-16:2011, Information technology — Coding of audio-visual objects — 16: Animation Framework eXtension (AFX)
- ISO/IEC 14772-1:1997, Information technology — Computer graphics and image processing — The Virtual Reality Modeling Language — 1: Functional specification and UTF-8 encoding
- ISO/IEC 23005-5, Information technology — Media context and control — 5: Data formats for interaction devices
3 Terms, definitions, and abbreviated terms
3.1 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO/IEC 23000-1 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1.1
ARAF browser
augmented reality application format compliant browser
3.1.2
MAR scene
textual result of the MAREC creation, played by an ARAF browser (3.1.1)
Note 1 to entry: The result is a MAR experience.
3.1.3
MAR experience
act of playing the ARAF scene using an ARAF browser (3.1.1)
Note 1 to entry: The ARAF browser interprets the ARAF scene and presents the result on the end-user’s device.
3.1.4
content creator
creator of the media files that are being used within the MAR experience (3.1.3)
Note 1 to entry: The media files can be 2D and/or 3D graphics, images, videos and/or sounds.
3.1.5
end-user device
smartphone or mobile device used by an end-user to play a MAR scene (3.1.2)
Note 1 to entry: The device shall have an ARAF browser installed.
3.1.6
processing server
server that offers at least one required processing functionality for a MAR experience (3.1.3) and it is capable of communicating with an ARAF browser (3.1.1)
3.1.7
target resource
target image or target image descriptor
Note 1 to entry: The target image represents the image that shall be detected and recognized by a recognition library. The target image descriptor is represented by the visual descriptors extracted from a target image. The target resources may be specified by the MAREC or they can be already stored in databases on remote servers.
3.1.8
prerecorded video
prerecorded 2D video whose location is specified by MAREC
Note 1 to entry: The video file can be stored locally (on the device where the MAR experience is played) or remotely (anywhere else on the web). The recognition process shall be performed on the frames (still images) composing the video.
3.1.9
live video camera (stream)
live 2D video camera feed
Note 1 to entry: The URL of the camera providing the real time capture is specified by the MAREC. The URL can point to one of the cameras of the device where the MAR experience is played or to any other camera that can provide a live video stream and the ARAF browser can connect to.
3.1.10
image recognition library
library that is able to recognize target resources (3.1.7) in a video
Note 1 to entry: The library can run locally (implemented in the ARAF browser) or remotely (on a processing server). The result of an image recognition library is an array of indexes of the recognized target resources.
3.1.11
image recognition and tracking library
library that is able to recognize and track target resources (3.1.7) in a video
Note 1 to entry: The library can run locally (implemented in the ARAF browser) or remotely (on a processing server). The result of a recognition and tracking library is an array of indexes of the recognized target resources and their pose matrixes. Each recognized target resource shall have a pose matrix associated or a default value if the corresponding pose matrix could not be computed.
3.1.12
augmentation resource
media objects that are used in the augmentation of the MAR experience (3.1.3)
Note 1 to entry: A valid augmentation resource can be a 2D/3D grapic element, an image, a video, a sound or a BIFS scene. The augmentation resources can be stored locally in the MAR Scene or remotely anywhere on the Web, as long as the ARAF browser is capable of accesing their locations. In this case, a URL pointing to the augmentation resource is stored in the MAR scene.
3.2 Abbreviated terms
| ar | Augmented Reality |
| ARAF | Augmented Reality Application Format |
| URI | Uniform Resource Identifier |
| URL | Uniform Resource Locator |
| URN | Uniform Resource Name |
| MAR | Mixed and Augmented Reality |
| MARE | Mixed and Augmented Reality Experience |
| MAREC | Mixed and Augmented Reality Experience Creator |
| PROTO | A PROTOtype is a mechanism used to group together scene graph elements in order to implement one or several specific functionalities. |
| RTR | Recognized Target Resource |
Bibliography
| [1] | ISO/IEC 8859-1, Information technology — 8-bit single-byte coded graphic character sets — 1: Latin alphabet No. 1 |