※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
2 用語と定義
2.1 規約
2.1.1 記述ツール
ISO/IEC 15938 のこのパートでは、マルチメディア記述ツールを次のように指定しています。
- • 説明スキーム (DS) — マルチメディア コンテンツに関するエンティティまたは関係を説明する説明ツール。 DS は、それらのコンポーネントの構造とセマンティクスを指定します。これは、記述スキーム、記述子、またはデータ型である場合があります。
- • 記述子 (D) — マルチメディア コンテンツの機能、属性、または属性のグループを記述する記述ツール。
- • データ型 — 記述スキームと記述子で使用される基本的な再利用可能なデータ型。
- • 記述ツール (またはツール) — 記述スキーム、記述子、またはデータ型を指します。
2.1.2 命名規則
マルチメディア記述ツールを指定するために、ISO/IEC 15938 のこの部分では、ISO/IEC 15938-2 で指定されている記述定義言語 (DDL) によって提供される構造を使用します。 「複雑なタイプ」。これらの構造に関連付けられた名前は、次の規則に基づいて作成されます。
- ●名前が複数の単語で構成されている場合、各単語の最初の文字は大文字になります。ただし、最初の単語の大文字化は、次のように構成のタイプによって異なります。
- ●要素の命名: 最初の単語の最初の文字は大文字になります (例: TimeTypeの要素)
- ●属性の命名: 最初の単語の最初の文字は大文字ではありません (例: IncrDurationTypeのtimeunit属性)
- ● complexType 命名: 最初の単語の最初の文字を大文字にし、接尾辞「Type」を名前の最後に使用します (例: PersonType)
- ● simpleType 命名: 最初の単語の最初の文字は大文字ではなく、名前の末尾に「Type」という接尾辞を使用できます (例: timePointType )
記述ツールの定義でcomplexTypeまたはsimpleTypeを参照する場合、「Type」サフィックスは使用されないことに注意してください。たとえば、このテキストは、" Time データ型" (" TimeTypeデータ型" ではなく)、" MediaLocator D " (" MediaLocatorType D " ではなく)、および " Person DS " (" PersonType DS " ではなく) を参照しています。 .
2.2 用語
ISO/IEC 15938 のこの部分では、次の用語と定義が適用されます。
2.2.1 スキーマ関連の用語
2.2.1.1
属性
単純型の 記述ツール のフィールド。
2.2.1.2
ベースタイプ
他の 型 の派生階層のルート 型 として機能する 型 。
2.2.1.3
データ・タイプ
Description Schemes と Descriptors で使用されるプリミティブな再利用可能な 型 。
2.2.1.4
派生型
他の タイプ の拡張または制限に関して定義された タイプ 。
2.2.1.5
説明
1 つまたは複数の 説明ツール のインスタンス化。
2.2.1.6
説明スキーム
マルチメディア コンテンツ に関するエンティティまたは関係を記述する 記述ツール 。 記述スキーム は、それらのコンポーネントの構造とセマンティクスを指定します。これは、 記述スキーム、記述子 、または データ型 の場合があります。
2.2.1.7
説明ツール
説明スキーム、記述子 、または データ型 。
2.2.1.8
ディスクリプタ
マルチメディア コンテンツの機能、 属性 、または属性のグループを説明する説明ツール。
2.2.1.9
インスタンス化
1 つまたは複数の 記述ツール のフィールド (要素、属性) への値の割り当て。
2.2.1.10
エレメント
複合型の 記述ツール のフィールド。
2.2.1.11
図式
ISO/IEC 15938 で指定されているものなど、関連する 記述ツール のセット。
2.2.1.12
タイプ
説明ツールの要素または属性の値を表すために、文字、数字、および/または記号のコレクションに使用される形式。型 は、個別の値のセット、語彙表現のセット、および値空間のプロパティ、個々の値、または語彙項目を特徴付けるファセットのセットで構成されます。
2.2.2 コンテンツ関連の用語
2.2.2.1
抽象化
コンテンツから作成されるか、 コンテンツ に関連する二次表現。たとえば、 動画 の 概要 や 機能 の モデル などです。
2.2.2.2
交流係数
1 つまたは両方の次元の周波数が非ゼロである任意の DCT 係数。
2.2.2.3
取得
ソースから オーディオ or ビジュアル データを取得するプロセス。
2.2.2.4
行動
オブジェクトまたはオブジェクトのグループの意味的に識別可能な動作 (サッカー選手がボールを蹴るなど)
2.2.2.5
エージェント
個人、組織、またはグループ。
2.2.2.6
オーディオ
リスニングまたはヒアリングを目的とした時変 データ または信号。また、聴覚モダリティに関連しています。
2.2.2.7
オーディオビジュアル
オーディオ と ビデオ の両方のデータで構成されるコンテンツ。
2.2.2.8
自動
コンピュータ、ハードウェア、またはその他のソフトウェア デバイスによる マルチメディア データ、コンテンツ 、または メタ データの処理。
2.2.2.9
分類スキーム
定義された用語とその意味のリスト。
2.2.2.10
コンテンツ
マルチメディア コンテンツ
人間による解釈に適した形式化された方法で、 マルチメディア データ に含まれる、または関連する情報の表現。 コンテンツ とは、 データ と メタ データを指します。
2.2.2.11
著作権
データ、コンテンツ 、または メタ データの所有権を確立する権利。
2.2.2.12
データ
エッセンス
マルチメディアデータ
自動手段による通信、解釈、または処理に適した形式化された方法で マルチメディア を表現したもの。
2.2.2.13
直流係数
両方の次元の周波数がゼロである DCT 係数。
2.2.2.14
DCT係数
特定のコサイン基底関数の符号付き振幅。
2.2.2.15
編集
マルチメディア データ を結合、抽出、および調整するプロセス。
2.2.2.16
自分の顔
顔画像の主成分分析から得られた固有ベクトル。
2.2.2.17
実在物
マルチメディア コンテンツ に関連する具体的または抽象的な関心事項。
2.2.2.18
イベント
ある時点または時間間隔中に発生する注目に値する出来事。状態の変化としても使用されます。
2.2.2.19
特徴
イメージの「色」や「テクスチャ」など、人間の観察者にとって何かを意味する、 マルチメディア コンテンツ の特徴的な特性。
2.2.2.20
フィルタリング
特定の基準を満たすマルチメディア コンテンツを選択するプロセス。このプロセスには、基準を満たす程度に応じてコンテンツをランク付けすることが含まれる場合があります。
2.2.2.21
フォーマット
データ の格納または物理表現の特性。
2.2.2.22
フレーム
動画 からの 1 つの 画像 。
2.2.2.23
画像
視覚ソースから取得した、空間的に変化する 2D 視覚データ。
2.2.2.24
キーフレーム
動画 または セグメント の代表的な フレーム 。
2.2.2.25
ロケータ
マルチメディア データ または セグメント の場所またはアドレスを指定します。
2.2.2.26
モデル
マルチメディア コンテンツ or 機能 のパラメトリックまたは統計的表現。
2.2.2.27
マニュアル
人的手段による マルチメディア データ、コンテンツ 、または メタ データの処理。
2.2.2.28
メタデータ
マルチメディア データ をユーザーが理解しやすく共有できるようにするための情報とドキュメント。
2.2.2.29
マルチメディア
画像、オーディオ、ビデオ、3D モデル、インク コンテンツなど、1 つまたは複数のモダリティを含む データ 。
2.2.2.30
ナビゲーション
ユーザー が マルチメディア コンテンツ にアクセスし、制御された方法でコンテンツのコースを操縦するプロセス。
2.2.2.31
オブジェクト
自然界の物理的表現を持つオブジェクト。
2.2.2.32
領域
マルチメディア の空間単位。たとえば、 イメージ の 2D 空間 領域 や ビデオ の移動領域などです。
2.2.2.33
関係
エンティティ間の関連付け。
2.2.2.34
権利
マルチメディア データ、コンテンツ 、または メタ データの所有権と使用条件を決定する情報。知的財産権、著作権、およびアクセス権への言及。
2.2.2.35
シーン
1 つの場所での継続的なアクションを表すエピソードまたは一連のイベント。
2.2.2.36
検索
特定の基準を満たす マルチメディア コンテンツ を検索するプロセス。このプロセスには、基準を満たす程度に応じてコンテンツをランク付けすることが含まれる場合があります。
2.2.2.37
セグメント
マルチメディア の空間単位または時間単位。たとえば、 動画 の時間 セグメント や 画像 の セグメント です。
2.2.2.38
セマンティクス
マルチメディア コンテンツ の基本的な意味または理解に関する情報。または、 説明ツール の意味の仕様を参照してください。
2.2.2.39
概要
コンテンツを要約したマルチメディア コンテンツ の 抽象化。
2.2.2.40
ユーザー
マルチメディア コンテンツ のエンドユーザーまたは消費者。
2.2.2.41
ユーザー設定
マルチメディア コンテンツ に関する ユーザー の好み。これには、コンテンツとそのプロパティに関するユーザーの好み、好き嫌い、および消費プロセスに関する好みが含まれます。
2.2.2.42
使用履歴
マルチメディア コンテンツ の ユーザー が、特定のコンテンツを記録したり、記録したコンテンツを特定の時間に再生したりするなど、一定期間にわたって行った操作の履歴。
2.2.2.43
変化
マルチメディア コンテンツ の代替バージョン。トランスコーディング、要約、翻訳、縮小などによって生成される場合があります。
2.2.2.44
ビデオ
見ることを目的とした、空間的および時間的に変化する視覚 データ or 信号 。通常、 画像 or フレーム の離散シーケンスとして表されます。
2.2.2.45
ビュー
パーティションに関して定義された、 画像、ビデオ or オーディオ 信号 A 一部。パーティションは、空間、時間、および/または周波数平面で定義され A 多次元領域です。
2.2.2.46
ビジュアル
視覚モダリティに関連しています。
2.2.2.47
分解を見る
多次元空間、時間、および/または周波数で 画像、ビデオ or オーディオ 信号の構造化された分解を提供する、組織化された一連の ビュー 。
2.2.2.48
3D メッシュ モデル
面とノードのセットを使用した 3D オブジェクトの表面の表現モデル。 (つまり、ポリゴン メッシュ)
2.3 記号と略語
2.3.1 ジェネリック
ISO/IEC 15938 のこの部分の目的のために、以下に示す記号と略語が適用されます。
| タイプ: | 角度 - 半径変換 |
| av | オーディオビジュアル |
| CSS: | 曲率スケール スペース |
| CIE: | 国際照明委員会 |
| CIF: | 共通中間形式 |
| cs | 分類スキーム |
| D: | ディスクリプタ |
| D: | 記述子 |
| DCT: | 離散コサイン変換 |
| DDL: | 説明 定義言語 |
| DS: | 説明スキーム |
| DS: | 記述スキーム |
| フォーカス: | 収縮の焦点 |
| 敵: | 拡大の焦点 |
| GLA: | 一般化されたロイド アルゴリズム |
| GoF: | フレームのグループ |
| GoP: | 写真のグループ |
| HMMD: | 色相最小最大差 |
| HSV: | 色相彩度値 |
| アナ: | インターネット割り当て番号機関 |
| IETF: | インターネット エンジニアリング タスク フォース |
| IPMP: | 知的財産の管理と保護 |
| ISO: | 国際標準化機構 |
| JPEG: | 共同写真専門家グループ |
| MDS: | マルチメディア記述スキーム |
| MNV: | 平均法線ベクトル |
| MPEG: | 動画専門家グループ |
| MPEG-4: | 視聴覚オブジェクトのコーディング (ISO/IEC 14496 を参照) |
| MPEG-7: | マルチメディア コンテンツ記述インターフェイス標準 (ISO/IEC 15938 を参照) |
| MP3: | MPEG-2 レイヤ 3 オーディオ コーディング |
| NAC: | 正規化自己相関 |
| QCIF: | 四半期共通中間フォーマット |
| PWM: | 擬似重み付けメジャー |
| RGB: | 赤緑青 |
| SMPTE: | 映画テレビ技術者協会 |
| SSD: | 形状スペクトル記述子 |
| TZ: | タイムゾーン |
| TZD: | 時差 |
| URI: | 統一資源識別子 (RFC 2396 を参照) |
| URL: | Uniform Resource Locator (RFC 2396 を参照) |
| W3C: | ワールド・ワイド・ウェブ・コンソーシアム |
| XML: | 拡張マークアップ言語 |
| XOR: | 排他的 OR |
2.3.2 算術演算子
| + | 添加 |
| - | 減算 (二項演算子として) または否定 (単項演算子として) |
| ++ | インクリメント、つまり x++ は x=x+1 と同等 |
| -- | デクリメント、つまり x-- は x=x-1 と同等 |
| += | 累積、つまり x+=2 は x=x+2 と同等 |
| /= | 除算と代入、つまり x/=2 は x=x/2 と同等 |
| * | 乗算 |
| x | 乗算 |
| ∧ | パワー |
| / | 結果をゼロに向けて切り捨てる整数除算。たとえば、7/4 と -7/-4 は 1 に切り捨てられ、-7/4 と 7/-4 は -1 に切り捨てられます。 |
| /// | 最も近い整数に丸める整数除算。特に指定のない限り、半整数値はゼロから四捨五入されます。たとえば、3//2 は 2 に丸められ、-3//2 は -2 に丸められます。 |
| 丸めが意図されていない数学方程式の除算を示すために使用されます | |
| % | 正の数に対してのみ定義されるモジュラス演算子 |
| id | 対数底 2 |
| 細胞 | 指定された浮動小数点数以上の最小整数 |
| サイン() | |
| セクション() | |
| a から b までの整数値を取るiによる ƒ ( i ) の合計。ただしbは含まれません。 |
2.3.3 論理演算子
| || | 論理和 |
| && | 論理積 |
| ! | 論理否定 |
2.3.4 関係演算子
| > | より大きい |
| >= | 以上 |
| ≥ | 以上 |
| < | 未満 |
| <= | 以下 |
| ≤ | 以下 |
| == | に等しい |
| != | 等しくない |
| 最大[] | 引数リストの最大値 |
| 分[] | 引数リストの最小値 |
| 中央値[] | 引数リストの中央値 |
2.3.5 ビット演算子
| | | | or |
| & | と |
| » | 符号拡張付き右シフト |
| « | ゼロ埋めで左シフト |
2.3.6 条件演算子
| ?: |
2.3.7 割り当て
| = | 代入演算子 |
2.3.8 定数
| π | 3,141 592 653 58... |
| e | 2,718 281 828 45... |
2.3.9 関数
| 最大() | 引数リストの最大値 |
| 分() | 引数リストの最小値 |
| サイン() | |
| セクション() | |
| a から b までの整数値を取るiによる ƒ ( i ) の合計。ただしbは含まれません。 |
N 次元ベクトル x と y の間の距離
| L1 標準 | |
| L2 通常 | |
| ユークリッド距離 |
2.4 デフォルト基準軸
角度計算のデフォルトの参照軸は、正の x (水平) 軸です。正の角度は反時計回りに計算されます。
参考文献
| 1 | ISO 8601, データ要素と交換フォーマット — 情報交換 — 日付と時刻の表現 |
| 2 | ISO 63, 言語の名前を表すためのコード |
| 3 | ISO 3166-1, 国とその下位区分の名前を表すためのコード — 1: 国コード |
| 4 | ISO 3166-2, 国およびその下位区分の名前を表すためのコード — 2: 国細分類コード |
| 5 | ISO 4217, 通貨および資金の表現のためのコード |
| 6 | ISO/IEC 11172, 情報技術 — 約 1.5 Mbit/s までのデジタル ストレージ メディア用の動画および関連するオーディオのコーディング |
| 7 | ISO/IEC 1381, 情報技術 — 動画および関連する音声情報の一般的なコーディング |
| 8位 | ISO/IEC 1449, 情報技術? — 視聴覚オブジェクトのコーディング |
| 9 | ISO/IEC 15938-1, 情報技術 — マルチメディアコンテンツ記述インターフェース — 1: システム |
| 10 | ISO/IEC 15938-2, 情報技術 — マルチメディアコンテンツ記述インターフェース — 2: 記述定義言語 |
| 11 | ISO/IEC 15938-3, 情報技術 — マルチメディアコンテンツ記述インターフェース — 3: ビジュアル |
| 12 | ISO/IEC 15938-4, 情報技術 — マルチメディアコンテンツ記述インターフェース — 4: オーディオ |
| 13 | ISO/IEC 15938-6, 情報技術 — マルチメディアコンテンツ記述インターフェース — 6: 参照ソフトウェア |
| 14 | ISO/IEC 10646-1, 情報技術 — Universal Multiple-Octet Coded Character Set (UCS) — 1: アーキテクチャと基本的な多言語面 |
| 15 | ISO/IEC 10646-2, 情報技術 — Universal Multiple-Octet Coded Character Set (UCS) — 2: 補助平面 |
| 16 | Unicode コンソーシアム、Unicode 標準 ( http://www.unicode.org/ ) |
| 17 | ISO レジストリ、ISO 国際文字セット レジストリ |
| 18 | IANA レジストリ ( http://www.iana.org/assignments/character-sets ) |
| 19 | XML, 拡張マークアップ言語、W3C 勧告、ワールド ワイド ウェブ コンソーシアム (W3C) |
| 20 | XML スキーマ、XML スキーマ、W3C 勧告、ワールド ワイド ウェブ コンソーシアム (W3C) |
| 21 | xPath, XML パス言語、W3C 勧告、ワールド ワイド ウェブ コンソーシアム (W3C) |
| 22 | IETF RFC 2279, UTF-8, ISO 10646 の変換形式 |
| 23 | IETF RFC 2396, Uniform Resource Identifier (URI): 汎用構文 |
| 24 | IETF RFC 2045, 多目的インターネット メール拡張 (MIME) 1: インターネット メッセージ本文の形式 |
| 25 | IETF RFC 2046, 多目的インターネット メール拡張 (MIME) 2: メディアの種類 |
| 26 | IETF RFC 2048, 多目的インターネット メール拡張 (MIME) 4: 登録手続き |
| 27 | IETF RFC 2045-CHARSETS, RFC2045 の登録文字セット コード |
| 28 | IETF RFC 2046-MIMETYPES, RFC2046 の登録済み Mimetypes |
| 29 | オブジェクト ベースのビデオ コーディングと記述に関する特別号、ビデオ技術の回路とシステムに関する IEEE トランザクション、9, (8)、1999 年 12 月 |
| 30 | L Agnihotri および N Dimitrova 共著、ビデオ分析のためのテキスト検出、コンテンツ ベースの画像およびビデオ ライブラリに関するワークショップ、CVPR, コロラド州、pp. 109-113, 1999 と併せて開催 |
| 31 | Abdeljaoued Y, Ebrahimi T, Christopoulos C, Mas Ivars I, ショット境界検出の新しいアルゴリズム、Proceedings European Signal Processing Conferenc, Multimedia Indexing, Browsing and Retrieval に関する特別セッション、2000 年 9 月 5 ~ 8 日、フィンランド、タンペレ |
| 32 | M. Bierling, 階層ブロック マッチングによる変位推定、SPIE vol. 1001, ビジュアルコミュニケーションと画像処理、1988 |
| 33 | AD Bimbo, E Vicario, D Zingoni, 時空間ロジックを使用した画像シーケンスの記号記述と視覚的クエリ、知識とデータ エンジニアリングに関する IEEE トランザクション、vol. 7 号 4 号、1995 年 8 月 |
| 34 | N. Björk および Christopoulos C.、ビデオ コーディングのためのトランスコーダ アーキテクチャ、Proceedings on IEEE International Conference on Acoustic Speech and Signal Processin, シアトル、ワシントン、vol. 5, pp. 2813-2816, 1998 年 5 月 12 ~ 15 日 |
| 35 | S.-K. Chang, QY Shi, および CY Yan による 2 次元文字列によるアイコンのインデックス作成、IEEE Trans. Pattern Analysis Machine Intel.、9(3):413-428, 1987 年 5 月 |
| 36 | N. Damera-Venkata 他、劣化モデルに基づく画質評価、IEEE Trans. Image Processing, vol. 9, no. 4, pp. 636-650, 2000 |
| 37 | G. Freytag, Technique of the Drama, 2nd ed. Elias J. MacEwan 訳、シカゴ: Scott, Foresman, 1898 年 |
| 38 | VN Gudivada および VV Raghavan, 空間的類似性による画像検索アルゴリズムの設計と評価、情報システムに関する ACM トランザクション、vol. 13, no. 2, 1995 年 4 月, pp. 115-144 |
| 39 | A. Hanjalic, HJ Zhang, 教師なしクラスター妥当性分析に基づく自動ビデオ抽象化のための統合スキーム、IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1280-1289, 1999 年 12 月 |
| 40 | M. Kass, A. Witkin, D. Terzopoulos 共著、Snakes: Active Contour Models, International Journal of Computer Vision, pp. 321-331, 1988 年 |
| 41 | Kim M, Choi JG, Kim D, Lee H, Lee MH, Ahn C, Ho YS. VOP 生成ツール: 時空間情報に基づく画像シーケンス内の移動オブジェクトの自動セグメンテーション、IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1216-1226, 1999 年 12 月 |
| 42 | P. Kuhn, MPEG-4 Motion Estimation のアルゴリズム、複雑性分析および VLSI アーキテクチャ、Kluwer Academic Publishers, 1999 年、ISBN 792385160 |
| 43 | P. Kuhn 著、MPEG 圧縮ドメインの特徴点を使用したカメラ動作推定、IEEE International Conference on Image Processin, 2000 年 9 月 10 ~ 13 日、カナダ、バンクーバー |
| 44 | S. Herrmann, H. Mooshofer, Hディートリッヒ、W. Stechele, 「階層オブジェクト表現とその実装のためのビデオ セグメンテーション アルゴリズム」、ビデオ技術の回路とシステムに関する IEEE トランザクション 9(8): 1204-1215, 1999 年 12 月 |
| 45 | Jain AK, Dubes RC, データをクラスタリングするためのアルゴリズム。プレンティス ホール、イングルウッド クリフ、ニュージャージー州、1988 年 |
| 46 | B.ローレル、劇場としてのコンピューター、アディソン・ウェズリー、1993年 |
| 47 | T Meier, KN Ngan, コンテンツ ベースのコーディングのためのビデオ セグメンテーション、ビデオ技術の回路およびシステムに関する IEEE トランザクション 9(8): 1190-1203, 1999 年 12 月 |
| 48 | J. Meng, Y. Juan および S.-F.チャン、MPEG 圧縮ビデオ シーケンスでのシーン変更検出、議事録、IS&T/SPIE の電子画像に関するシンポジウム: 科学と技術 (EI'95) — デジタル ビデオ圧縮: アルゴリズムと技術、サンノゼ、1995 年 2 月 |
| 49 | A Perkis, Y Abdeljaoued, C Christopoulos, T Ebrahimi, J Chicharo, 有線および無線システムからのユニバーサル マルチメディア アクセス、Circuits, Systems and Signal Processing, マルチメディア通信サービスに関する特集号、2000 年に提出 |
| 50 | P サレンビエと F マルケス、画像とビデオの地域ベースの表現: マルチメディア サービスのセグメンテーション ツール、ビデオ技術の回路とシステムに関する IEEE トランザクション 9(8): 1147-1169, 1999 年 12 月 |
| 51 | JC Shim, C. Dorai, および R. Bolle 共著、コンテンツ ベースの注釈と検索のためのビデオからの自動テキスト抽出、Proc. Intの。パターン認識に関する会議、pp. 618-620, 1998 年 8 月 |
| 52 | J.-C. Shim および C. Dorai 著、A Fast and Generalized Region Labeling Algorithm in Proc. Intの。画像処理に関する会議、1999 年 10 月 |
| 53 | ワールド ワイド ウェブ コンソーシアム (W3C)、同期マルチメディア、 http://www.w3.org/AudioVideo/ |
| 54 | D. Zhong および S.-F. Chang, AMOS: An Active System For MPEG-4 Video Object Segmentation, 1998 年画像処理に関する国際会議、1998 年 10 月 4 ~ 7 日、シカゴ、イリノイ州、米国 |
| 55 | D. Zhong および S.-F.Chang 著、コンテンツ ベースのビデオ インデックス作成のためのビデオ オブジェクト モデルおよびセグメンテーション、ISCAS'97, 香港、1997 年 6 月 9 ~ 12 日 |
| 56 | D. Zhong および S.-F. Chang 著、オブジェクト ベースのビデオ表現を使用した時空間ビデオ検索、ICIP'97, 1997 年 10 月 26 ~ 29 日、カリフォルニア州サンタバーバラ |
| 57 | D. Zhong および S.-F. Chang, Region Feature Based Similarity Searching of Semantic Video Objects, ICIP'99, 1999 年 10 月 24 ~ 28 日、神戸 |
| 58 | JF アレン、時間間隔に関する知識の維持。 ACM 通信、26(11):832-843, 1983 年 |
| 59 | S.-K. Chang, QY Shi, および CY Yan による 2 次元文字列によるアイコンのインデックス作成、IEEE Trans. Pattern Analysis Machine Intel.、9(3):413-428, 1987 年 5 月 |
| 60 | Dewey Decimal 分類スキーム、 http://www.oclc.org/dewey/ |
| 61 | SCシャピロ、人工知能百科事典第2版、vo 2, 1495, ワイリー-インターサイエンス、1992 |
| 62 | Yeun-Bae Kim, Masahiro Shibata, A Video Indexing Method using Natural Language Memo for TV Program Production, pp. 266-270, Proceedings of ECAI96, 第 12 回欧州人工知能会議、1996 年 8 月 |
| 63 | 高橋由美子、長谷川浩司、杉山和夫、渡辺正人、セマンティックスコア法による映画のストーリー構造の記述 — ヒューマンコンテンツインターフェースデザインに向けて (3)、日本デザイン学会紀要、vol. 46, no. 6, pp. 57-66, (2000) |
| 64 | 高橋康史、柴田義明、鎌田幹夫、木村仁、セマンティック スコア法: 複数の視聴者による定量的コンテンツ評価ツール、Proc. of AEI ICM, 2001 年 5 月 8 ~ 9 日、フィレンツェ、イタリア、pp. 275-278 |
| 65 | Y. Takahashi, Semantic Score Method: A Standardized Tool for quantitative Movie Interpretation — Toward Human Content Interface Design (5), Bulletin of JSSD, vol. 47, no. 4, (2000) |
| 66 | 高橋由美, 長谷川浩司, 杉山和夫, 渡辺美知子, 効果的な映画選択のための新しい映画要約アルゴリズム — ヒューマンコンテンツインターフェースの設計に向けて (4), 日本物理学会紀要, vol. 47, no. 4, (2000) |
| 67 | M Lounsberry, T DeRose, J Warren, 任意のトポロジー タイプのサーフェスの多重解像度解析、TR 93-10-05b, Dept. CS & Eng., Univ. 1994 年 1 月ワシントン州 |
| 68 | CA Poynton, デジタル ビデオの技術紹介、John Wiley, 1996 年 (特に、RGB から CIE XYZ への変換式) |
| 69 | AK Jain, デジタル画像処理の基礎、Prentice Hall, 1989 年 (特に、CIE XYZ から CIE LUV への変換式) |
| 70 | RWG, 色の再現、第 5 版、Fountain Press, 1995 年 (変換式のない色の基礎) |
| 71 | MV Srinivasan, S Venkatesh, R Hosie, ビデオ シーケンスからのカメラ モーション パラメータの質的推定、パターン認識、vol. 30, no. 4, pp. 593-606, 1997 |
2 Terms and definitions
2.1 Conventions
2.1.1 Description tools
This part of ISO/IEC 15938 specifies the multimedia description tools as follows:
- • Description Scheme (DS) — a description tool that describes entities or relationships pertaining to multimedia content. DSs specify the structure and semantics of their components, which may be Description Schemes, Descriptors, or datatypes.
- • Descriptor (D) — a description tool that describes a feature, attribute, or group of attributes of multimedia content.
- • Datatype — a basic reusable datatype employed by Description Schemes and Descriptors.
- • Description Tool (or tool) — refers to a Description Scheme, Descriptor, or Datatype.
2.1.2 Naming convention
In order to specify the multimedia description tools, this part of ISO/IEC 15938 uses constructs provided by the Description Definition Language (DDL) specified in ISO/IEC 15938-2, such as"element","attribute","simpleType" and"complexType". The names associated to these constructs are created on the basis of the following conventions:
- ● If the name is composed of multiple words, the first letter of each word is capitalized, with the exception that the capitalization of the first word depends on the type of construct as follows:
- ● Element naming: the first letter of the first word is capitalized (e.g. element of TimeType).
- ● Attribute naming: the first letter of the first word is not capitalized (e.g. timeunit attribute of IncrDurationType).
- ● complexType naming: the first letter of the first word is capitalized, and the suffix"Type" is used at the end of the name (e.g. PersonType).
- ● simpleType naming: the first letter of the first word is not capitalized, the suffix"Type" may be used at the end of the name (e.g. timePointType).
Note that when referencing a complexType or simpleType in the definition of a description tool, the"Type" suffix is not used. For instance, the text refers to the"Time datatype" (instead of"TimeType datatype"), to the"MediaLocator D" (instead of"MediaLocatorType D") and to the"Person DS" (instead of"PersonType DS").
2.2 Terminology
For the purposes of this part of ISO/IEC 15938, the following terms and definitions apply.
2.2.1 Schema-related terminology
2.2.1.1
Attribute
A field of a description tool which is of simple type.
2.2.1.2
Base type
A type that serves as the root type of a derivation hierarchy for other types .
2.2.1.3
Datatype
A primitive reusable type employed by Description Schemes and Descriptors .
2.2.1.4
Derived type
A type that is defined in terms of extension or restriction of other types .
2.2.1.5
Description
An instantiation of one or more description tools .
2.2.1.6
Description Scheme
A description tool that describes entities or relationships pertaining to multimedia content. Description Schemes specify the structure and semantics of their components, which may be Description Schemes, Descriptors , or datatypes .
2.2.1.7
Description Tool
A Description Scheme, Descriptor , or datatype .
2.2.1.8
Descriptor
A description tool that describes a feature, attribute , or group of attributes of multimedia content.
2.2.1.9
Instantiation
Assignment of values to the fields (elements, attributes) of one or more description tools .
2.2.1.10
Element
A field of a description tool which is of complex type.
2.2.1.11
Schema
The set of related description tools , for example, those specified in ISO/IEC 15938 .
2.2.1.12
Type
The format used for collection of letters, digits, and/or symbols, to depict values of an element or attribute of description tool. A type consists of a set of distinct values, a set of lexical representations, and a set of facets that characterize properties of the value space, individual values, or lexical items.
2.2.2 Content-related terminology
2.2.2.1
Abstraction
A secondary representation that is created from or is related to the content . For example, a summary of a video or a model of a feature .
2.2.2.2
AC coefficient
Any DCT coefficient for which the frequency in one or both dimensions is non-zero.
2.2.2.3
Acquisition
The process of acquiring audio or visual data from a source.
2.2.2.4
Action
A semantically identifiable behavior of an object or group of objects, for example, a soccer player kicking ball.
2.2.2.5
Agent
A person, organization, or group of persons.
2.2.2.6
Audio
Time-varying data or signal intended for listening or hearing. Also, related to the aural modality.
2.2.2.7
Audio-visual
content consisting of both audio and video data.
2.2.2.8
Automatic
Processing of multimedia data, content , or metadata by means of computer, hardware, or other software device.
2.2.2.9
Classification Scheme
A list of defined terms and their meanings.
2.2.2.10
Content
Multimedia content
A representation of the information contained in or related to multimedia data in a formalized manner suitable for interpretation by human means. Content refers to the data and the metadata .
2.2.2.11
Copyright
A right that establishes the ownership of data, content , or metadata .
2.2.2.12
Data
Essence
Multimedia Data
A representation of multimedia in a formalized manner suitable for communication, interpretation, or processing by automatic means.
2.2.2.13
DC coefficient
The DCT coefficient for which the frequency in both dimensions is zero.
2.2.2.14
DCT coefficient
The signed amplitude of a specific cosine basis function.
2.2.2.15
Editing
The process of combining, extracting, and refining multimedia data .
2.2.2.16
Eigenface
An eigenvector obtained from the principal component analysis of facial images.
2.2.2.17
Entity
Any concrete or abstract thing of interest related to the multimedia content .
2.2.2.18
Event
A noteworthy occurrence that happens at a point in time or during a temporal interval. Alternatively used as a change in state.
2.2.2.19
Feature
A distinctive characteristic of multimedia content that signifies something to a human observer, such as the"color" or"texture" of an image.
2.2.2.20
Filtering
A process for selecting multimedia content that satisfies certain criteria. This process may include ranking the content according to the extent that it satisfies the criteria.
2.2.2.21
Format
The characteristics of the stored or physical representation of the data .
2.2.2.22
Frame
A single image from a video .
2.2.2.23
Image
2D spatially-varying visual data acquired from a visual source.
2.2.2.24
Key frame
A representative frame of a video or a segment .
2.2.2.25
Locator
Specifies the location or address of multimedia data or a segment .
2.2.2.26
Model
A parametric or statistical representation of multimedia content or features .
2.2.2.27
Manual
Processing of multimedia data, content , or metadata by human means.
2.2.2.28
Metadata
The information and documentation which makes multimedia data understandable and shareable to users over time.
2.2.2.29
Multimedia
Data comprising one or modalities, such as images, audio, video, 3D models, ink content, and so forth.
2.2.2.30
Navigation
A process by which a user accesses multimedia content and steers a course through the content in a controlled manner.
2.2.2.31
Object
An object with a physical representation in the natural world.
2.2.2.32
Region
A spatial unit of multimedia , for example, a 2D spatial region of an image , or a moving region of video .
2.2.2.33
Relation
Any association among entities.
2.2.2.34
Rights
Information that determines the ownership and terms of use of multimedia data, content , or metadata . Refers to Intellectual Property Rights, Copyrights, and the Access Rights.
2.2.2.35
Scene
An episode or sequence of events representing continuous action in one location.
2.2.2.36
Search
A process for searching multimedia content that satisfies certain criteria. This process may include ranking the content according to the extent that it satisfies the criteria.
2.2.2.37
Segment
A spatial or temporal unit of multimedia , for example, a temporal segment of video , or a segment of an image .
2.2.2.38
Semantics
Information relating to the underlying meaning or understanding of multimedia content . Alternatively, refers to the specification of the meaning of description tools .
2.2.2.39
Summary
An abstraction of multimedia content that summarizes the content .
2.2.2.40
User
An end-user or consumer of multimedia content .
2.2.2.41
User Preferences
The preferences of a user pertaining to multimedia content . This includes the user's tastes, likes and dislikes with respect to the content and its properties, as well as preferences with respect to the consumption process.
2.2.2.42
Usage History
A history of actions that a user of multimedia content has carried out over a certain period of time, such as recording a specific piece of content, or playing back recorded content at a specific time.
2.2.2.43
Variation
An alternative version of multimedia content ., which may be derived through transcoding, summarization, translation, reduction, and so forth.
2.2.2.44
Video
A space- and time-varying visual data or signal intended for viewing; commonly represented as a discrete sequence of images or frames .
2.2.2.45
View
A portion of an image, video or audio signal, defined in terms of a partition. A partition is a multidimensional region defined in the space, time and/or frequency plane.
2.2.2.46
Visual
Related to the visual modality.
2.2.2.47
View Decomposition
An organized set of views that provides a structured decomposition of an image, video or audio signal in multi-dimensional space, time and/or frequency.
2.2.2.48
3D mesh model
Representation model of the surface of 3D objects using a set of faces and nodes. (i.e. polygonal meshes)
2.3 Symbols and abbreviated terms
2.3.1 Generic
For the purposes of this part of ISO/IEC 15938, the symbols and abbreviated terms given in the following apply:
| ART: | Angular-Radial Transform |
| av | Audio-visual |
| CSS: | Curvature Scale Space |
| CIE: | International Commission on Illumination |
| CIF: | Common Intermediate Format |
| cs | Classification Scheme |
| D: | Descriptor |
| Ds: | Descriptors |
| DCT: | Discrete Cosine Transform |
| DDL: | Description Definition Language |
| DS: | Description Scheme |
| DSs: | Description Schemes |
| FOC: | Focus of Contraction |
| FOE: | Focus of Expansion |
| GLA: | Generalized Lloyd Algorithm |
| GoF: | Group of Frames |
| GoP: | Group of Pictures |
| HMMD: | Hue-Min-Max-Difference |
| HSV: | Hue-Saturation-Value |
| IANA: | Internet Assigned Numbers Authority |
| IETF: | Internet Engineering Task Force |
| IPMP: | Intellectual Property Management and Protection |
| ISO: | International Organization for Standardization |
| JPEG: | Joint Photographic Experts Group |
| MDS: | Multimedia Description Scheme |
| MNV: | Mean Normal Vector |
| MPEG: | Moving Picture Experts Group |
| MPEG-4: | Coding of audio-visual objects (see ISO/IEC 14496) |
| MPEG-7: | Multimedia Content Description Interface Standard (see ISO/IEC 15938) |
| MP3: | MPEG-2 layer 3 audio coding |
| NAC: | Normalized Auto-Correlation |
| QCIF: | Quarter Common Intermediate Format |
| PWM: | Pseudo Weighted Measure |
| RGB: | Red-Green-Blue |
| SMPTE: | Society of Motion Picture and Television Engineers |
| SSD: | Shape Spectrum Descriptor |
| TZ: | Time Zone |
| TZD: | Time Zone Difference |
| URI: | Uniform Resource Identifier (see RFC 2396) |
| URL: | Uniform Resource Locator (see RFC 2396) |
| W3C: | World Wide Web Consortium |
| XML: | Extensible Markup Language |
| XOR: | eXclusive-OR |
2.3.2 Arithmetic operators
| + | Addition |
| - | Subtraction (as a binary operator) or negation (as a unary operator) |
| ++ | Increment, i.e. x++ is equivalent to x=x+1 |
| -- | Decrement, i.e. x-- is equivalent to x=x-1 |
| += | Accumulation, i.e. x+=2 is equivalent to x=x+2 |
| /= | divide and substitute, i.e. x/=2 is equivalent to x=x/2 |
| * | Multiplication |
| x | Multiplication |
| ∧ | Power |
| / | Integer division with truncation of the result towards zero. For example, 7/4 and -7/-4 are truncated to 1, -7/4 and 7/-4 are truncated to -1. |
| // | Integer division with rounding to the nearest integer. Half-integer values are rounded away from zero unless otherwise specified. For example, 3//2 is rounded to 2, and -3//2 is rounded to -2. |
| Used to indicate division in mathematical equations where no rounding is intended | |
| % | Modulus operator, defined only for positive numbers |
| id | Logarithm base 2 |
| ceil | Minimum integer number greater or equal than the given floating point number |
| Sign() | |
| Abs() | |
| Summation of ƒ(i) with i taking integer values from a up to, but not including b. |
2.3.3 Logical operators
| || | Logical OR |
| && | Logical AND |
| ! | Logical NOT |
2.3.4 Relational operators
| > | Greater than |
| >= | Greater than or equal to |
| ≥ | Greater than or equal to |
| < | Less than |
| <= | Less than or equal to |
| ≤ | Less than or equal to |
| == | Equal to |
| != | Not equal to |
| max[] | Maximum value in argument list |
| min[] | Minimum value in argument list |
| median[] | median value in argument list |
2.3.5 Bitwise operators
| | | or |
| & | AND |
| » | Shift right with sign extension |
| « | Shift left with zero fill |
2.3.6 Conditional operators
| ?: |
2.3.7 Assignment
| = | Assignment operator |
2.3.8 Constants
| π | 3.141 592 653 58... |
| e | 2.718 281 828 45... |
2.3.9 Functions
| max() | Maximum value in argument list |
| min() | Minimum value in argument list |
| Sign() | |
| Abs() | |
| Summation of ƒ(i) with i taking integer values from a up to, but not including b. |
Distances between N-dimentional vectors x and y
| L1 norm | |
| L2 norm | |
| Euclidean distance |
2.4 Default reference axis
The default reference axis for angle calculation is the positive x (horizontal) axis. Positive angle is calculated anti-clockwise.
Bibliography
| 1 | ISO 8601, Data elements and interchange formats — Information interchange — Representation of dates and times |
| 2 | ISO 639 (all parts), Codes for the representation of names of languages |
| 3 | ISO 3166-1, Codes for the representation of names of countries and their subdivisions — 1: Country codes |
| 4 | ISO 3166-2, Codes for the representation of names of countries and their subdivisions — 2: Country subdivision code |
| 5 | ISO 4217, Codes for the representation of currencies and funds |
| 6 | ISO/IEC 11172, Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s |
| 7 | ISO/IEC 13818 (all parts), Information technology — Generic coding of moving pictures and associated audio information |
| 8 | ISO/IEC 14496 (all parts), Information technology?— Coding of audio-visual objects |
| 9 | ISO/IEC 15938-1, Information technology — Multimedia content description interface — 1: Systems |
| 10 | ISO/IEC 15938-2, Information technology — Multimedia content description interface — 2: Description definition langauge |
| 11 | ISO/IEC 15938-3, Information technology — Multimedia content description interface — 3: Visual |
| 12 | ISO/IEC 15938-4, Information technology — Multimedia content description interface — 4: Audio |
| 13 | ISO/IEC 15938-6, Information technology — Multimedia content description interface — 6: Reference software |
| 14 | ISO/IEC 10646-1, Information technology — Universal Multiple-Octet Coded Character Set (UCS) — 1: Architecture and Basic Multilingual Plane |
| 15 | ISO/IEC 10646-2, Information technology — Universal Multiple-Octet Coded Character Set (UCS) — 2: Supplementary Planes |
| 16 | Unicode Consortium, The Unicode standard ( http://www.unicode.org/ ) |
| 17 | ISO registry, ISO international character set registry |
| 18 | IANA registry ( http://www.iana.org/assignments/character-sets ) |
| 19 | XML, Extensible Markup Language, W3C Recommendation, World Wide Web Consortium (W3C) |
| 20 | XML Schema, XML Schema, W3C Recommendation, World Wide Web Consortium (W3C) |
| 21 | xPath, XML Path Language, W3C Recommendation, World Wide Web Consortium (W3C) |
| 22 | IETF RFC 2279, UTF-8, a transformation format of ISO 10646 |
| 23 | IETF RFC 2396, Uniform Resource Identifiers (URI): Generic Syntax |
| 24 | IETF RFC 2045, Multipurpose Internet Mail Extensions (MIME) One: Format of Internet Message Bodies |
| 25 | IETF RFC 2046, Multipurpose Internet Mail Extensions (MIME) Two: Media Types |
| 26 | IETF RFC 2048, Multipurpose Internet Mail Extensions (MIME) Four: Registration Procedures |
| 27 | IETF RFC 2045-CHARSETS, Registered Character set codes of RFC2045 |
| 28 | IETF RFC 2046-MIMETYPES, Registered Mimetypes of??RFC2046 |
| 29 | Special issue on Object Based Video Coding and Description, IEEE Transactions on Circuits and Systems for Video Technology, 9(8), December 1999 |
| 30 | L. Agnihotri and N. Dimitrova, Text Detection for Video Analysis, Workshop on Content Based Image and Video Libraries, held in conjunction with CVPR, Colorado, pp. 109-113, 1999 |
| 31 | Y. Abdeljaoued , T. Ebrahimi, C. Christopoulos, I. Mas Ivars, A new algorithm for shot boundary detection, Proceedings European Signal Processing Conference (EUSIPCO 2000), Special session on Multimedia Indexing, Browsing and Retrieval, 5-8 September 2000, Tampere, Finland |
| 32 | M. Bierling, Displacement Estimation by Hierarchical Block Matching, SPIE vol. 1001, Visual Communication & Image Processing, 1988 |
| 33 | A. D. Bimbo, E. Vicario and D. Zingoni, Symbolic description and visual querying of image sequences using spatio-temporal logic, IEEE Transactions on Knowledge and Data Engineering, vol. 7, no. 4, August, 1995 |
| 34 | N. Björk and Christopoulos C., Transcoder Architectures for video coding, Proceedings of IEEE International Conference on Acoustic Speech and Signal Processing (ICASSP 98), Seattle, Washington, vol. 5, pp. 2813-2816, May 12-15, 1998 |
| 35 | S.-K. Chang, Q. Y. Shi, and C. Y. Yan, Iconic indexing by 2-D strings, IEEE Trans. Pattern Analysis Machine Intell., 9(3):413-428, May 1987 |
| 36 | N. Damera-Venkata, et al., Image quality assessment based on a degradation model, IEEE Trans. Image Processing, vol. 9, no. 4, pp. 636-650, 2000 |
| 37 | G. Freytag, Technique of the Drama, 2nd ed. Translated by Elias J. MacEwan, Chicago: Scott, Foresman, 1898 |
| 38 | V.N. Gudivada and V.V. Raghavan, Design and Evaluation of Algorithms for Image Retrieval by Spatial Similarity, ACM Transaction on Information Systems, vol. 13, no. 2, April 1995, pp. 115-144 |
| 39 | A. Hanjalic, H.J. Zhang, An integrated scheme for automated video abstraction based on unsupervised cluster-validity analysis, IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1280-1289, December 1999 |
| 40 | M. Kass, A. Witkin and D. Terzopoulos, Snakes: Active contour models, International Journal of Computer Vision, pp. 321-331, 1988 |
| 41 | M. Kim, J.G. Choi, D. Kim, H. Lee, M.H. Lee, C. Ahn, Y.S. Ho, A VOP Generation tool: automatic segmentation of moving objects in image sequences based on spatio-temporal information, IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1216-1226, December 1999 |
| 42 | P. Kuhn, Algorithms, Complexity Analysis and VLSI-Architectures for MPEG-4 Motion Estimation, Kluwer Academic Publishers, 1999, ISBN 792385160 |
| 43 | P. Kuhn, Camera Motion Estimation using feature points in MPEG compressed domain, IEEE International Conference on Image Processing (ICIP), September 10-13, 2000, Vancouver, Canada |
| 44 | S. Herrmann, H. Mooshofer, HY. Dietrich, W. Stechele, A video segmentation algorithm for hierarchical object representation and its implementation, IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1204-1215, December 1999 |
| 45 | Jain AK, Dubes RC, Algorithms for clustering data. Prentice Hall, Englewood Cliffs, NJ, 1988 |
| 46 | B. Laurel, Computers as Theatre, Addison-Wesley, 1993 |
| 47 | T. Meier, K. N. Ngan, Video segmentation for content based coding, IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1190-1203, December 1999 |
| 48 | J. Meng, Y. Juan and S.-F. Chang, Scene Change Detection in a MPEG Compressed Video Sequence, Proceedings, IS&T/SPIE's Symposium on Electronic Imaging: Science & Techno logy (EI'95) — Digital Video Compression: Algorithms and Technologies, San Jose, February 1995 |
| 49 | A. Perkis, Y. Abdeljaoued , C. Christopoulos, T. Ebrahimi, J. Chicharo, Universal Multimedia Access from Wired and Wireless Systems, submitted to Circuits, Systems and Signal Processing, Special Issue on Multimedia Communication Services, 2000 |
| 50 | P. Salembier and F. Marqués, Region-based representation of image and video: Segmentation tools for multimedia services, IEEE Transactions on Circuits and Systems for Video Technology 9(8): 1147-1169, December 1999 |
| 51 | J-C. Shim, C. Dorai, and R. Bolle, Automatic Text Extraction from Video for Content-Based Annotation and Retrieval, in Proc. of the Int. Conference on Pattern Recognition, pp. 618-620, August 1998 |
| 52 | J.-C. Shim and C. Dorai, A Fast and Generalized Region Labeling Algorithm, in Proc. of the Int. Conference on Image Processing, October 1999 |
| 53 | World Wide Web Consortium (W3C), Synchronized Multimedia, http://www.w3.org/AudioVideo/ |
| 54 | D. Zhong and S.-F. Chang, AMOS: An Active System For MPEG-4 Video Object Segmentation, 1998 International Conference on Image Processing, October 4-7, 1998, Chicago, Illinois, USA |
| 55 | D. Zhong and S.-F.Chang, Video Object Model and Segmentation for Content-Based Video Indexing, ISCAS'97, HongKong, June 9-12, 1997 |
| 56 | D. Zhong and S.-F.Chang, Spatio-Temporal Video Search Using the Object Based Video Representation, ICIP'97, October 26-29, 1997, Santa Barbara, CA |
| 57 | D. Zhong and S.-F. Chang, Region Feature Based Similarity Searching of Semantic Video Objects, ICIP'99, October 24-28, 1999, Kobe, Japan |
| 58 | J. F. Allen, Maintaining knowledge about temporal intervals. Communication of ACM, 26(11):832-843, 1983 |
| 59 | S.-K. Chang, Q. Y. Shi, and C. Y. Yan, Iconic indexing by 2-D strings, IEEE Trans. Pattern Analysis Machine Intell., 9(3):413-428, May 1987 |
| 60 | Dewey Decimal classification scheme, http://www.oclc.org/dewey/ |
| 61 | S.C. Shapiro, Encyclopedia of Artificial Intelligence Second Edition, vol. 2, p. 1495, Wiley-Interscience, 1992 |
| 62 | Yeun-Bae Kim, Masahiro Shibata, A Video Indexing Method using Natural Language Memo for TV Program Production, pp. 266-270, Proceedings of ECAI96, 12th European Conference on Artificial Intelligence, August 1996 |
| 63 | Y. Takahashi, K. Hasegawa, K. Sugiyama, M. Watanabe, Describing Story Structure of Movies with Semantic Score Method — Toward Human Content Interface Design (3), Bulletin of Japanese Society for Science of Design, vol. 46, no. 6, pp. 57-66, (2000) (in Japanese) |
| 64 | Yasushi Takahashi, Yoshiaki Shibata, Mikio Kamada and Hitoshi Kimura, The Semantic Score Method: A Tool for Quantitative Content Evaluation by Multiple Viewers, Proc. of AEI ICMF (International Conference on Media Future), 8-9 May 2001, Florence, Italy, pp. 275-278 |
| 65 | Y. Takahashi, Semantic Score Method: A Standardized Tool for Quantitative Movie Interpretation — Toward Human Content Interface Design (5), Bulletin of JSSD, vol. 47, no. 4, (2000) (in Japanese) |
| 66 | Y. Takahashi, K. Hasegawa, K. Sugiyama, M. Watanabe, A New Movie Summarization Algorithm for Effective Movie Selection — Toward Human Content Interface Design (4), Bulletin of JSSD, vol. 47, no. 4, (2000) (in Japanese) |
| 67 | M. Lounsberry, T. DeRose, J. Warren, Multiresolution analysis for surfaces of arbitrary topological type, TR 93-10-05b, Dept. of CS & Eng., Univ. of Washington, January 1994 |
| 68 | C.A. Poynton, A technical introduction to Digital Video, John Wiley, 1996 (in particular conversion formulas from RGB to CIE XYZ) |
| 69 | A.K. Jain, Fundamentals of Digital Image Processing, Prentice Hall, 1989 (in particular conversion formulas from CIE XYZ to CIE LUV) |
| 70 | R.W.G., The reproduction of Color, 5th ed., Fountain Press, 1995 (fundamentals on color without conversion formulas) |
| 71 | M.V. Srinivasan, S. Venkatesh, R. Hosie, Qualitative estimation of camera motion parameters from video sequences, Pattern Recognition, vol. 30, no. 4, pp. 593-606, 1997 |