ISO/IEC 13249-6:2006 情報技術—データベース言語— SQLマルチメディアおよびアプリケーションパッケージ—パート6:データマイニング | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。

国際規格は、ISO/IEC 指令で指定された規則に従って起草されます。 2.

合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。

ISO/IEC 13249-6 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 32, データ管理および交換によって作成されました。

この第 2 版は、技術的に改訂された第 1 版 (ISO/IEC 13249-6:2002) を取り消して置き換えるものです。

ISO/IEC 13249 は、以下の部分で構成され、一般的なタイトルは「情報技術データベース言語SQL マルチメディアおよびアプリケーション パッケージ」です。

  • Part 1: フレームワーク
  • Part 2: 全文
  • Part 3: 空間
  • Part 5:静止画
  • Part 6: データ マイニング
  • Part 7: 歴史

ISO/IEC 13249-6:2006 のこの修正版では、269 ページと 270 ページが挿入されており、元のバージョンの 271 ページと 272 ページが複製されています。

序章

この ISO/IEC 13249 の目的は、ISO/IEC 9075:2003 のユーザー定義機能を使用して、マルチメディアおよびアプリケーション固有のタイプとそれらに関連するルーチンを定義することです。

ISO/IEC 13249 のこの部分の構成は次のとおりです。

箇条 1「範囲」は、ISO/IEC 13249 のこの部分の範囲を指定します。

箇条 2「規範的参照」は、ISO/IEC 13249 のこの部分での参照を通じて、ISO/IEC 13249 のこの部分の規定を構成する追加の規格を識別します。

第 3 節「用語、定義、表記法、および規則」は、ISO/IEC 13249 のこの部分で使用される表記法と規則を定義します。

箇条 4「概念」は、ISO/IEC 13249 のこの部分の定義で使用される概念を示しています。

第 5 条「データ マイニングのデータ型」では、データ マイニングのデータ定義のユーザー定義型と関連ルーチンを定義します。

第 6 条「関連付けルール」では、関連付けルールの検索に使用するユーザー定義型と関連ルーチンを定義します。

第 7 節「クラスタリング」では、クラスタリング用のユーザー定義型と関連ルーチンを定義します。

第 8 節「分類」では、ユーザー定義型と関連する分類用ルーチンを定義します。

第 9 節「回帰」では、回帰用のユーザー定義型と関連するルーチンを定義します。

第 10 条「ステータス コード」では、ISO/IEC 13249 のこの部分で使用される SQLSTATE コードを定義しています。

条項 11「適合性」は、ISO/IEC 13249 のこの部分への適合性の基準を定義します。

附属書 A, 「実装定義の要素」は、有益な附属書です。 ISO/IEC 13249 のこの部分の本文で、構文、意味、またはデータベースへの影響が部分的または完全に実装定義であると述べられている機能をリストし、それぞれの場合に実装者が提供する定義情報について説明します。

附属書 B「実装に依存する要素」は、有益な附属書です。これには、ISO/IEC 13249 のこの部分の本文で、データベースに対する意味または影響が実装に依存すると明示的に述べられている機能がリストされています。

附属書 C「分類手法を使用したシナリオ」は、有益な附属書です。 ISO/IEC 13249 のこの部分の使用方法に関する説明資料を提示します。

1 スコープ

ISO/IEC 13249 は、マルチメディアおよびアプリケーション領域で使用されるさまざまな種類のデータに共通する汎用データ型のパッケージを多数定義して、そのデータを SQL データベースに格納および操作できるようにします。

ISO/IEC 13249 のこの部分

  • a) ISO/IEC 13249 のデータマイニング部分を紹介し、
  • b) ISO/IEC 13249 のこの部分に必要な参考文献を示します。
  • c) ISO/IEC 13249 のこの部分に固有の表記法と慣習を定義する。
  • d) ISO/IEC 13249 のこの部分に固有の概念を定義する。
  • e)データマイニングのユーザー定義型とそれに関連するルーチンを定義します。

このパートで定義されているデータ マイニング ユーザー定義型は、次のとおりです。

  • データ マイニングのユーザー定義型は、データ マイニングのデータ処理に一般的です。データ マイニング モデル、データ マイニング設定、データ マイニング テスト結果などの要素に基づいて、情報を保存、管理、取得する必要性に対応します。
  • データ マイニングのユーザー定義型は、データベース言語 SQL を直接再定義したり、別のデータ マイニング データ型と組み合わせて再定義したりしません。

2 参考文献

本書の適用には、以下の参考文献が不可欠です。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

2.1 国際規格

  • ISO/IEC 13249-1:2006, 情報技術 — データベース言語 — SQL マルチメディアおよびアプリケーション パッケージ — 1: フレームワーク

2.2 公開仕様

拡張マークアップ言語 (XML) 1.0 (第 3 版) W3C 勧告 2004 年 2 月 4 日、 http://www.w3.org/TR/2004/REC-xml-20040204

予測モデル マークアップ言語 (PMML) 3.0, http: //www.dmg.org/pmml-v3-0.html

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, 2.

The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.

ISO/IEC 13249-6 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 32, Data management and interchange.

This second edition cancels and replaces the first edition (ISO/IEC 13249-6:2002), which has been technically revised.

ISO/IEC 13249 consists of the following parts, under the general title Information technologyDatabase languagesSQL multimedia and application packages:

  • Part 1: Framework
  • Part 2: Full-Text
  • Part 3: Spatial
  • Part 5: Still image
  • Part 6: Data mining
  • Part 7: History

This corrected version of ISO/IEC 13249-6:2006 inserts pages 269 and 270, which duplicated pages 271 and 272 in the original version.

Introduction

The purpose of this ISO/IEC 13249 is to define multimedia and application specific types and their associated routines using the user-defined features in ISO/IEC 9075:2003.

The organization of this part of ISO/IEC 13249 is as follows.

Clause 1,"Scope", specifies the scope of this part of ISO/IEC 13249.

Clause 2,"Normative references", identifies additional standards that, through reference in this part of ISO/IEC 13249, constitute provisions of this part of ISO/IEC 13249.

Clause 3,"Terms, definitions, notations and conventions", defines the notations and conventions used in this part of ISO/IEC 13249.

Clause 4,"Concepts", presents concepts used in the definition of this part of ISO/IEC 13249.

Clause 5, “Data Mining Data Types”, defines the user-defined types and associated routines for the data definitions of data mining.

Clause 6 “Association Rules”, defines the user-defined types and associated routines for the search for association rules.

Clause 7, “Clustering”, defines the user-defined types and associated routines for clustering.

Clause 8, “Classification”, defines the user-defined types and associated routines for classification.

Clause 9, “Regression”, defines the user-defined types and associated routines for regression.

Clause 10, “Status Codes”, defines the SQLSTATE codes used in this part of ISO/IEC 13249.

Clause 11, “Conformance“, defines the criteria for conformance to this part of ISO/IEC 13249.

Annex A, “Implementation-defined elements”, is an informative annex. It lists those features for which the body of this part of ISO/IEC 13249 states that the syntax or meaning or effect on the database is partly or wholly implementation-defined, and describes the defining information that an implementor shall provide in each case.

Annex B, “Implementation-dependent elements”, is an informative annex. It lists those features for which the body of this part of ISO/IEC 13249 states explicitly that the meaning or effect on the database is implementation-dependent.

Annex C, “A scenario using the classification technique”, is an informative annex. It presents explanatory material on how to use this part of ISO/IEC 13249.

1 Scope

ISO/IEC 13249 defines a number of packages of generic data types common to various kinds of data used in multimedia and application areas, to enable that data to be stored and manipulated in an SQL database.

This part of ISO/IEC 13249

  • a) introduces the data mining part of ISO/IEC 13249,
  • b) gives the references necessary for this part of ISO/IEC 13249,
  • c) defines notations and conventions specific to this part of ISO/IEC 13249,
  • d) defines concepts specific to this part of ISO/IEC 13249,
  • e) defines data mining user-defined types and their associated routines.

The data mining user-defined types defined in this part adhere to the following.

  • A data mining user-defined type is generic to data mining data handling. It addresses the need to store, manage and retrieve information based on elements such as data mining models, data mining settings, and data mining test results.
  • A data mining user-defined type does not redefine the database language SQL directly or in combination with another data mining data type.

2 Normative references

The following referenced documents are indispensable for the application of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

2.1 International Standards

  • ISO/IEC 13249-1:2006, Information technology — Database languages — SQL multimedia and application packages — 1: Framework

2.2 Publicly-available specifications

Extensible Markup Language (XML) 1.0 (Third Edition). W3C Recommendation 04 February 2004, http://www.w3.org/TR/2004/REC-xml-20040204 .

Predictive Model Markup Language (PMML) 3.0, http://www.dmg.org/pmml-v3-0.html