ISO 24623-2:2021 言語リソース管理—コーパスクエリリングワフランカ(CQLF)—パート2:オントロジー | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序章

国際標準のいくつかのファミリは、言語データの表現のさまざまな側面を体系化しています。これらの標準は、言語アノテーション フレームワーク (LAF) (ISO 24612 を参照) における一般的なコーパス指向のデータ モデル、セマンティック アノテーション フレームワーク (SemAF) (ISO 24617-1 などを参照) におけるセマンティック表現のさまざまな側面、字句マークアップ フレームワーク (LMF) の字句データ (ISO 24613-1 などを参照)、およびコンポーネント メタデータ インフラストラクチャ (CMDI) でのメタデータの表現 (ISO 24622-1 などを参照)言語データの表現に関する規格を補完する ISO 24623 シリーズは、言語データの活用と、これらのデータを対象とするさまざまな種類の情報ニーズを満たす方法に焦点を当てています。

ISO 24623-1 で説明されているコーパス クエリ リンガ フランカ (CQLF) メタモデルは、コーパス クエリ言語 (CQL) の範囲を一般的なレベルで記述し、さまざまな種類のクエリ システムによって想定されるデータ モデルであり、適合条件はさまざまな CQL によって満たされることを意味します。メタモデルは、コーパス クエリの基本カテゴリ (レベルとモジュールとしてエンコード) とそれらの間の依存関係を設定することにより、CQL 分類の「スケルトン」を提供します。

したがって、CQL のより具体的な特徴付けのタスクは、ISO 24623 シリーズの他の部分でカバーされることになっています。このドキュメントは、コーパスクエリによって満たされる一般化された情報ニーズに焦点を当て、個々の CQL が肯定的および否定的な適合ステートメントを作成できる多層分類として構造化されたオントロジーのフレームワークを確立します。

このようなオントロジーは、一方では CQL の表現力のきめの細かい比較を可能にし、他方では実用的な目的を果たします。つまり、開発者が適合ステートメントを入力できるプラットフォームの基盤として機能します。エンド ユーザーは、検索のニーズを満たすためにどの CQL を使用すればよいかを確認できます。このようなプラットフォームの例は、参考文献 [13] に記載されています。

Introduction

Several families of International Standards codify various aspects of the representation of language data. These standards describe general corpus-oriented data models in the linguistic annotation framework (LAF) (see ISO 24612), various aspects of the semantic representation in the semantic annotation framework (SemAF) (see ISO 24617-1 and others), the representation of lexical data in the lexical markup framework (LMF) (see ISO 24613-1 and others), as well as the representation of metadata in the component metadata infrastructure (CMDI) (see ISO 24622-1 and others). Complementary to the standards concerning the representation of language data, the ISO 24623 series focuses on the exploitation of language data and on ways to satisfy various kinds of information needs targeting these data.

The corpus query lingua franca (CQLF) metamodel, described in ISO 24623-1, is a maximally permissive construct that establishes means of describing the scope of corpus query languages (CQLs) at a general level and with a focus on various kinds of data models assumed by query systems, with conformance conditions meant to be satisfied by a wide range of CQLs. The metamodel provides a “skeleton” for a CQL taxonomy by setting up basic categories of corpus queries (encoded as levels and modules) as well as the dependencies among them.

Consequently, the task of a more concrete characterization of CQLs is meant to be covered in other parts of the ISO 24623 series. This document establishes a framework for an ontology which focuses on the generalized information needs satisfied by corpus queries, and which is structured as a multi-layer taxonomy against which individual CQLs can make positive and negative conformance statements.

Such an ontology allows, on the one hand, a fine-grained comparison of the expressive power of CQLs, and, on the other hand, it serves a practical purpose, i.e. as a foundation for platforms where developers can enter conformance statements, and where end users can see which CQL to turn to in order to ensure that their search needs get satisfied. An example of such a platform is given by Reference [13].