この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
このドキュメントの目的のために、ISO 24612, ISO 24623-1 および以下に記載されている用語と定義が適用されます。
ISO および IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
3.1
CQLF モジュール
指定されたデータモデル特性を参照して定義されたCQLFメタモデルのサブコンポーネント
注記 1: CQLF メタモデルは現在、CQLF レベル 1, 線形 (プレーンテキスト、セグメンテーション、および単純な注釈) 内の 3 つのモジュールと、CQLF レベル 2, 複合 (階層、依存、および包含) 内の 3 つのモジュールを区別しています。
注記 2: 5.3 では、用語のあいまいさを避けるために、包含モジュールは概念 SpanContainment によって形式化されています。
[SOURCE:ISO 24623-1:2018, 3.8, modified — ISO 24623-1 のコンテキスト外で明確性を向上させるために、「CQLF メタモデル」が「CQLF レベル」に置き換えられました。追記2を追記しました。】
3.2
機能性
一般的なレベルで定式化され、1 つ以上の CQLF モジュール (3.1) にリンクされた、 CQL (3.5) の表現力に貢献する CQL 機能 (3.12) のファミリを表す CQLF オントロジー (3.15) の概念のラベル。
3.3
フレーム
エンドユーザー (3.7) の典型的な 検索ニーズ (3.6) を表す CQLF オントロジー (3.15) の概念のラベルであり、CQL の表現力 (3.5) の 1 つの側面として理解されます。
注記 1:ほとんどのフレームは、 機能の特殊化 (3.2) および/または複数の機能の組み合わせから生じます。
3.4
使用事例
フレーム (3.3) の具体的なインスタンス化を表す CQLF オントロジー (3.15) の概念のラベルであり、特定の クエリ式 (3.8) が 検索の必要性 (3.6) を満たすかどうかを明確に判断できます。
注記 1:ユースケースはしばしばパラメータ化されます。つまり、ユースケースには可変要素が含まれます。パラメータ化されたユース ケースは、パラメータ化されたクエリ式によって満たされます。
3.5
CQL
コーパスクエリ言語
(大規模な) 言語データ コレクションから特定の情報を取得するように設計された正式な言語。これにより、 エンド ユーザー (3.7) (またはユーザー エージェント) がそれらのデータ モデルの一部に対処できるようにする、共通に共有されるデータ モデルに特定の抽象化を組み込むことができます。
注記 1: CQL は、 クエリ式 (3.8) の構文表記法と、対応する検索セマンティクス、つまり意図した結果セットの意図的な仕様を定義します。現在のほとんどの CQL では、セマンティクスは特定の実装によって暗黙的に定義されています。
[SOURCE:ISO 24623-1:2018, 3.4, modified — 「CQL」が優先用語として追加され、「エンド ユーザー」が定義の「ユーザー」に置き換えられ、エントリに注 1 が追加されました。]
3.6
検索の必要性
一次データストリームおよび/または単純または複雑な注釈に基づいて、 エンドユーザー (3.7) がコーパスで検索したい情報パターン。
3.7
エンドユーザー
検索ニーズ (3.6) を満たすために CQL (3.5) を使用するエージェント
注記 1:これは、インタラクティブなグラフィカル ユーザー インターフェイス (GUI)、コマンド ライン ツール、何らかのアプリケーション プログラミング インターフェイス (API) を介したプログラム、またはエンド ユーザーが開発したソフトウェア プログラムによって実行できます。
3.8
クエリ式
特定の CQL (3.5) で構文的に有効であり、実行して結果セットを返すことができる文字列
注記 1:クエリ式は、変数要素でパラメータ化されることがよくあります。パラメーター置換手順の正式な仕様は試行されませんが、オントロジーのパラメーター化されたクエリ式のエントリには、許容値の範囲と必要な変換の非公式な説明を含める必要があります。
3.9
パラメータ
クエリ式 (3.8) または 検索ニーズの記述 (3.6) の可変要素
3.10
肯定的な適合宣言
特定の CQL (3.5) が クエリ式 (3.8) によって特定の ユースケース (3.4) をサポートするというアサーション
3.11
否定適合宣言
特定の CQL (3.5) が特定の ユースケース (3.4) 、 フレーム (3.3) or 機能 (3.2) をサポートできないという主張
注記 1:否定的な適合は、それぞれの CQL の特定の機能が技術的に利用できないこと、または クエリ式の複雑さに関する制限 (3.8) によるものです。
3.12
CQL機能
容量
コーパスクエリ言語機能
検索ニーズ (3.6) の特定の側面を満たすために CQL (3.5) によって提供される機能。
3.13
層
CQLF オントロジー (3.15) における同じ抽象化レベルの概念の全体
例:
機能 (3.2) 、 フレーム (3.3) 、 ユースケース (3.4) 。
3.14
トークン
ドキュメント内の書記素または音素の空でない連続シーケンス
[SOURCE:ISO 24611:2012, 3.21, modified — エントリの注 1 が削除されました。]
3.15
CQLFオントロジー
検索ニーズ (3.6) の観点から、 CQL (3.5) の表現力をきめ細かく説明するためのオントロジーであり、このドキュメントで指定されている構造に準拠しています。
参考文献
| [1] | ISO 24611:2012, 言語リソース管理 — 形態構文注釈フレームワーク (MAF) |
| [2] | ISO 24613-1, 言語リソース管理 — レキシカル マークアップ フレームワーク (LMF) — Part 1: コア モデル |
| [3] | ISO 24617-1, 言語リソース管理 — セマンティック アノテーション フレームワーク (SemAF) — Part 1: 時間とイベント (SemAF-Time, ISO-TimeML) |
| [4] | ISO 24622-1, 言語リソース管理 — コンポーネント メタデータ インフラストラクチャ (CMDI) — Part 1: コンポーネント メタデータ モデル |
| [5] | Bański P.、 Frick E.、Witt A. (2016)コーパス クエリ リンガ フランカ (CQLF)中:言語資源と評価に関する第 10 回国際会議の議事録(LREC 2016)、2804 ~ 2809 ページ、ポルトロス、スロベニア。ヨーロッパ言語資源協会 (ELRA) |
| [6] | エバートS, ハーディーA (2011) 21 世紀のコーパス ワークベンチ: 新しいミレニアムに向けたクエリ アーキテクチャの更新。中:コーパス言語学 2011 会議の議事録、バーミンガム、英国 |
| [7] | W3C, OWL 2 Web オントロジー言語入門 (第 2 版) Hitzler P.、 Krötzsch M.、 Parsia B.、P atel-Schneider P.、R udolph S. (編) W3C 勧告、2012 年 12 月 11 日。 owl2-primer/ |
| [8] | Krause T.、 Zeldes A. ANNIS3: 一般的なコーパス クエリと視覚化のための新しいアーキテクチャ。人文科学におけるデジタル奨学金。 2016, 31(1) pp.118–139 |
| [9] | Krötzsch M, Simancik F, Horrocks I (2012)説明ロジックの入門書。 arXiv:1201.4089 |
| [10] | W3C, OWL 2 Web オントロジー言語: RDF グラフへのマッピング(第 2 版) Patel-Schneider PF, M otikB.eds . W3C 勧告、2012 年 12 月 11 日。以下から入手可能: http://www.w3.org/TR/owl2-mapping-to-rdf/ ) |
| [11] | W3C, RDF 1.1 XML 構文。 Beckett D. ed. W3C 勧告、2014 年 2 月 25 日 。 https://www.w3.org/TR/rdf-syntax-grammar/ から入手可能 |
| [12] | Jurafsky D, Martin JH音声および言語処理。プレンティス ホール、アッパー サドル リバー、第 2 版、2008 年 |
| [13] | CQLF-Ontology 、GitHub の cqlf-ontology プロジェクトのドキュメント。 [2021 年 6 月 1 日にアクセス] から入手可能: https://github.com/cqlf-ontology/cqlf/wiki |
| [14] | CQLFオントロジーの可能なインスタンス化の例。 https://raw.githubusercontent.com/cqlf-ontology/cqlf/DIS2020/examples/CQLF-2.owl から入手可能 |
| [15] | SourceForge の Corpus Workbench プロジェクト。 [2021 年 6 月 1 日にアクセス] から入手可能: https://cwb.sourceforge.io/ |
| [16] | アニスプロジェクト。 [2021 年 6 月 1 日にアクセス] から入手可能: https://corpus-tools.org/annis/ |
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24612, ISO 24623-1 and the following apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1
CQLF module
subcomponent of the CQLF metamodel, defined with reference to a specified data-model characteristic
Note 1 to entry: The CQLF metamodel currently distinguishes three modules within CQLF Level 1, Linear (plain-text, segmentation and simple annotation), and three modules within CQLF Level 2, Complex (hierarchical, dependency and containment).
Note 2 to entry: In 5.3, the containment module is formalized by the concept SpanContainment in order to avoid terminological ambiguity.
[SOURCE:ISO 24623-1:2018, 3.8, modified — “the CQLF metamodel” has replaced “a CQLF level” in order to improve clarity outside the context of ISO 24623-1; Note 2 to entry has been added.]
3.2
functionality
label for a concept in a CQLF ontology (3.15) that represents a family of CQL capabilities (3.12) contributing to the expressive power of a CQL (3.5) , formulated at a general level and linked to one or more CQLF modules (3.1)
3.3
frame
label for a concept in a CQLF ontology (3.15) that represents a typical search need (3.6) of end users (3.7) , understood as one facet of the expressive power of CQLs (3.5)
Note 1 to entry: Most frames arise from the specialization of a functionality (3.2) and/or the combination of multiple functionalities.
3.4
use case
label for a concept in a CQLF ontology (3.15) that represents a concrete instantiation of a frame (3.3) , for which it can be determined unambiguously whether a given query expression (3.8) satisfies the search need (3.6) or not
Note 1 to entry: Use cases are often parameterized, i.e. they contain variable elements. Parameterized use cases are satisfied by parameterized query expressions.
3.5
CQL
corpus query language
formal language designed to retrieve specific information from (large) language data collections, and thereby incorporate certain abstractions over commonly shared data models that make it possible for the end user (3.7) (or user agents) to address parts of those data models
Note 1 to entry: A CQL defines a syntactic notation for query expressions (3.8) and the corresponding search semantics, i.e. an intensional specification of the intended result set. For most current CQLs, semantics are implicitly defined by a particular implementation.
[SOURCE:ISO 24623-1:2018, 3.4, modified — “CQL” has been added as preferred term, “end user” has replaced “user” in the definition and Note 1 to entry has been added.]
3.6
search need
information pattern that an end user (3.7) wants to locate in a corpus, based on the primary data stream and/or simple or complex annotation
3.7
end user
agent who uses a CQL (3.5) to satisfy his or her search needs (3.6)
Note 1 to entry: This can be done via an interactive graphical user interface (GUI), a command-line tool, programmatically via some application programming interface (API) or by a software program developed by the end user.
3.8
query expression
string that is syntactically valid in a given CQL (3.5) and can be executed to return a result set
Note 1 to entry: Query expressions are often parameterized with variable elements. No formal specification of the parameter substitution procedure is attempted, but entries for parameterized query expressions in the ontology are required to include informal descriptions of the range of admissible values and any transformations required.
3.9
parameter
variable element in a query expression (3.8) or in the description of a search need (3.6)
3.10
positive conformance statement
assertion that a given CQL (3.5) supports a given use case (3.4) by means of a query expression (3.8)
3.11
negative conformance statement
assertion that a given CQL (3.5) cannot support a given use case (3.4) , frame (3.3) or functionality (3.2)
Note 1 to entry: Negative conformance is due to technical unavailability of specific capabilities in the respective CQL or limitations on the complexity of query expressions (3.8) .
3.12
CQL capability
capability
corpus query language capability
facility provided by CQLs (3.5) to meet a specific aspect of search needs (3.6)
3.13
layer
totality of concepts at the same level of abstraction in a CQLF ontology (3.15)
EXAMPLE:
Functionalities (3.2) , frames (3.3) , use cases (3.4) .
3.14
token
non-empty contiguous sequence of graphemes or phonemes in a document
[SOURCE:ISO 24611:2012, 3.21, modified — Note 1 to entry has been deleted.]
3.15
CQLF ontology
ontology for a fine-grained description of the expressive power of CQLs (3.5) in terms of search needs (3.6) , which adheres to the structure specified in this document
Bibliography
| [1] | ISO 24611:2012, Language resource management — Morpho-syntactic annotation framework (MAF) |
| [2] | ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model |
| [3] | ISO 24617-1, Language resource management — Semantic annotation framework (SemAF) — Part 1: Time and events (SemAF-Time, ISO-TimeML) |
| [4] | ISO 24622-1, Language resource management — Component Metadata Infrastructure (CMDI) — Part 1: The Component Metadata Model |
| [5] | Bański P., Frick E., Witt A. (2016). Corpus query lingua franca (CQLF). In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), pages 2804–2809, Portorož, Slovenia. European Language Resources Association (ELRA) |
| [6] | Evert S., Hardie A. (2011). Twenty-first century corpus workbench: Updating a query architecture for the new millennium. In: Proceedings of the Corpus Linguistics 2011 Conference, Birmingham, UK |
| [7] | W3C, OWL 2 Web Ontology Language Primer (Second Edition). Hitzler P., Krötzsch M., Parsia B., Patel-Schneider P., Rudolph S. (Eds.) W3C Recommendation, 11 December 2012. Available from: http://www.w3.org/TR/owl2-primer/ |
| [8] | Krause T., Zeldes A. ANNIS3: A new architecture for generic corpus query and visualization. Digital Scholarship in the Humanities. 2016, 31(1) pp. 118–139 |
| [9] | Krötzsch M., Simancik F., Horrocks I. (2012). A description logic primer. arXiv:1201.4089 |
| [10] | W3C, OWL 2 Web Ontology Language: Mapping to RDF Graphs (Second Edition). Patel-Schneider P.F., Motik B. eds. W3C Recommendation, 11 December 2012. Available from: http://www.w3.org/TR/owl2-mapping-to-rdf/ ) |
| [11] | W3C, RDF 1,1 XML Syntax. Beckett D. ed. W3C Recommendation, 25 February 2014. Available from: https://www.w3.org/TR/rdf-syntax-grammar/ ) |
| [12] | Jurafsky D., Martin J.H. Speech and Language Processing. Prentice Hall, Upper Saddle River, Second Edition, 2008 |
| [13] | CQLF-Ontology, documentation of the cqlf-ontology project at GitHub. Available from [accessed 1 June 2021]: https://github.com/cqlf-ontology/cqlf/wiki |
| [14] | Example of a possible instantiation of the CQLF ontology. Available from: https://raw.githubusercontent.com/cqlf-ontology/cqlf/DIS2020/examples/CQLF-2.owl |
| [15] | Corpus Workbench project on SourceForge. Available from [accessed 1 June 2021]: https://cwb.sourceforge.io/ |
| [16] | ANNIS project. Available from [accessed 1 June 2021]: https://corpus-tools.org/annis/ |