ISO 24613:2008 言語リソース管理-LexicalMarkup Framework(LMF) | ページ 6

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語と定義

この国際規格の目的のために、ISO 1087-1, ISO 1087-2 および以下に記載されている用語と定義が適用されます4)

3.1

省略形

同じ 語彙素(3.25) の 完全形(3.16) の一部を省略した 形(3.14 )。

3.2

付属品

構文上の引数とは対照的に、動詞に関連付けられた必須ではない要素 (3.43)

例:

アルフレッド (統語論) は、今日 (副詞) 本 (統語論) を読みます。

注記1:副詞は、文の可能な付属物です。

3.3

接辞

形態 (3.14) に寄与し、 屈折 (3.20) 、 凝集 (3.5) 、 派生 (3.12) or 合成 (3.9) のプロセスに関与する 結合モーフ (3.8) 。

注記 1:接辞は、接頭辞 (前置)、接尾辞 (後置)、中置接辞 (挿入)、および外接接尾辞 (接頭辞と接尾辞の組み合わせ) として機能します。

3.4

添付ファイル

接辞 (3.3) が 補題 (3.24) または 語幹 (3.40) に追加されるプロセス。

3.5

凝集

凝集体(3.6) が形成される過程

3.6

凝集体

語彙素(3.25) が 凝集言語(3.7) 内の文または句で使用される場合に取り得る 単語形式(3.47 )

3.7

膠着語

同じ 語彙素(3.25) の異なる 語形(3.47) が変化を示し,複数の 形態(3.31) で構成されている可能性があるが,形態間の境界が常に明確である言語。

例:

韓国語、日本語、ハンガリー語、トルコ語は膠着言語です[16] .

3.8

バインドされたモーフ

1 つまたは複数の他の モーフ と一緒にのみ現れる モーフ (3.31)

3.9

構成

調合

語彙素(3.25) の構成。新しい語彙素(その 品詞(3.37) 情報に関連付けられている)が、元の 形式(3.14) で、またはわずかな変形を伴って、少なくとも2つの語彙素を隣接させることによって形成される。

注記 1:構成は、束縛された形態が自由な形態に追加される凝集および派生と混同されるべきではありません。

3.10

化合物

語彙素 (3.25) 2 つ以上の語彙素から構築された 品詞 (3.37) 情報に関連付けられた語彙素 (3.25)

3.11

複合体

組成物(3.9) から生じる 形(3.14 )

3.12

導出

語彙素 (3.25) の 形式 (3.14) を変更して新しい語彙素を作成すること。通常、 語幹 (3.40) を変更するか、 接辞 (3.4) によって変更します。

注記 1:派生は、 nationaltonationalize のように、品詞の変化を示す場合があります。国有化と非国有化の場合と同じように、品詞が変わらないことがあります。

3.13

派生形

派生物(3.12) から生じる 形式(3.14 )。

3.14

一連の モーフ (3.31)

3.15

フリーモーフ

それ自体で立つことができる モーフ(3.31)

例:

英語名詞の男の子

3.16

完全形

省略形 (3.6) がある 語彙素 (3.25) の完全な表現

3.17

文法的特徴

形の文法的属性を記述する 屈折形 (3.19) 、 凝集形 (3.6) 、 複合形 (3.11) or 派生形 (3.13) に関連付けられた特性。

注記 1文法的特徴の例は次のとおりです。 (ISO 12620 の改訂で採用された規則に従って、データ カテゴリ値を区切るためにスラッシュが使用されます。)

3.18

グラフ

文字、絵文字、表意文字、数字、句読点を含む書き言葉の最小単位

3.19

屈折形

語形 素(3.25) が語形素(3.47)の語形(3.47)で、 屈折言語(3.21) 内の文または句で使用される場合

3.20

屈折

屈折形(3.19) が作られる過程

3.21

屈折言語

屈折語

同じ 語彙素 (3.25) の異なる 語形 (3.47) が バリエーションを示し、 モーフ (3.31) 間に明確な境界がない言語。 3.14)

例:

スペイン語、イタリア語、フランス語、英語は屈折言語です[16]

3.22

インターリンガル

人間の言語の機械翻訳で使用される抽象的な中間言語

3.23

孤立した言語

大部分の モーフ (3.31) が 自由モーフ (3.15) である言語

例:

中国語は孤立した言語です。

3.24

レンマ

見出語化された形式

正規形

語彙素(3.25) を表すために選択された従来の 形式(3.14 )

例:

ヨーロッパ言語では、補題は通常、/number/ にバリエーションがある場合は/singular/、/gender/ にバリエーションがある場合は/masculine/ 形式、およびすべての動詞の/infinitive/ です。一部の言語では、特定の名詞が単数形に欠陥があり、その場合は/plural/ が選択されます。アラビア語では、動詞の場合、レンマは通常、達成された側面を持つ三人称単数であると見なされます。

3.25

語彙素

一般に、共通の意味を共有する一連の フォーム(3.14) に関連付けられている抽象的な単位。

3.26

字句エントリ

語彙素 (3.25) を記述するために、1 つまたは複数の 形式 (3.14) と、場合によっては 1 つまたは複数の意味を管理するためのコンテナー。

3.27

レキシカルリソース

字句データベース

1つまたは複数の レキシコンからなるデータベース(3.28)

3.28

辞書

所定の言語の 字句エントリ(3.26) を含むリソース。

注記1特別な言語辞書または特定のNLPアプリケーション用に作成された辞書は、言語の特定のサブセットを構成できます。

3.29

機械可読辞書

十億

人間が参照するように設計された電子 語彙資源(3.27) 。

注記 1:歴史的に、MRD は「印刷された」辞書の最初のコンピューター表現でした。そのため、現在では機械可読と呼ばれています。

3.30

機械翻訳辞書

電子 語彙リソース (3.27) で、個々の 語彙エントリ (3.26) が、機械翻訳中の 語彙素 (3.25) の自動または半自動処理を容易にするために、形態学的、構文的、および/または意味的情報と共に 2 つ以上の言語の同等物を含む

3.31

モーフ

一連の グラフ (3.18) または一連の 単音 (3.38)

例:

男の子という単語は、 boyとs 2 つのモーフで構成されます。

3.32

形態学的パターン

語彙素 (3.25) のさまざまな形式を構築する関連および/または操作のセット。言語に応じて、 語形変化 (3.20) 、 凝集 (3.5) 、 合成 (3.9) or 派生 (3.12) による可能性がある

注記1形態学的パターンは,語形変化の明示的なリストではない。通常、 singのように、リングなどの屈折形式のプロトタイプ クラスを参照します。

3.33

形態学

フォームの構造と形成の記述 (3.14)

3.34

マルチワード式

MWE

語彙素(3.25) 個々の語彙素の特性またはそれらの通常の組み合わせモードからは予測できない特性を持つ、2 つ以上の語彙素のシーケンスで構成される語彙素(3.25)。

注記 1 MWE は、複合語、文の断片、または文である場合があります。 MWE を構成する語彙素のグループは、連続的または非連続的です。 MWE を品詞でマークできるとは限りません。

例:

「バケツを蹴る」とは、足でバケツを叩くよりも、死ぬことを意味します。

3.35

自然言語処理

NLP

コンピュータによる言語データの処理に関する知識と技術を網羅する分野

3.36

正書法

語彙素(3.25) のつづりや書き方で、慣例化された用法に準拠したもの。

注記 1:標準的なイギリス英語やアメリカ英語などのアルファベット言語の標準化されたスペル、または改良されたドイツ語のスペルは別として、非ネイティブ スクリプトでの言語の音訳、速記表現、または国際音声記号。この点で、字句エントリの正書法情報は、エントリのオブジェクトであるフォームに適用される一種の変換を記述することができます。

3.37

品詞

字句カテゴリ

単語クラス

文法的特性に基づいて 語彙素(3.25) に割り当てられるカテゴリ。

注記 1:ヨーロッパ言語の典型的な品詞には、名詞、動詞、形容詞、副詞、前置詞などがあります。

3.38

電話

言語のサウンドシステムにおける最小単位

3.39

脚本

1つ以上の言語の書記 形式(3.14) に使用されるグラフィック文字のセット。

[出典: ISO/IEC 10646:2003, 定義 4.37]

注記 1:スクリプトの記述は、象形文字または音節書記体系とアルファベットのような高レベルの分類から、ローマ字とキリル文字のようなより正確な分類にまで及びます。スクリプトは、ISO 15924 から取得した値のリストによって定義されます。

例:

ひらがな、カタカナ、ラテン語、キリル文字。

3.40

単一の 語彙素(3.25) の 形(3.14) 以下であり、 屈折形(3.20) 、 凝集形(3.5) 、 合成形(3.9) or 派生形(3.12 )の影響を受ける可能性のある一連の形 (3.31) 。 ) プロセス

3.41

サブカテゴリ フレーム

バレンタイン

この特定の語彙素で発生する可能性がある、または発生しなければならない 構文引数 (3.43) のプロパティを示す 語彙素 (3.25) の制限のセット

3.42

サポート動詞

文脈に一般的な意味論的貢献をし、名詞と結合して 語彙素を形成する動詞 (3.25)

例:

試験を受けるor試験を受ける。これらの例では、セマンティクスに基づいて限定された固有の意味のみを取得および付与しますが、コロケーションの概念化を表現するために従来の一般的な方法で使用されています。

3.43

構文引数

動詞によって参照されるプロセスの参加者を識別する節の必須かつ機能的な要素の 1 つ

例:

アルフレッド (統語論) は、今日 (副詞) 本 (統語論) を読みます。

3.44

転記

ある書記体系で記述された発話音を別の書記体系で記述された同じ発話音の同等の表現に変換することを含む、発話音を書き留める首尾一貫した方法から生じる 形式(3.14) 。

3.45

音訳

ある書記体系から別の書記体系への変換の結果生じる 形式(3.14) 。通常、文字間の1対1の対応を通じて。

3.46

変異体

語彙素 (3.25) の代替 形式 (3.14) の 1 つ。

3.47

語形

語彙素 (3.25) が文 または句で使用されるときにとる 形式 (3.14)

参考文献

[1]IETF BCP 4, 現在 (2006 年 6 月) RFC 4646 「言語を識別するためのタグ」、および RFC 4647 「言語タグのマッチング」に代表される
[2]Rumbaugh , J.、 Jacobson , I. およびBooch , G.統一モデリング言語リファレンス マニュアル、第 2 版、Addison Wesley, 2004 年
[3]クリップ。 2000, ff. Clips: Browsing Semantic and Syntactic Data http://www.ilc.cnr.it/clips/SYN_SEM/browsing.htm
[4]Mel'čuk 、I.、 Clas, A.、Polguère, A.辞書学の説明と組み合わせによる紹介。デュキュロット。ブリュッセル、1995 年 (Dictionnaire Explicatif et Combinatoire
[5]Calzolari , N.、 McNaught , J. およびc , A. Eagles、編集者紹介、1996 年 http://www.ilc.cnr.it/EAGLES96/edintro/edintro.html
[6]多言語計算辞書の標準とベスト プラクティス(ed. Calzolari N.、Bertagna F.、Lenci A.、Monachini M.) MILE (The Multilingual ISLE Lexical Entry) ISLE CLWG 成果物 D2.2 および 3.2 ピサ、2003 年
[7]ワードネット 2.1 http://wordnet.princeton.edu
[8]Fellbaum , C. 英語のセマンティック ネットワーク: すべての WordNet の母。中: EuroWordNet: 字句セマンティック ネットワークを備えた多言語データベース(ed. Vossen)、Kluwer 学術出版社、1998 年
[9]A ntoni -L ay , M.-H.、F rancopoulo , G. および Z aysser , L. 再利用可能なレキシコンの汎用モデル: GENELEX プロジェクト、 Literary and linguistic computing 、 , 1994, pp. 47- 54
[10]Carlson , D. Modeling XML applications with UML , Addition Wesley, 2001
[11]Mel'čuck , I. Cours de morphologie générale , 5 巻, Presses de l'Université de Montréal, 1993-2000
[12]F radin , B.形態学における新しいアプローチ , Presses universitaires de France, 2003
[13]Matthews 、 PH Morphology 、第 2 版、ケンブリッジ大学出版局、1991 年
[14]マシューズ、PH屈折形態学: ラテン語動詞活用の側面に基づく理論的研究、ケンブリッジ大学出版局、1972 年
[15]Stump 、G. Inflectional morphology: a theory of paradigm structure 、Cambridge University press, 2001
[16]Comrie 、B. Language Universals and linguistictypology 、第 2 版、シカゴ大学出版局、1989 年
[17]アロノフ、M.形態自体: ステムと屈折クラス、MIT プレス、1994
[18]W right , SE A global data category registry for interoperable language resources , LREC リスボン, 2004
[19]I de N. and Romary L. A registry of standard data Categories for linguistic annotation 、LREC リスボン、2004
[20]Francopoulo 、G.、D eclerck 、T.、 Monachini 、M.およびRomary 、L.研究インフラストラクチャの標準の関連性、LRECジェノバ、2006
[21]M el'čuk , I. Dictionnaire explicatif et compinatoire du français contemporain 、4巻。 Presses de l'Université de Montreal, 1984-1999
[22]B lachere 、R.およびG audefroy-Demonbynes 、M.Grammaire de l'arabe classique 。メゾヌーヴとラローズ、2004
[23]Lombard 、 D.Introduction à l'indonésien 。列島、パリ、1​​991
[24]Francopoulo 、G, B el 、N, George 、M, C alzolari 、N, Monachini 、M, P et 、M, S oria 、C. Lexical Markup Framework: NLP Lexicons の意味情報に関する ISO 標準。 GLD, 字句意味論および存在論的資源ワークショップ、テュービンゲン、2007
[25]フダク、T.タイ。 In: The world's major languages (ed. Comrie, B.)、オックスフォード大学出版局、オックスフォード、1987
[26]H igbie , J.タイ語を話しましょう。オーキッドプレス、バンコク、2004
[27]B rohée 、JM および R enaud 、J. Vocabulaire hongrois 。オフリス、パリ、2001
[28]K hemakhem , A., Gargouri , B., Abdelwahed , A. およびFrancopoulo , G. Modélisation des paradigmes de flexion des verbes arabes selon la norme LMF-ISO 24613 , TALN, Toulouse, 2007
[29]R uppenhofer , J.、E llsworth , M.、 Petruck , M.、 Johnson , C. およびS.cheffczyk , J. FrameNet II: Extended Theory and Practice 、2006 book.html
[30]Pustejovsky 、J .生成語彙。 MITプレス、1995年
[31]ISO 16642:2003, 用語におけるコンピュータ アプリケーション — 用語マークアップ フレームワーク
[32]ISO 24610-1, 言語リソース管理 — 機能構造 — Part 1: 機能構造表現
[33]ISO/IEC 10646:2003, 情報技術 — Universal Multiple-Octet Coded Character Set (UCS)

3 Terms and definitions

For the purposes of this International Standard, the terms and definitions given in ISO 1087-1, ISO 1087-2 and the following apply 4) .

3.1

abbreviated form

form (3.14) resulting from the omission of any part of the full form (3.16) of the same lexeme (3.25)

3.2

adjunct

non-essential element associated with a verb as opposed to syntactic arguments (3.43)

EXAMPLE:

Alfred (syntactic argument) reads a book (syntactic argument) today (adjunct).

Note 1 to entry: Adverbs are possible adjuncts for a sentence.

3.3

affix

bound morph (3.8) that may contribute to a form (3.14) and participates in the process of inflection (3.20) , agglutination (3.5) , derivation (3.12) or composition (3.9)

Note 1 to entry: Affixes function as prefixes (pre-positioned), suffixes (post-positioned), infixes (inserted) and circumfixes (combination of prefix and suffix).

3.4

affixation

process in which an affix (3.3) is added to a lemma (3.24) or a stem (3.40)

3.5

agglutination

process in which an agglutinated form (3.6) is made up

3.6

agglutinated form

word form (3.47) that a lexeme (3.25) can take when used in a sentence or a phrase within an agglutinating language (3.7)

3.7

agglutinating language

language where the different word forms (3.47) of the same lexeme (3.25) exhibit a variation and that may consist of more than one morph (3.31) but the boundaries between morphs are always clear-cut

EXAMPLE:

Korean, Japanese, Hungarian and Turkish are agglutinating languages [16] .

3.8

bound morph

morph that appears only together with one or several other morphs (3.31)

3.9

composition

compounding

lexeme (3.25) formation in which a new lexeme [associated with its part of speech (3.37) information] is formed by adjoining at least two lexemes, in their original forms (3.14) or with slight transformations

Note 1 to entry: Composition should not be confused with agglutination and derivation, where bound morphs are added to free ones.

3.10

compound

lexeme (3.25) associated with part of speech (3.37) information that is built from two or more lexemes

3.11

compound form

form (3.14) resulting from a composition (3.9)

3.12

derivation

change in the forms (3.14) of a lexeme (3.25) to create a new lexeme, usually by modifying the stem (3.40) or by affixation (3.4)

Note 1 to entry: Sometimes derivation signals a change in part of speech, such as nationtonationalize. Sometimes the part of speech remains the same as in nationalization vs. denationalization.

3.13

derived form

form (3.14) resulting from a derivation (3.12)

3.14

form

sequence of morphs (3.31)

3.15

free morph

morph (3.31) that may stand by itself

EXAMPLE:

The English noun boy.

3.16

full form

complete representation of a lexeme (3.25) for which there is an abbreviated form (3.6)

3.17

grammatical feature

property associated to the inflected (3.19) , agglutinated (3.6) , compound (3.11) or derived form (3.13) that describes the grammatical attribute of the form

Note 1 to entry: An example of a grammatical feature is:/grammatical gender/. (Following the convention adopted in the revision of ISO 12620, the slashes are used in order to delimit data category values.)

3.18

graph

minimal unit in a written language including letters, pictograms, ideograms, numerals and punctuations

3.19

inflected form

word form (3.47) that a lexeme (3.25) can take when used in a sentence or a phrase within an inflectional language (3.21)

3.20

inflection

process in which an inflected form (3.19) is made up

3.21

inflectional language

inflecting language

language where the different word forms (3.47) of the same lexeme (3.25) exhibit a variation and where there is no clear-cut boundary between morphs (3.31) in that morphs are generally fused together to yield a single, non-segmentable form (3.14)

EXAMPLE:

Spanish, Italian, French and English are inflectional languages [16] .

3.22

interlingua

abstract intermediary language used in the machine translation of human languages

3.23

isolating language

language where the vast majority of morphs (3.31) are free morphs (3.15)

EXAMPLE:

Chinese is an isolating language.

3.24

lemma

lemmatized form

canonical form

conventional form (3.14) chosen to represent a lexeme (3.25)

EXAMPLE:

In European languages, the lemma is usually the/singular/ if there is a variation in/number/, the/masculine/ form if there is a variation in/gender/ and the/infinitive/ for all verbs. In some languages, certain nouns are defective in the singular form, in which case, the/plural/ is chosen. In Arabic, for a verb, the lemma is usually considered as being the third person singular with the accomplished aspect.

3.25

lexeme

abstract unit generally associated with a set of forms (3.14) sharing a common meaning

3.26

lexical entry

container for managing one or several forms (3.14) and possibly one or several meanings in order to describe a lexeme (3.25)

3.27

lexical resource

lexical database

database consisting of one or several lexicons (3.28)

3.28

lexicon

resource comprising lexical entries (3.26) for a given language

Note 1 to entry: A special language lexicon or a lexicon prepared for a specific NLP application can comprise a specific subset of language.

3.29

machine readable dictionary

MRD

electronic lexical resource (3.27) designed to be consulted by human beings

Note 1 to entry: Historically, MRDs were first computer representations of “printed” dictionaries, that's why they are called machine readable now.

3.30

machine translation lexicon

electronic lexical resource (3.27) in which the individual lexical entries (3.26) contain equivalents in two or more languages together with morphological, syntactic and/or semantic information to facilitate automatic or semi-automatic processing of lexemes (3.25) during machine translation

3.31

morph

sequence of graphs (3.18) or sequence of phones (3.38)

EXAMPLE:

The word boys consists of two morphs: boy and s.

3.32

morphological pattern

set of associations and/or operations that build the various forms of a lexeme (3.25) , possibly by inflection (3.20) , agglutination (3.5) , composition (3.9) or derivation (3.12) , depending on the language

Note 1 to entry: A morphological pattern is not the explicit list of inflected forms. It usually references a prototypical class of inflectional forms, e.g. ring, as per sing.

3.33

morphology

description of the structure and formation of forms (3.14)

3.34

multiword expression

MWE

lexeme (3.25) made up of a sequence of two or more lexemes that has properties that are not predictable from the properties of the individual lexemes or their normal mode of combination

Note 1 to entry: An MWE can be a compound, a fragment of a sentence, or a sentence. The group of lexemes making up an MWE can be continuous or discontinuous. It is not always possible to mark an MWE with a part of speech.

EXAMPLE:

“To kick the bucket”, which means to die rather than to hit a bucket with one's foot.

3.35

natural language processing

NLP

field covering knowledge and techniques involved in the processing of linguistic data by a computer

3.36

orthography

way of spelling or writing lexemes (3.25) that conforms to a conventionalized use

Note 1 to entry: Aside from standardized spellings of alphabetical languages, such as standard UK or US English, or reformed German spelling, there can be variations such as transliterations of languages in non-native scripts, stenographic renderings, or representations in the International Phonetic Alphabet. In this regard, orthographic information in a lexical entry can describe a kind of transformation applied to the form that is the object of the entry.

3.37

part of speech

lexical category

word class

category assigned to a lexeme (3.25) based on its grammatical properties

Note 1 to entry: Typical parts of speech for European languages include: noun, verb, adjective, adverb, preposition, etc.

3.38

phone

minimal unit in the sound system of a language

3.39

script

set of graphic characters used for the written form (3.14) of one or more languages

[SOURCE: ISO/IEC 10646:2003, definition 4.37]

Note 1 to entry: The description of scripts ranges from a high level classification such as hieroglyphic or syllabic writing systems vs. alphabets to a more precise classification like Roman vs. Cyrillic. Scripts are defined by a list of values taken from ISO 15924.

EXAMPLE:

Hiragana, Katakana, Latin and Cyrillic.

3.40

stem

sequence of morphs (3.31) that is smaller than or equal to the form (3.14) of a single lexeme (3.25) and that may be affected by an inflectional (3.20) , agglutinative (3.5) , compositional (3.9) or derivation (3.12) process

3.41

subcategorization frame

valence

valency

set of restrictions on a lexeme (3.25) indicating the properties of the syntactic arguments (3.43) that can or must occur with this given lexeme

3.42

support verb

verb that makes a generic semantic contribution to the context and that combines with a noun to form a lexeme (3.25)

EXAMPLE:

take an examorgive an exam. In these examples, take and give have only limited inherent meaning based on their semantics, but rather are used in a conventional, generic way to express a collocational conceptualization.

3.43

syntactic argument

one of the essential and functional elements in a clause that identifies the participants in the process referred to by a verb

EXAMPLE:

Alfred (syntactic argument) reads a book (syntactic argument) today (adjunct).

3.44

transcription

form (3.14) resulting from a coherent method of writing down speech sounds, to include converting speech sounds described in one writing system to an equivalent representation of the same speech sounds described in another writing system

3.45

transliteration

form (3.14) resulting from the conversion of one writing system into another, usually through a one to one correspondence between characters

3.46

variant

one of the alternative forms (3.14) of a lexeme (3.25)

3.47

word form

form (3.14) that a lexeme (3.25) takes when used in a sentence or a phrase

Bibliography

[1]IETF BCP 47 (ed. Phillips, A., Davis, M.), currently (June, 2006) represented by RFC 4646 “Tags for Identifying Languages”, and RFC 4647 “Matching of Language Tags”
[2]Rumbaugh, J., Jacobson, I. and Booch, G. The unified modeling language reference manual, 2nd ed., Addison Wesley, 2004
[3]CLIPS. 2000, ff. Clips: Browsing Semantic and Syntactic Data http://www.ilc.cnr.it/clips/SYN_SEM/browsing.htm
[4]Mel’čuk, I., Clas, A., Polguère, A. Introduction à la lexicologie explicative et combinatoire. Duculot. Bruxelles, 1995 (Dictionnaire Explicatif et Combinatoire
[5]Calzolari, N., Mc Naught, J. and Zampolli, A. Eagles, editors introduction, 1996 http://www.ilc.cnr.it/EAGLES96/edintro/edintro.html
[6]Standards and best Practice for Multilingual Computational Lexicons (ed. Calzolari N., Bertagna F., Lenci A., Monachini M.). MILE (The Multilingual ISLE Lexical Entry). ISLE CLWG Deliverable D2.2 and 3.2 Pisa, 2003
[7]Wordnet 2.1 http://wordnet.princeton.edu
[8]Fellbaum, C. A semantic network of English: the mother of all WordNets. In: EuroWordNet: a multilingual database with lexical semantic networks (ed. Vossen), Kluwer academic publishers, 1998
[9]Antoni-Lay, M.-H., Francopoulo, G. and Zaysser, L. A generic model for reusable lexicons: the GENELEX project, Literary and linguistic computing, 9 (1), 1994, pp. 47-54
[10]Carlson, D. Modeling XML applications with UML, Addision Wesley, 2001
[11]Mel’čuck, I. Cours de morphologie générale, 5 volumes, Presses de l'Université de Montréal, 1993-2000
[12]Fradin, B. Nouvelles approches en morphologie, Presses universitaires de France, 2003
[13]Matthews, P.H. Morphology, 2nd ed, Cambridge University press, 1991
[14]Matthews, P.H. Inflectional morphology: a theoretical study based on aspects of latin verb conjugation, Cambridge University press, 1972
[15]Stump, G. Inflectional morphology: a theory of paradigm structure, Cambridge University press, 2001
[16]Comrie, B. Language universals and linguistic typology, 2nd ed, University of Chicago press, 1989
[17]Aronoff, M. Morphology by itself: stems and inflectional classes, MIT press, 1994
[18]Wright, S.E. A global data category registry for interoperable language resources, LREC Lisbon, 2004
[19]Ide, N. and Romary, L. A registry of standard data categories for linguistic annotation, LREC Lisbon, 2004
[20]Francopoulo, G., Declerck, T., Monachini, M. and Romary, L. The relevance of standards for research infrastructure, LREC Genoa, 2006
[21]Mel'čuk, I. Dictionnaire explicatif et combinatoire du français contemporain, 4 volumes. Presses de l'Université de Montréal, 1984-1999
[22]Blachère, R. and Gaudefroy-Demombynes, M. Grammaire de l'arabe classique. Maisonneuve and Larose, 2004
[23]Lombard, D. Introduction à l'indonésien. Archipel, Paris, 1991
[24]Francopoulo, G., Bel, N., George, M., Calzolari, N., Monachini, M., Pet, M. and Soria, C. Lexical Markup Framework: ISO standard for Semantic Information in NLP Lexicons. GLDV (Gesellschaft für linguistische Datenverarbeitung), Lexical-Semantic and ontological resources workshop, Tubingen, 2007
[25]Hudak, T. Thai. In: The world's major languages (ed. Comrie, B.), Oxford University press, Oxford, 1987
[26]Higbie, J. Let's speak Thai. Orchid press, Bangkok, 2004
[27]Brohée, J.M. and Renaud, J. Vocabulaire hongrois. Ophrys, Paris, 2001
[28]Khemakhem, A., Gargouri, B., Abdelwahed, A. and Francopoulo, G. Modélisation des paradigmes de flexion des verbes arabes selon la norme LMF-ISO 24613 , TALN, Toulouse, 2007
[29]Ruppenhofer, J., Ellsworth, M., Petruck, M., Johnson, C. and Scheffczyk, J. FrameNet II: Extended Theory and Practice, 2006 http://framenet.icsi.berkeley.edu/book/book.html
[30]Pustejovsky, J. The generative lexicon. MIT press, 1995
[31]ISO 16642:2003, Computer applications in terminology — Terminological markup framework
[32]ISO 24610-1, Language resource management — Features structures — Part 1: Feature structure representation
[33]ISO/IEC 10646:2003, Information technology — Universal Multiple-Octet Coded Character Set (UCS)