この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
この文書の目的上、次の用語と定義が適用されます。
ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。
3.1 言語および個別言語に関する用語
3.1.1
人間の言語
人間間の意味やメッセージを表現したり伝達したりするために組み合わせることができる、音、視覚空間記号、文字、またはその他の書かれた記号や記号を体系的に使用することを特徴とするコミュニケーション手段。
注記 1:人間の言語はもともと人間間の直接コミュニケーションのために開発され、主に人間間の直接コミュニケーションに使用されました。現在、その使用は情報通信技術 (ICT) によってますますサポートされています。
注記 2: 「言語」という用語はさまざまな概念を表すことができるため、「人間の言語」という用語の同義語としてはリストされていません。
注記 3:視覚空間記号は、 記号付きモダリティ (3.5.4) の下に示されています。
[出典:ISO 21636-1:— 1, 3.1.1 ]
3.1.2
愚か者
人間の言語 (3.1.1) のすべての表現とその意味をまとめた包括的なセット。構造的特徴の一貫したシステムを特徴とし、複雑な事実や思考をコード化することができ、特定の種類の状況で特定の個人によって使用される可能性があります。 、特定の時間、特定の媒体で
注記 1:通常、人は 個々の言語のいくつかの慣用句を使いこなすことができます (3.1.3) 。
例 1:
(仮説) 特定の人物 (米国フィラデルフィア出身で学術的な訓練を受けていない成人労働者階級の人で、英語を母国語としており、コミュニケーション力が特に向上または抑制されていない人) によって 1950 年代に使用されていた、書かれた非公式のアメリカ英語。機能的な能力)。
例 2:
(仮説) 2010 年の言語学の分野で英国の著名な中年の学者は、a) 学会の同僚とのパネルディスカッションで、受け取った発音で話し、b) 英国の同じ町のテニスクラブのメンバーとテニストーナメントについて話し合ったとします。イングランドの南東部。
[出典:ISO 21636-1:—、3.1.2, 修正 — エントリの注 1 が短縮されました。概念を説明するために例を追加しました。]
3.1.3
個別の言語
個々の人間の言語
異なる 話者 (3.1.5) によって使用される最大の 慣用句 (3.1.2) 。それらはすべて、高い相互理解性を通じて、または高い相互理解性の連鎖を通じて相互接続されているか、または社会政治的にそのような話者と同等の単位としてみなされています。最大のセット
注記 1:個々の言語には 構文言語 (3.3.2) も含まれますが、形式言語 (ISO 1087:2019, 3.1.10 で定義) は含まれません。
注記 2:通常、他の文脈では、個々の言語は単に「言語」と呼ばれます。ただし、「言語」という用語には複数の意味と含意があるため、このドキュメントの文脈では混乱を引き起こす可能性があります。それでも、属性および場合によっては複数形が個々の言語を意味していることを明確に示している場合、この文書では「クレオール言語」、「アジア言語」、または 「現存言語」などの「言語」のみを使用します (3.3.3) ) 。
例:
英語、グアラニー語、LIBRA, ハイチ クレオール語、エスペラント語。
[出典:ISO 21636-1:—、3.1.3]
3.1.4
個別の手話
基本モダリティ (3.5.5) が 署名付きモダリティ (3.5.4) である 個別言語 (3.1.3)
注記 1:通常、「手話」は、それぞれの個別の手話の名前の一部です。
例:
アメリカ手話 (ASL)、ラング デ サイン ケベコワーズ/ケベック手話 (LSQ)
注記 2:個々の手話言語は、別の 言語モダリティ (3.5.1) で通常表現される個々の言語を表現できる「手話モダリティ」とは異なります。たとえば、表現するための「正確な英語の署名」などです。英語。したがって、「手話」という用語は「個人手話」という用語の同義語として使用されるものではありません。
[出典:ISO 21636-1:—、3.1.4]
3.1.5
スピーカー
慣用句を利用できる人 (3.1.2)
注記 1: 「話者」という用語は、すべての 言語モダリティ (3.5.1) の使用をカバーするため、一般的な概念「話者」を示すために使用され、また、「書き手」、「署名者」、など、必要に応じて導入できます。
[出典:ISO 21636-1:—、3.1.5, 修正 — エントリの注 1 を短縮。]
3.1.6
言語コミュニティ
社会的に識別可能なグループ。典型的には、 個々の言語 (3.1.3) or 言語多様性 (3.2.4 ) の 話者 (3.1.5) で構成され、そのメンバーがその個々の言語または言語多様性に共感している。
注記 1:絶滅の危機に瀕している言語の場合、個々の言語の話者は実際には言語コミュニティの少数派である可能性があります。
3.2 言語変異と言語多様性に関連する用語
3.2.1
言語のバリエーション
言語のバリエーション
個々の言語内および個々の言語間の違い(3.1.3)
[出典:ISO 21636-1:—、3.2.1]
3.2.2
言語の変動に対する外部基準
慣用句のシステムの言語的特徴の外部要因に基づく、 慣用句の一連のプロパティ (3.1.2)
注記 1: 言語変異の外部基準には、慣用句を使用する 話者 (3.1.5) 、または言語使用イベント(ISO 21636-1:—、3.1.6) に関連する慣用句の特性が含まれます。愚痴が使われます。
例:
「イースト・アングリア出身の話者の特徴であること」は、言語の多様性に関する外部基準 [この場合、地理的空間に関連する基準 (ISO 21636-1:—、3.2.4 の例を参照)] の唯一の要素である特性です。 )、英語の特定の 方言 (3.2.5) を定義します。
[出典:ISO 21636-1:—、3.2.2]
3.2.3
言語変異の構造的基準
慣用句のシステムの言語的特徴に基づく、 慣用句のプロパティのセット (3.1.2)
注記 1: この一連の特性には、特に、音声学的、音韻論的、形態学的、構文的、語彙的、意味論的、または語用論的特性が含まれる。
注記 2:言語変動の構造的基準の要素は、ISO/TR 20694 などでは「マーカー」とも呼ばれます。「言語変動の構造的基準」という用語は、 言語変動の枠組み (3.2) とよりよく統合されるため、好まれます。 .1) ISO 21636 シリーズで開発されました。
[出典:ISO 21636-1:—、3.2.3]
3.2.4
言語の多様性
バラエティ
<言語コーディング> 言語変動の外部基準 (3.2.2) と 言語変動の構造的基準 (3.2.3) の両方に関して内部的に一貫している、 個々の言語 (3.1.3) の最大のサブセット。識別され、名前が付けられる
注1: 「言語変異」(3.2.1)、「言語変異」、「言語変異」、「言語変異」、または「言語多様性」などの用語は、他の概念を表すためにも使用されるため、「言語変異」という用語のみを使用します。このドキュメントでは「言語の多様性」という用語が使用されています。
[出典:ISO 21636-1:—、3.2.5]
3.2.5
方言
<言語学> 特定の地理的位置または地域の 話者 (3.1.5) に特有の 言語の多様性 (3.2.4)
[出典:ISO 21636-1:—、3.4.1, 修正 — エントリの注 1 を削除。]
3.2.6
標準品種
個々の言語 (3.1.3 ) が話されているか使用されている地理的where 、またはいくつかの方言が存在する地理的地域の大部分にわたって、ほとんどの 話者 (3.1.5) によって標準または公式として認識されてwhere 言語 の多様性 (3.2.4) (3.2.5) が使用されます
注記 1:個別言語の標準言語は、通常、公式または公のコミュニケーション、および異なる言語言語のユーザー間のコミュニケーションで使用されます。
注記 2:標準品種は、多くの場合、高度な標準化または正規化によって特徴付けられます。
[出典:ISO 21636-1:—、3.4.2, 修正 — エントリの注 1 を削除。]
3.3 言語コーディングの対象となる個々の言語の種類に関する用語
3.3.1
自然言語
言語コミュニティ (3.1.6) で積極的に使用されている、または使用されていた 個別の言語 (3.1.3) で、ある世代の 話者 (3.1.5) から次の世代に受け継がれます。
例:
バンバラ語、英語、ハイチ クレオール語、ラテン語、LIBRAS (Língua Brasileira de Sinais/ブラジル手話)
[出典:ISO 21636-1:—、3.1.9]
3.3.2
構築された言語
使用前にルールが明示的に確立される 個別の言語 (3.1.3)
例:
エスペラント語、ヴォラピュク語、クエンヤ語、ナヴィ語。
注記 1: 構築言語には、 再構築言語 (3.3.9) 、コンピュータプログラミング言語、マークアップ言語、または類似の形式言語は含まれません。
注記 2:一部の構築言語は 1 つまたは複数の 自然言語 (3.3.1) に基づいており、したがって人工的なものではありません。したがって、同義語としてよく使用される「人工言語」という用語は、本書では使用されません。
[出典:ISO 21636-1:—、3.1.10]
3.3.3
生きた言語
現時点で 言語コミュニティ (3.1.6) によって使用されている 個別の言語 (3.1.3)
例:
英語、バンバラ。
注記 1: 現存する言語には、ヘブライ語やマン島語など、以前は 消滅したが復活した言語 (3.3.4) が含まれます。
3.3.4
絶滅した言語
もう使用されなくなり、ここ数世紀で最後の母語 話者 (3.1.5) を 失った 個々の言語 (3.1.3)
例:
古プロイセン、アマナイエ、バサイ。
3.3.5
歴史的言語
近代以前に使われなくなった 個別の言語 (3.1.3)
例:
古英語、中英語、古代ギリシャ語、エトルリア語。
注記 1: 歴史的言語には、 現存言語 (3.3.3) または 絶滅言語 (3.3.4) の既知の初期の時代が含まれます。
3.3.6
完全な言語
さまざまな領域で使用される 個別の言語 (3.1.3) 、 言語コミュニティ (3.1.6) の性別や年齢グループなど、ほとんどまたはすべての社会グループにわたるコミュニケーションをサポートするために使用され、少なくとも個々の言語の地理的領域全体にわたって広く理解されている 1 つの 言語多様性 (3.2.4)
注記 1:完全な言語は、新しい世代がそれぞれの言語を独自のものにするため、段階的に変更される可能性があります。
3.3.7
制限された言語
特定の言語 (3.1.3) or 構築言語 (3.3.2) の 言語多様性 (3.2.4) 文脈によっては個別の言語に似ているが、使用されるという点で 完全な言語 (3.3.6) ではありません。限られた状況で
注記1: 制限言語とは、例えば、回避言語、秘密言語、儀式言語、遊び言語、都市言語、青少年言語などである。
3.3.8
マクロ言語
言語コーディングの目的で 2 つ以上の他の個別言語に細分化できる 個別言語 (3.1.3)
例:
状況によっては、中国語は漢語表意 文字で書かれた文書の個別言語として宣言されます (3.6.2) が、文書の言語は北京語、越語、呉語、またはその他の関連する中国の個別言語である可能性があります。
注記 1: 言語グループ (3.4.1) とは対照的に、マクロ言語に対応する個々の言語は非常に密接に関連しており、それらが別個の個々の言語として認識される文脈が存在するものとします。
注記 2:言語の発達は、マクロ言語と関連する個々の言語または 方言との関係を時間の経過とともに変化させる可能性があります (3.2.5) 。
3.3.9
再構成された言語
仮説上の 個々の言語 (3.1.3) それ自体は証明されていないが、証明された言語のグループ間の規則的な対応に基づいて仮定され、そのうちの仮想言語は共通の祖先の言語であると考えられています。
例:
インド・ヨーロッパ祖語、ゲルマン祖語。
3.4 言語コーディングの対象となる言語グループに関連する用語
3.4.1
言語グループ
共通の特性に基づく 個別言語のセット (3.1.3)
例:
「コーカサス言語」(言語の地理的グループ)。 「北コーカサス言語」[ 言語族 (3.4.2)
注記 1:共通の特徴には、同じ地理的地域で話されていること、遺伝的に関連していること [すなわち、言語族 (の枝) であること], または声調言語であるか言語であるなどの類型的特徴の共有が含まれますが、これらに限定されません。形態学的に孤立した言語、またはそれらの組み合わせ。
注記 2: 1 つの言語グループには、いくつかのより小さな言語グループが含まれる場合があります。
注記 3: 識別された言語グループとは、 マクロ言語 (3.3.8) に対応しない個々の言語のグループです。メンバーの中にマクロ言語を含めることができます。
3.4.2
言語家族
共通の祖先言語に基づく 個々の言語(3.1.3) を包含する 言語グループ(3.4.1)
例:
北コーカサス言語。
注記 1:言語族は、単一の個別の言語をメンバーとして構成することができます。
3.5 言語使用の様式に関連する用語
3.5.1
言語様式
話者によるコミュニケーションに使用される特定の媒体またはチャネルに固有の 言語の多様性 (3.2.4) ( 3.1.5)
注記 1: ISO 21636-1 に規定されているように、言語モダリティには、 話し言葉のモダリティ (3.5.2) 、 書き言葉のモダリティ (3.5.3) 、 署名されたモダリティ (3.5.4) 、太鼓のモダリティ、口笛を吹くモダリティが含まれます。この文書では、音声モダリティ、書き言葉モダリティ、および署名モダリティのみを参照します。
[出典:ISO 21636-1:—、3.4.7, 修正 — 項目の注 1 ~ 3 が、新しい項目の注 1 に置き換えられました。]
3.5.2
話し言葉のモダリティ
話し言葉のモダリティ
口頭コミュニケーションで使用される 言語モダリティ (3.5.1) であり、その主要な表現方法として 話者の声 (3.1.5) の明瞭な音を持ちます。
注記 1:ジェスチャー、顔の表情、その他同様の現象がほとんどの場合音声に付随するため、音声モダリティにおける言語使用の事象も通常は多峰性である。
[出典:ISO 21636-1:—、3.5.1, 修正 — 項目の注 1 ~ 3 が、新しい項目の注 1 に置き換えられました。]
3.5.3
書面によるモダリティ
書き言葉のモダリティ
グラフィックシンボルのシステムを利用する 言語モダリティ (3.5.1)
注記 1:一部の 人工言語 (3.3.2) は、 基本モダリティとして書き言葉のモダリティ (3.5.5) を持ちますが、 自然言語 (3.3.1) では、 話し言葉のモダリティ (3.5.2) or 署名されたモダリティ (3.5 .4) は、 書かれたモダリティの派生元となる基本的なモダリティです。
[出典:ISO 21636-1:—、3.5.3, 修正 — エントリの注 2 を削除。]
3.5.4
署名付きモダリティ
手話モダリティ
手の形、手のひらの向きと手、腕、口、頭または体の動き、および顔の表情の組み合わせを使用する視覚空間 言語モダリティ (3.5.1)
注記 1:言語モダリティ「署名付きモダリティ」は、 基本モダリティ (3.5.5) が署名モダリティである 個別の言語 (3.1.3) を指す 「個別手話」(3.1.4) とは異なります。
注記 2:署名付きモダリティは個々の手話言語の基本的なモダリティですが、他のいくつかの個別言語にも署名付きモダリティがあります。
例:
Signing Exact English, 英語を(話し言葉または書き言葉で)表現するための署名付きモダリティ。
[出典:ISO 21636-1:—、3.5.4, 修正 — エントリの注 1 の最後の部分を削除。]
3.5.5
基本的なモダリティ
基本的な言語モダリティ
特定の 個別言語 (3.1.3) が最も一般的に使用され、その言語が発展し、その個別言語の他の言語様式 (存在する場合) がそこから派生する 言語様式 (3.5.1)
注記 1:ほとんどの 自然言語 (3.3.1) では、基本モダリティは 音声モダリティ (3.5.2) です。特に、 書き言葉のモダリティ (3.5.3) は 、これらの自然言語において、書き言葉は口頭言語使用の特性の表現であるという意味で、話し言葉のモダリティから派生したものです [非アルファベット 文字体系 (3.6) の場合であっても] .1) 】。
注記 2: 個々の手話 (3.1.4) の場合、基本モダリティは 手話モダリティ (3.5.4) です。これらが書かれているか、あるいはグラフィックで表現されている場合、書かれたモダリティは、書くことが視覚空間言語使用の特性(つまり、署名されたモダリティ)の表現であるという意味で、署名されたモダリティから派生します。
[出典:ISO 21636-1:—、3.5.11, 修正 — エントリの注 1 が短縮され、エントリの注 3 が削除。]
3.6 個々の言語の表記に関する用語
3.6.1
書記体系
個々の言語を記述するためのシステム (3.1.3) (スクリプト (3.6.2) および使用される正書法規則を含む)
3.6.2
スクリプト
<言語コーディング> 1 つ以上の 個別言語の書き言葉に使用されるグラフィック文字の包括的なセット (3.1.3)
例:
キリル文字、ひらがな。
注記 1:スクリプトは、文字の任意のサブセットとは対照的に、他のスクリプトと区別して定義されます。一般に、ある文字の読者は、それらの間に歴史的な関係があるwhere でも、別の文字のグリフを簡単に読むことができない場合があります。
3.6.3
スクリプト識別子
スクリプトシンボル
<言語コーディング> スクリプト (3.6.2) を 明確に表すために割り当てられた文字列
3.7 言語コーディングおよび言語命名に関する用語
3.7.1
コード
最初の値セットの要素を 1 つ以上の異なるセットの要素にマップするルールのコレクション
注記 1: ISO 639 言語コードの最初の要素セットは 、個々の言語 (3.1.3) or 言語グループ (3.4.1) を指します。マッピングされる要素のセットはコード値、具体的には 言語識別子 (3.7.10) です。
[出典:ISO/IEC 2382:2015, 2121552, 修正 - 認められた用語「コーディング スキーム」を削除。定義内の「1 つ以上の異なるセットの要素に対する値の最初のセット」は、「2 番目のセットの要素に対する最初のセット」に置き換えられました。エントリへの注記 1 ~ 2 は、エントリへの新しい注記 1 に置き換えられました。エントリの注記 3 ~ 5 が削除されました。]
3.7.2
コード要素
コードで表現されるエンティティに関する構造化情報のコレクション (3.7.1)
3.7.3
言語コード
一意の 言語参照名 (3.7.13) で表される 個々の言語 (3.1.3 ) or 言語グループ (3.4.1) を 言語識別子 (3.7.10) にマッピングする コード (3.7.1)
例:
ISO 639 言語コード。
注記 1:言語コードを開発する活動および主題は「言語コーディング」と呼ばれます。
3.7.4
言語コード要素
個々の言語 (3.1.3) または 言語グループ (3.4.1) を表す 言語コード (3.7.3) の コード要素 (3.7.2)
例:
「Efik」 [ 言語参照名 (3.7.13) ], 「Efik」 [英語の 言語名 (3.7.12) ], 「efik」 (フランス語の言語名)、「efi」 [ 言語識別子 (3.7.10) ]と コード要素の範囲(3.7.5) 「個別言語」の情報を合わせて言語コード要素を構成する。
注記 1:言語コード要素は、少なくとも 1 つの固有の言語参照名と、1 つ以上のセットに属する 1 つ以上の言語識別子で構成されます。
注記 2:この文書で引用されている言語コード要素はそれぞれ、個別の言語または言語グループを表します。言語コード要素に加えて、ISO 639 言語コードには 4 つの 特殊目的コード要素 (3.7.9) も含まれています。
3.7.5
コード要素のスコープ
コード要素 (3.7.2) の属性。その表記が 1 つ以上の 個別の言語 (3.1.3) にマッピングされる方法を文書化します。
注記 1:コード要素の範囲は 4 つあります: 個別言語コード要素 (3.7.6) 、 マクロ言語コード要素 (3.7.7) 、 言語グループ コード要素 (3.7.8) および 特殊目的コード要素 (3.7) .9) 。
3.7.6
個別の言語コード要素
個々の言語 (3.1.3) の コード要素スコープ (3.7.5) の値を持つ 言語コード要素 (3.7.4)
注記 1:個別言語コード要素によって表される個別言語は、異なる個別言語コード要素によって表される他の個別言語とは異なるものとみなされます。
注記 2:個別言語コード要素は、 マクロ言語 (3.3.8) ではない個別言語を表します。
3.7.7
マクロ言語コード要素
言語コード要素 (3.7.4) と マクロ言語 (3.3.8) の コード要素スコープ (3.7.5) の値
注記 1:マクロ言語コード要素は、マクロ言語である 個別の言語 (3.1.3) を表します。
3.7.8
言語グループコード要素
言語コード要素 (3.7.4) と 言語グループ (3.4.1) の コード要素スコープ (3.7.5) の値
注記 1:言語グループコード要素は、 マクロ言語 (3.3.8) に対応しない 個々の言語 (3.1.3) のグループを表します。
3.7.9
特別な目的のコード要素
特別な目的のための コード要素スコープ (3.7.5) の値を持つ 言語コード (3.7.3) の 言語コード要素 (3.7.4)
例:
mul – コンテンツ内の複数の言語。
注記 1:特殊目的のコード要素は、ISO 639 言語コードで識別される 個々の言語 (3.1.3) or 言語グループ (3.4.1) を参照するものではありませんが、データ管理の目的には役立ちます。
3.7.10
言語識別子
言語記号
一意に識別する目的で、 個々の言語 (3.1.3) または 言語グループ (3.4.1) に割り当てられた文字列
注記 1: ISO 639 言語コードでは、文字列は文字列で構成されます。
注記 2:単一の 言語コード要素 (3.7.4) が 複数の言語識別子を持つ場合、言語識別子は同義であり、それぞれが個々の言語または言語グループを明確に識別します。
例:
個々の言語「オランダ語」には、2 文字の言語識別子「nl」、用語やその他の言語アプリケーションの分野で使用される 3 文字の識別子「nld」、および言語分野で使用される別の 3 文字の識別子「dut」が割り当てられます。図書館と文書の分野。個別言語「ポーランド語」には、2 文字の言語識別子「pl」と 3 文字の識別子「pol」が割り当てられます。言語グループ「コイサン語」には、3 文字の言語識別子「khi」が割り当てられます。
3.7.11
現地で使用される言語識別子
言語識別子 (3.7.10) ローカル使用のために予約されています
例:
「qij」(「Akeu」を指定)は、永続的な言語識別子の代わりにローカルで一時的に使用されます。
注記 1:ローカル使用言語識別子は、割り当てられた 言語コード要素 (3.7.4) の一部ではありません。
注記 2:すべての現地使用言語識別子は 3 文字で構成されます。
3.7.12
言語名
個々の言語 (3.1.3) または 言語グループ (3.4.1) に名前を付けるための言語表現
例:
「アングレ」(フランス語の個別言語「英語」)、「白人言語」(言語集団)。
注記 1:言語名を割り当てる活動および主題は、「ネーミング言語」と呼ばれます。
注記 2:多くの場合、個々の言語または言語グループは、複数の言語名または特定の言語における言語名の変形によって表されることがあります。
3.7.13
言語参照名
言語コード (3.7.3) 内で 個々の言語 (3.1.3) or 言語グループ (3.4.1) を 一意に指定することを目的とした 言語名 (3.7.12)
注記 1: 識別された 2 つの異なる個別言語または言語グループの共通言語名が同じである場合、曖昧さを解消または区別する情報が追加され、それぞれに固有の言語参照名が作成されます。
例:
曖昧さ回避または差別化情報を含まない言語参照名「フランス語」、曖昧さ回避または差別化情報を含む言語参照名「Mor (モール諸島)」および「Mor (ボンベライ半島)」。
参考文献
| 1 | ISO 1087:2019, 用語作業および用語科学 — 語彙 |
| 2 | ISO 3166-2, 国名およびその下位区分の表現に関するコード — Part 2: 国の下位区分コード |
| 3 | ISO 3166-3, 国名およびその下位区分の表現に関するコード — Part 3: 以前に使用されていた国名のコード |
| 4 | ISO 5127:2017, 情報と文書 - 基礎と語彙 |
| 5 | ISO 10241-2, 規格内の用語項目 - Part 2: 標準化された用語項目の採用 |
| 6 | ISO/TR 20694, 言語レジスタの類型 |
| 7 | ISO 21636-1:—、 3言語コーディング — 言語多様性のフレームワーク — Part 1: 語彙 |
| 8 | ISO/TR 21636-2, 言語コーディング — さまざまな言語のフレームワーク — Part 2: フレームワークの説明 |
| 9 | ISO 21636-3, 4言語コーディング — さまざまな言語のフレームワーク — Part 3: フレームワークの適用 |
| 10 | ISO/IEC 2382:2015, 情報技術 - 語彙 |
| 11 | ISO/IEC 10646, 情報技術 - ユニバーサルコード化文字セット (UCS) |
| 12 | IETF BCP 47, 言語を識別するためのタグ。入手可能場所: https://www.rfc-editor.org/info/bcp47 |
| 13 | IETF RFC 6497, BCP 47 拡張 T — 変換されたコンテンツ。以下で入手可能です: https://www.rfc-editor.org/info/rfc6497 |
| 14 | Unicode CLDR, 共通ロケール データ リポジトリ。 http://cldr.unicode.org/ から入手できます。 |
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
3.1 Terms related to language and individual languages
3.1.1
human language
means of communication characterized by a systematic use of sounds, visual-spatial signs, characters or other written symbols or signs that can be combined to express or communicate meaning or a message between humans
Note 1 to entry: Human language was originally developed for, and mainly used in, direct communication between humans. Today its use is increasingly supported by information and communication technologies (ICTs).
Note 2 to entry: As the term “language” can represent different concepts, it is not listed as a synonym to the term “human language”.
Note 3 to entry: Visual-spatial signs are indicated under signed modality (3.5.4) .
[SOURCE:ISO 21636-1:— 1 , 3.1.1]
3.1.2
idiolect
comprehensive set of all expressions of human language (3.1.1) with their meaning, characterized by a coherent system of structural features, which is capable of coding complex facts and thoughts, potentially used by a given individual person, in a given type of situation, at a given time, and in a given medium
Note 1 to entry: Typically, a person has command of several idiolects of an individual language (3.1.3) .
EXAMPLE 1:
(hypothetical) The written informal American English used in the 1950s by a given person (an adult working-class person with no academic training from Philadelphia, USA, who is a native speaker of English and who does not show any particularly enhanced or constrained communicative functioning abilities).
EXAMPLE 2:
(hypothetical) A given middle-aged renowned British academic in the field of linguistics in 2010: a) speaking with received pronunciation at panel discussions with colleagues in academic conferences, and b) discussing tennis tournaments with fellow tennis club members of the same town in the south-east of England.
[SOURCE:ISO 21636-1:—, 3.1.2, modified — Note 1 to entry shortened. Examples added to illustrate the concept.]
3.1.3
individual language
individual human language
largest set of idiolects (3.1.2) , used by different speakers (3.1.5) , which are all interconnected through high mutual intelligibility, or through a chain of high mutual intelligibility, or which are sociopolitically considered as a unit equivalent to such a largest set
Note 1 to entry: Individual languages also encompass constructed languages (3.3.2) , but do not include formal languages (as defined in ISO 1087:2019, 3.1.10).
Note 2 to entry: Usually, in other contexts, individual languages are simply called “languages”. However, the term “language” has multiple meanings and connotations, which can cause confusion in the context of this document. Still, when an attribute and possibly the plural clearly indicate that individual languages are meant, this document uses only “language(s)”, as in “creole languages”, “Asian languages” or “living languages” (3.3.3) .
EXAMPLE:
English, Guarani, LIBRAS (Língua Brasileira de Sinais/Brazilian Sign Language), Haitian Creole, Esperanto.
[SOURCE:ISO 21636-1:—, 3.1.3]
3.1.4
individual sign language
individual language (3.1.3) whose basic modality (3.5.5) is the signed modality (3.5.4)
Note 1 to entry: Usually “sign language” is part of the name of the respective individual sign language.
EXAMPLE:
American Sign Language (ASL), langue des signes québéquoise/Quebec Sign Language (LSQ).
Note 2 to entry: Individual sign languages differ from the “signed modality”, by which an individual language can be expressed which is normally expressed in another language modality (3.5.1) , such as by “Signing Exact English” for expressing English. Therefore, the term “signed language” is not used as a synonym to the term “individual sign language”.
[SOURCE:ISO 21636-1:—, 3.1.4]
3.1.5
speaker
person who is capable of making use of an idiolect (3.1.2)
Note 1 to entry: The term “speaker” covers the use of all language modalities (3.5.1) and is thus used to denote a generic concept “speaker”, also covering all specific concepts such as “writer”, “signer”, etc., which can be introduced when needed.
[SOURCE:ISO 21636-1:—, 3.1.5, modified — Note 1 to entry shortened.]
3.1.6
language community
socially identifiable group that consists prototypically of the speakers (3.1.5) of an individual language (3.1.3) or language variety (3.2.4) and whose members identify with that individual language or language variety
Note 1 to entry: In the case of endangered languages, the speakers of the individual language can actually be a minority of a language community.
3.2 Terms related to linguistic variation and language varieties
3.2.1
linguistic variation
language variation
differences within and between individual languages (3.1.3)
[SOURCE:ISO 21636-1:—, 3.2.1]
3.2.2
external criterion for linguistic variation
set of properties of idiolects (3.1.2) that are based on factors external to the linguistic features of the idiolects’ systems
Note 1 to entry: External criteria for linguistic variation contain properties of idiolects that pertain to the speakers (3.1.5) who use the idiolects, or to the language use event (ISO 21636-1:—, 3.1.6) in which the idiolects are used.
EXAMPLE:
“Being characteristic of speakers from East Anglia” is a property which is the only element of an external criterion for linguistic variation [in this case, a criterion related to geographical space (see the example to ISO 21636-1:—, 3.2.4), defining a certain dialect (3.2.5) of English].
[SOURCE:ISO 21636-1:—, 3.2.2]
3.2.3
structural criterion for linguistic variation
set of properties of idiolects (3.1.2) that are based on the linguistic features of the idiolects’ systems
Note 1 to entry: This set of properties includes in particular phonetic, phonological, morphological, syntactic, lexical, semantic or pragmatic properties.
Note 2 to entry: Elements of the structural criterion for linguistic variation are also called “markers”, e.g. in ISO/TR 20694. The term “structural criterion for linguistic variation” is preferred because it integrates better with the framework for linguistic variation (3.2.1) developed in the ISO 21636 series.
[SOURCE:ISO 21636-1:—, 3.2.3]
3.2.4
language variety
variety
<language coding> largest subset of an individual language (3.1.3) that is internally consistent with regard to both an external criterion for linguistic variation (3.2.2) and a structural criterion for linguistic variation (3.2.3) , and that can be identified and named
Note 1 to entry: Since terms such as “linguistic variation” (3.2.1), “language variation”, “linguistic variant”, “language variant” or “linguistic variety” are also used to represent other concepts, only the term “language variety” is used in this document.
[SOURCE:ISO 21636-1:—, 3.2.5]
3.2.5
dialect
<linguistics> language variety (3.2.4) specific to speakers (3.1.5) from a particular geographical location or region
[SOURCE:ISO 21636-1:—, 3.4.1, modified — Note 1 to entry deleted.]
3.2.6
standard variety
language variety (3.2.4) recognized as standard or official by most speakers (3.1.5) across the geographical area where the individual language (3.1.3) is spoken or used, or across a large part of that geographical area where several dialects (3.2.5) are used
Note 1 to entry: A standard variety of an individual language is typically used in official or public communication and in communication between users of different language varieties.
Note 2 to entry: A standard variety is often characterized by a high degree of standardization or normalization.
[SOURCE:ISO 21636-1:—, 3.4.2, modified — Note 1 to entry deleted.]
3.3 Terms related to types of individual languages subject to language coding
3.3.1
natural language
individual language (3.1.3) which is or was in active use in a language community (3.1.6) , passed on from one generation of speakers (3.1.5) to the next
EXAMPLE:
Bambara, English, Haitian Creole, Latin, LIBRAS (Língua Brasileira de Sinais/Brazilian Sign Language).
[SOURCE:ISO 21636-1:—, 3.1.9]
3.3.2
constructed language
individual language (3.1.3) whose rules are explicitly established prior to its use
EXAMPLE:
Esperanto, Volapük, Quenya, Na’vi.
Note 1 to entry: Constructed languages do not include reconstructed languages (3.3.9) , computer programming languages, mark-up languages or similar formal languages.
Note 2 to entry: Some constructed languages are based on one or several natural languages (3.3.1) and are therefore not artificial. Therefore, the term “artificial language”, which is often used as a synonym, is not used in this document.
[SOURCE:ISO 21636-1:—, 3.1.10]
3.3.3
living language
individual language (3.1.3) used by a language community (3.1.6) at the present time
EXAMPLE:
English, Bambara.
Note 1 to entry: Living languages include previously extinct languages (3.3.4) that have been revitalized, such as Hebrew or Manx.
3.3.4
extinct language
individual language (3.1.3) that is no longer in use and that has lost its last native speaker (3.1.5) in recent centuries
EXAMPLE:
Old Prussian, Amanayé, Basay.
3.3.5
historical language
individual language (3.1.3) that went out of use before modern times
EXAMPLE:
Old English, Middle English, Ancient Greek, Etruscan.
Note 1 to entry: Historical languages include known earlier epochs of a living language (3.3.3) or of an extinct language (3.3.4) .
3.3.6
full language
individual language (3.1.3) that is used in a variety of domains, used to support communication across most or all social groups, such as genders and age groups of a language community (3.1.6) , and stable enough to have at least one language variety (3.2.4) that is widely understood across the whole geographical area of the individual language
Note 1 to entry: Full languages are subject to gradual change as each new generation makes their individual language its own.
3.3.7
restricted language
language variety (3.2.4) of an individual language (3.1.3) or constructed language (3.3.2) that resembles in some contexts an individual language, but that is not a full language (3.3.6) in that it is used in limited circumstances
Note 1 to entry: Restricted languages are, for instance, avoidance languages, secret languages, ceremonial languages, play languages, urban languages or youth languages.
3.3.8
macrolanguage
individual language (3.1.3) that for the purpose of language coding can be subdivided into two or more other individual languages
EXAMPLE:
In some contexts, Chinese is declared as the individual language of documents written in Han ideographic script (3.6.2) , while the language of the document can be Mandarin, Yue, Wu or any other related individual language of China.
Note 1 to entry: In contrast to language groups (3.4.1) , the individual languages that correspond to a macrolanguage shall be very closely related, and there shall be some context in which they are deemed recognizable as separate individual languages.
Note 2 to entry: Language development can change the relationship between a macrolanguage and related individual languages or dialects (3.2.5) over time.
3.3.9
reconstructed language
hypothetical individual language (3.1.3) that is not itself attested but postulated based on regular correspondences among a group of attested languages, of which the hypothetical language is held to be a common ancestral language
EXAMPLE:
Proto-Indo-European, Proto-Germanic.
3.4 Terms related to language groups subject to language coding
3.4.1
language group
set of individual languages (3.1.3) based on a shared characteristic
EXAMPLE:
“Caucasian languages” (geographical group of languages); “North Caucasian languages” [ language family (3.4.2) ].
Note 1 to entry: Shared characteristics include, but are not limited to, being spoken in the same geographical region, being genetically related [i.e. being (a branch of) a language family] or sharing typological characteristics such as being a tonal language or being a morphologically isolating language, or combinations thereof.
Note 2 to entry: A language group can encompass several smaller language groups.
Note 3 to entry: An identified language group is a group of individual languages that does not correspond to a macrolanguage (3.3.8) . It can contain macrolanguages among its members.
3.4.2
language family
language group (3.4.1) encompassing individual languages (3.1.3) based on a common ancestral language
EXAMPLE:
North Caucasian languages.
Note 1 to entry: It is possible for a language family to consist of a single individual language as a member.
3.5 Terms related to modalities of language use
3.5.1
language modality
language variety (3.2.4) specific to a certain medium or channel used for communication by the speaker (3.1.5)
Note 1 to entry: As specified in ISO 21636-1, language modalities encompass the spoken modality (3.5.2) , the written modality (3.5.3) , the signed modality (3.5.4) , the drummed modality, the whistled modality, etc. This document refers only to the spoken modality, the written modality and the signed modality.
[SOURCE:ISO 21636-1:—, 3.4.7, modified — Notes 1 to 3 to entry replaced by a new Note 1 to entry.]
3.5.2
spoken modality
spoken language modality
language modality (3.5.1) used in oral communication, and that has as its primary mode of expression the articulated sounds of the speaker’s (3.1.5) voice
Note 1 to entry: Events of language use in the spoken modality are usually also multimodal, as gestures, facial expressions and other similar phenomena almost always accompany speech.
[SOURCE:ISO 21636-1:—, 3.5.1, modified — Notes 1 to 3 to entry replaced by a new Note 1 to entry.]
3.5.3
written modality
written language modality
language modality (3.5.1) that makes use of a system of graphic symbols
Note 1 to entry: Some constructed languages (3.3.2) have the written modality as their basic modality (3.5.5) , but in natural languages (3.3.1) , the spoken modality (3.5.2) or signed modality (3.5.4) are basic modalities from which the written modality is derived.
[SOURCE:ISO 21636-1:—, 3.5.3, modified — Note 2 to entry deleted.]
3.5.4
signed modality
signed language modality
visual-spatial language modality (3.5.1) that uses a combination of hand shapes, palm orientation and movement of the hand, arm, mouth, head or body, and facial expression
Note 1 to entry: The language modality “signed modality” differs from “individual sign language” (3.1.4) , which designates those individual languages (3.1.3) whose basic modality (3.5.5) is the signed modality.
Note 2 to entry: The signed modality is the basic modality for individual sign languages, but some other individual languages also have a signed modality.
EXAMPLE:
Signing Exact English, the signed modality for expressing (spoken or written) English.
[SOURCE:ISO 21636-1:—, 3.5.4, modified — Last part of Note 1 to entry deleted.]
3.5.5
basic modality
basic language modality
language modality (3.5.1) in which a particular individual language (3.1.3) is most commonly used, in which it develops, and from which other language modalities (if any) of that individual language are derived
Note 1 to entry: For most natural languages (3.3.1) , the basic modality is the spoken modality (3.5.2) ; in particular, the written modality (3.5.3) is derived from the spoken modality in the sense that in these natural languages writing is a representation of properties of oral language use [even in the case of non-alphabetic writing systems (3.6.1) ].
Note 2 to entry: For individual sign languages (3.1.4) , the basic modality is the signed modality (3.5.4) . If these are written or otherwise graphically represented, the written modality is derived from the signed modality in the sense that writing is a representation of properties of visual-spatial language use (i.e. of the signed modality).
[SOURCE:ISO 21636-1:—, 3.5.11, modified — Note 1 to entry shortened and Note 3 to entry deleted.]
3.6 Terms related to written representation of individual languages
3.6.1
writing system
system for writing an individual language (3.1.3) , including the script (3.6.2) and orthographic conventions used
3.6.2
script
<language coding> comprehensive set of graphic characters used for the written form of one or more individual languages (3.1.3)
EXAMPLE:
Cyrillic, Hiragana.
Note 1 to entry: A script, as opposed to an arbitrary subset of characters, is defined in distinction to other scripts; in general, readers of one script can be unable to read the glyphs of another script easily, even where there is a historical relation between them.
3.6.3
script identifier
script symbol
<language coding> string of characters assigned to represent a script (3.6.2) unequivocally
3.7 Terms related to language coding and naming languages
3.7.1
code
collection of rules that maps the elements of a first set of values onto the elements of one or more different sets
Note 1 to entry: The first set of elements in the ISO 639 language code refers to individual languages (3.1.3) or language groups (3.4.1) . The sets of elements mapped onto are code values, specifically language identifiers (3.7.10) .
[SOURCE:ISO/IEC 2382:2015, 2121552, modified — Admitted term “coding scheme” deleted. “first set of values onto the elements of one or more different sets” replaced “first set onto the elements of a second set” in the definition. Notes 1 to 2 to entry replaced by a new Note 1 to entry. Notes 3 to 5 to entry deleted.]
3.7.2
code element
collection of structured information about an entity represented in a code (3.7.1)
3.7.3
language code
code (3.7.1) that maps individual languages (3.1.3) or language groups (3.4.1) , represented by their unique language reference name (3.7.13) , to language identifiers (3.7.10)
EXAMPLE:
The ISO 639 language code.
Note 1 to entry: The activity and subject of developing a language code is called “language coding”.
3.7.4
language code element
code element (3.7.2) of a language code (3.7.3) that represents an individual language (3.1.3) or a language group (3.4.1)
EXAMPLE:
“Efik” [ language reference name (3.7.13) ], “Efik” [ language name (3.7.12) in English], “efik” (language name in French), “efi” [ language identifier (3.7.10) ] and the information on the code element scope (3.7.5) “individual language” together constitute a language code element.
Note 1 to entry: A language code element is composed of a minimum of one unique language reference name and one or more language identifiers that belong to one or more sets.
Note 2 to entry: Language code elements cited in this document each represent an individual language or language group. In addition to the language code elements, the ISO 639 language code also contains four special-purpose code elements (3.7.9) .
3.7.5
code element scope
attribute of a code element (3.7.2) that documents the way in which its denotation maps onto one or more individual languages (3.1.3)
Note 1 to entry: There are four code element scopes: individual-language code element (3.7.6) , macrolanguage code element (3.7.7) , language-group code element (3.7.8) and special-purpose code element (3.7.9) .
3.7.6
individual-language code element
language code element (3.7.4) with a value of a code element scope (3.7.5) for an individual language (3.1.3)
Note 1 to entry: The individual language represented by an individual-language code element is considered distinct from any other individual language represented by a different individual-language code element.
Note 2 to entry: An individual-language code element represents an individual language that is not a macrolanguage (3.3.8) .
3.7.7
macrolanguage code element
language code element (3.7.4) with the value of a code element scope (3.7.5) for a macrolanguage (3.3.8)
Note 1 to entry: A macrolanguage code element represents an individual language (3.1.3) that is a macrolanguage.
3.7.8
language-group code element
language code element (3.7.4) with the value of a code element scope (3.7.5) for a language group (3.4.1)
Note 1 to entry: A language-group code element represents a group of individual languages (3.1.3) that does not correspond to a macrolanguage (3.3.8) .
3.7.9
special-purpose code element
language code element (3.7.4) of a language code (3.7.3) with the value of a code element scope (3.7.5) for a special purpose
EXAMPLE:
mul – multiple languages in the content.
Note 1 to entry: A special-purpose code element does not refer to any individual language (3.1.3) or language group (3.4.1) identified in the ISO 639 language code but is useful for data management purposes.
3.7.10
language identifier
language symbol
string of characters assigned to an individual language (3.1.3) or a language group (3.4.1) for the purpose of identifying it unequivocally
Note 1 to entry: In the ISO 639 language code, the string of characters consists of a string of letters.
Note 2 to entry: When a single language code element (3.7.4) has multiple language identifiers, the language identifiers are synonymous, while each of them identifies the individual language or language group unequivocally.
EXAMPLE:
The individual language “Dutch” is assigned the two-letter language identifier “nl”, a three-letter identifier “nld” for use in the field of terminology and other language applications, and another three-letter identifier “dut” for use in the field of librarianship and documentation. The individual language “Polish” is assigned the two-letter language identifier “pl” and the three-letter identifier “pol”. The language group “Khoisan languages” is assigned the three-letter language identifier “khi”.
3.7.11
local-use language identifier
language identifier (3.7.10) reserved for local use
EXAMPLE:
“qij” (designating “Akeu”) temporarily used locally in place of a permanent language identifier.
Note 1 to entry: Local-use language identifiers are not part of any assigned language code element (3.7.4) .
Note 2 to entry: All local-use language identifiers are composed of three letters.
3.7.12
language name
linguistic expression for naming an individual language (3.1.3) or a language group (3.4.1)
EXAMPLE:
“anglais” (individual language “English” in French language), “Caucasian languages” (language group).
Note 1 to entry: The activity and subject of assigning language names is called “naming languages”.
Note 2 to entry: Often an individual language or language group can be represented by more than one language name or variant of a language name in a given language.
3.7.13
language reference name
language name (3.7.12) for the purpose of designating an individual language (3.1.3) or language group (3.4.1) uniquely within a language code (3.7.3)
Note 1 to entry: When the common language names of two identified different individual languages or language groups are the same, disambiguating or differentiating information is added to construct a unique language reference name for each.
EXAMPLE:
The language reference name “French” without disambiguating or differentiating information, the language reference names “Mor (Mor Islands)” and “Mor (Bomberai Peninsula)” with disambiguating or differentiating information.
Bibliography
| 1 | ISO 1087:2019, Terminology work and terminology science — Vocabulary |
| 2 | ISO 3166-2, Codes for the representation of names of countries and their subdivisions — Part 2: Country subdivision code |
| 3 | ISO 3166-3, Codes for the representation of names of countries and their subdivisions — Part 3: Code for formerly used names of countries |
| 4 | ISO 5127:2017, Information and documentation — Foundation and vocabulary |
| 5 | ISO 10241-2, Terminological entries in standards — Part 2: Adoption of standardized terminological entries |
| 6 | ISO/TR 20694, A typology of language registers |
| 7 | ISO 21636-1:—, 3Language coding — A framework for language varieties — Part 1: Vocabulary |
| 8 | ISO/TR 21636-2, Language coding — A framework for language varieties — Part 2: Description of the framework |
| 9 | ISO 21636-3, 4Language coding — A framework for language varieties — Part 3: Application of the framework |
| 10 | ISO/IEC 2382:2015, Information technology — Vocabulary |
| 11 | ISO/IEC 10646, Information technology — Universal coded character set (UCS) |
| 12 | IETF BCP 47, Tags for identifying languages. Available at: https://www.rfc-editor.org/info/bcp47 |
| 13 | IETF RFC 6497, BCP 47 Extension T — Transformed content. Available at: https://www.rfc-editor.org/info/rfc6497 |
| 14 | Unicode CLDR, Common Locale Data Repository. Available at: http://cldr.unicode.org/ |