この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語と定義
用語の概念の定義については、ISO 1087, ISO 1087-1, および ISO 1087-2 を参照してください。
この国際規格の目的のために、次の用語と定義が適用されます。
3.1
キャラクター
データの編成、制御、または表現に使用される一連の要素のメンバー
3.2
手紙
自然言語を書くために使用される文字で、言語の音を表すことが多い
3.3
デジタル
数値の数値またはその一部を表すために使用される文字
3.4
特殊文字
文字でも数字でもない文字
例:
スペース文字は特殊文字です。
3.5
結紮
2つ以上の文字を結合した文字
注記1結果として得られる文字は、場合によっては別の文字とみなされる。
3.6
ポリグラフ
何らかの目的で 1 文字と見なされる連続する 2 文字以上の文字
注記2 文字または 3 文字からなるポリグラフは、それぞれ digraph または trigraph と呼ばれることがあります。
3.7
分音記号
文字ではなく、文字または文字の組み合わせの上、下、または上に配置される文字
3.8
注文
文字列比較仕様に従って、文字列を明確に定義されたシーケンスにする行為
参考文献
| [1] | ISO 9:1995, 情報および文書 — キリル文字のラテン文字への翻字 — スラブ語および非スラブ語。 |
| [2] | ISO 233:1984, ドキュメンテーション — アラビア文字のラテン文字への音訳。 |
| [3] | ISO 233-2:1993, 情報および文書 — アラビア文字のラテン文字への翻字 — Part 2: アラビア語 — 簡略化された音訳。 |
| [4] | ISO 233-3:1999, 情報および文書 — アラビア文字のラテン文字への翻字 — Part 3: ペルシャ語 — 簡略化された音訳。 |
| [5] | ISO 259:1984, ドキュメンテーション — ヘブライ文字のラテン文字への音訳。 |
| [6] | ISO 259-2:1994, 情報および文書 — ラテン文字へのヘブライ語文字の翻字 — Part 2: 簡略化された音訳。 |
| [7] | ISO 259-3:- 3) 、情報および文書 — ヘブライ文字のラテン文字への音訳 — Part 3: 音素変換。 |
| [8] | ISO 639:1988, 言語名の表現のためのコード。 |
| [9] | ISO 639-2:1998, 言語名の表現のためのコード - Part 2: Alpha-3 コード。 |
| [10] | ISO 843:1997, 情報および文書 — ギリシャ文字からラテン文字への変換。 |
| [11] | ISO 999:1996, 情報と文書 — 索引の内容、構成、および表示に関するガイドライン。 |
| [12] | ISO/IEC 2022:1994, 情報技術 — 文字コードの構造と拡張技術。 |
| [13] | ISO 5426:1983, 書誌情報交換のためのラテン アルファベット コード化文字セットの拡張。 |
| [14] | ISO 5426-2:1996, 情報および文書 — 書誌情報交換のためのラテン アルファベット コード化文字セットの拡張 — Part 2: ヨーロッパのマイナーな言語で使用されるラテン文字および廃止されたタイポグラフィ。 |
| [15] | ISO 5427:1984, 書誌情報交換のためのキリル文字コード化文字セットの拡張。 |
| [16] | ISO 5428:1984, 書誌情報交換用のギリシャ文字コード化文字セット。 |
| [17] | ISO/IEC 6429:1992, 情報技術 — コード化文字セットの制御機能。 |
| [18] | ISO 6438:1983, ドキュメンテーション — 書誌情報交換のためのアフリカのコード化文字セット。 |
| [19] | ISO/IEC 6937:1994, 情報技術 - テキスト通信用のコード化グラフィック文字セット - ラテン アルファベット。 |
| [20] | ISO 7098:1991, 情報および文書 — 中国語のローマ字化。 |
| [21] | ISO/IEC 8859-1:1998, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 1: ラテン アルファベット no. 1. |
| [22] | ISO/IEC 8859-2:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 2: ラテン アルファベット no. 2. |
| [23] | ISO/IEC 8859-3:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 3: ラテン アルファベット no. 3. |
| [24] | ISO/IEC 8859-4:1998, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 4: ラテン アルファベット no. 4. |
| [25] | ISO/IEC 8859-5:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット - Part 5: ラテン語/キリル文字。 |
| [26] | ISO/IEC 8859-6:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット - Part 6: ラテン語/アラビア語のアルファベット。 |
| [27] | ISO 8859-7:1987, 情報処理 - 8 ビットのシングルバイト コード化グラフィック文字セット - Part 7: ラテン語/ギリシャ語のアルファベット。 |
| [28] | ISO/IEC 8859-8:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 8: ラテン語/ヘブライ語のアルファベット。 |
| [29] | ISO/IEC 8859-9:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 9: ラテン アルファベット no. 5. |
| [30] | ISO/IEC 8859-10:1998, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 10: ラテン アルファベット no. 6. |
| [31] | ISO/IEC 8859-11:- 4) 、情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 11: ラテン語/タイ語文字セット。 |
| [32] | ISO/IEC 8859-13:1998, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 13: ラテン アルファベット no. |
| [33] | ISO/IEC 8859-14:1998, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 14: ラテン アルファベット no. 8 (セルティックス). |
| [34] | ISO/IEC 8859-15:1999, 情報技術 - 8 ビットのシングルバイト コード化グラフィック文字セット — Part 15: ラテン アルファベット no. 9. |
| [35] | ISO 8879:1986, 情報処理 - テキストおよびオフィス システム - 標準一般化マークアップ言語 (SGML) |
| [36] | ISO/IEC 10367:1991, 情報技術 — 8 ビット コードで使用するための標準化されたコード化グラフィック文字セット。 |
| [37] | BS 1749:1985,アルファベット順の配置および数字と記号の提出順序に関する勧告。 【英国規格】 |
| [38] | DIN 5007:1991, アルファベット順の規則 (ABC 規則) 【ドイツ規格】 |
| [39] | DIN 5007-2:1996, 文字シーケンスの順序 - Part 2: 名前のアルファベット順の規則 (アルファベット順の規則 - Part 2: 名前の表示) 【ドイツ規格】 |
| [40] | DS 377:1980, Alfabetiseringsregler (アルファベット順) 【ダンスクスタンダード】 |
| [41] | NS 4103:1972,アルファベット順。 【ノルスクスタンダード】 |
| [42] | ON A 2725:1973, アルファベット順の規則 (ABC 規則) 【オーストリア規格】 |
| [43] | SFS 4600:1986, Aakkostaminen ja siihen liityvä ryhmittely (文字と数字の順序) 【スオマライネン・スタンダード】 |
| [44] | TN 34, スウェーデン語の英数字ソート。 [Statskontoret, 技術基準] |
| [45] | Gavare 、 Rolf 、語彙論的観点からのアルファベット順 — 辞書および百科事典資料の厳密なアルファベット順化のための計算モデル。ページ 63-102 in Studies in Computer-Aided Lexicology, ストックホルム、Almqvist & Wiksell International, 1988 年。 |
3 Terms and definitions
For definitions of terminological concepts, see ISO 1087, ISO 1087-1 and ISO 1087-2.
For the purpose of this International Standard, the following terms and definitions apply.
3.1
character
member of a set of elements used for the organization, control or representation of data
3.2
letter
character used for writing natural language, often representing a sound in the language
3.3
digit
character used to represent the numeric value, or part thereof, of a number
3.4
special character
character that is not a letter nor a digit
EXAMPLE:
The space character is a special character.
3.5
ligature
character resulting from the joining of two or more letters
Note 1 to entry: The resulting character is, in some cases, considered a separate letter.
3.6
polygraph
two or more consecutive letters that are regarded as one letter for some purpose
Note 1 to entry: A polygraph consisting of two or three letters may be referred to as a digraph or a trigraph respectively.
3.7
diacritical mark
character that is not a letter and is placed over, under, or through a letter or a combination of letters
3.8
ordering
act of bringing strings of characters into a well-defined sequence according to a string comparison specification
Bibliography
| [1] | ISO 9:1995, Information and documentation — Transliteration of Cyrillic characters into Latin characters — Slavic and non-Slavic languages. |
| [2] | ISO 233:1984, Documentation — Transliteration of Arabic characters into Latin characters. |
| [3] | ISO 233-2:1993, Information and documentation — Transliteration of Arabic characters into Latin characters — Part 2: Arabic language — Simplified transliteration. |
| [4] | ISO 233-3:1999, Information and documentation — Transliteration of Arabic characters into Latin characters — Part 3: Persian language — Simplified transliteration. |
| [5] | ISO 259:1984, Documentation — Transliteration of Hebrew characters into Latin characters. |
| [6] | ISO 259-2:1994, Information and documentation — Transliteration of Hebrew characters into Latin characters — Part 2: Simplified transliteration. |
| [7] | ISO 259-3:-3), Information and documentation — Transliteration of Hebrew characters into Latin characters — Part 3: Phonemic conversion. |
| [8] | ISO 639:1988, Code for the representation of names of languages. |
| [9] | ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code. |
| [10] | ISO 843:1997, Information and documentation — Conversion of Greek characters into Latin characters. |
| [11] | ISO 999:1996, Information and documentation — Guidelines for the content, organization and presentation of indexes. |
| [12] | ISO/IEC 2022:1994, Information technology — Character code structure and extension techniques. |
| [13] | ISO 5426:1983, Extension of the Latin alphabet coded character set for bibliographic information interchange. |
| [14] | ISO 5426-2:1996, Information and documentation — Extension of the Latin alphabet coded character set for bibliographic information interchange — Part 2: Latin characters used in minor European languages and obsolete typography. |
| [15] | ISO 5427:1984, Extension of the Cyrillic alphabet coded character set for bibliographic information interchange. |
| [16] | ISO 5428:1984, Greek alphabet coded character set for bibliographic information interchange. |
| [17] | ISO/IEC 6429:1992, Information technology — Control functions for coded character sets. |
| [18] | ISO 6438:1983, Documentation — African coded character set for bibliographic information interchange. |
| [19] | ISO/IEC 6937:1994, Information technology — Coded graphic character sets for text communication — Latin alphabet. |
| [20] | ISO 7098:1991, Information and documentation — Romanization of Chinese. |
| [21] | ISO/IEC 8859-1:1998, Information technology - 8-bit single-byte coded graphic character sets — Part 1: Latin alphabet No. 1. |
| [22] | ISO/IEC 8859-2:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 2: Latin alphabet No. 2. |
| [23] | ISO/IEC 8859-3:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 3: Latin alphabet No. 3. |
| [24] | ISO/IEC 8859-4:1998, Information technology - 8-bit single-byte coded graphic character sets — Part 4: Latin alphabet No. 4. |
| [25] | ISO/IEC 8859-5:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 5: Latin/Cyrillic alphabet. |
| [26] | ISO/IEC 8859-6:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 6: Latin/Arabic alphabet. |
| [27] | ISO 8859-7:1987, Information processing - 8-bit single-byte coded graphic character sets — Part 7: Latin/Greek alphabet. |
| [28] | ISO/IEC 8859-8:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 8: Latin/Hebrew alphabet. |
| [29] | ISO/IEC 8859-9:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 9: Latin alphabet No. 5. |
| [30] | ISO/IEC 8859-10:1998, Information technology - 8-bit single-byte coded graphic character sets — Part 10: Latin alphabet No. 6. |
| [31] | ISO/IEC 8859-11:- 4) , Information technology - 8-bit single-byte coded graphic character sets — Part 11: Latin/Thai character set. |
| [32] | ISO/IEC 8859-13:1998, Information technology - 8-bit single-byte coded graphic character sets — Part 13: Latin alphabet No. 7. |
| [33] | ISO/IEC 8859-14:1998, Information technology - 8-bit single-byte coded graphic character sets — Part 14: Latin alphabet No. 8 (Celtic). |
| [34] | ISO/IEC 8859-15:1999, Information technology - 8-bit single-byte coded graphic character sets — Part 15: Latin alphabet No. 9. |
| [35] | ISO 8879:1986, Information processing — Text and office systems — Standard Generalized Markup Language (SGML). |
| [36] | ISO/IEC 10367:1991, Information technology — Standardized coded graphic character sets for use in 8-bit codes. |
| [37] | BS 1749:1985, Recommendations for alphabetical arrangement and the filing order of numbers and symbols. [British Standard] |
| [38] | DIN 5007:1991, Ordnen von Schriftzeichenfolgen (ABC-Regeln) [Rules for alphabetical arrangement (ABC rules)]. [Deutsche Norm] |
| [39] | DIN 5007-2:1996, Ordnen von Schriftzeichenfolgen — Teil 2: Ansetzungsregeln für die alphabetische Ordnung von Namen (Rules for alphabetical ordering — Part 2: Presentation of names). [Deutsche Norm] |
| [40] | DS 377:1980, Alfabetiseringsregler (Alphabetical arrangements). [Dansk Standard] |
| [41] | NS 4103:1972, Alfabetiseringsregler (Alphabetical arrangement). [Norsk Standard] |
| [42] | ON A 2725:1973, Regeln für das Ordnen von Schriftzeichenfolgen (ABC-Regeln) [Rules for alphabetical arrangement (ABC rules)]. [Österreichische Norm] |
| [43] | SFS 4600:1986, Aakkostaminen ja siihen liityvä ryhmittely (Order of characters and numerals). [Suomalainen standardi] |
| [44] | TN 34, Swedish alphanumeric sorting. [Statskontoret, Teknisk Norm] |
| [45] | Gavare, Rolf, Alphabetical Ordering in a Lexicological Perspective — A computational model for exacting alphabetization of dictionary and encyclopedic material. Pages 63-102 in Studies in Computer-Aided Lexicology, Stockholm, Almqvist & Wiksell International, 1988. |