ISO/IEC 14651:2020 情報技術—国際的な文字列の順序付けと比較—文字列を比較する方法と一般的なテンプレートの調整可能な順序付けの説明 | ページ 6

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。

3.1

文字列

単一のオブジェクトと見なされる一連の文字

注記 1:注記: 通常、順序付けされる文字列には、それを区切る文字が含まれません。たとえば、ソートされるテキスト ファイルの「行末」制御文字などです。

3.2

照合アイコン

照合要素(3.4) に割り当てられた重みを指定するために使用される 記号(3.12 )。

3.3

照合表

重み付けテーブル

照合要素 (3.4) to 加重要素 (3.14) へのマッピング

3.4

照合要素

順序付けのための単一のエンティティと見なされる 1 つまたは複数の文字のシーケンス (3.7)

3.5

デルタ

特定の 照合テーブル (3.3) と別の照合テーブルの違いのリスト

注記 1:与えられた照合テーブルは、与えられたデルタと共に、新しい照合テーブルを形成します。

注記 2:このドキュメントで特に指定されていない限り、「デルタ」という用語は、常に、このドキュメントで定義されている共通テンプレート テーブルとの違いを指します。

3.6

レベル

照合レベル

キーを形成する一連のサブキーの サブキー (3.11) のシーケンス番号。

3.7

注文

照合

与えられた 2 つの文字列について、最初の文字列が 2 番目の文字列より小さいか、等しいか、または大きいかを判断するプロセス

3.8

注文キー

順序を決定するために使用される一連の サブキー (3.11)

3.9

準備

照合準備

各文字列の 順序付けキー (3.8) を計算する前に、特定 の文字列 (3.1) を (他の) 文字列にマッピングするプロセス

3.10

参照比較方法

2 つの 順序付けキー (3.8) の間で順序を確立する方法。

注記 1:湖条項 6.

3.11

サブキー

文字列に対して計算された一連の重み (3.1)

3.12

シンボル

照合要素(3.4)

3.13

重さ

照合の重み

サブキーで使用される正の整数値 (3.11) 照合要素の相対的な順序を反映する (3.4)

3.14

加重要素

レベル順に並べられた指定された数の重みのリスト

参考文献

[1]ISO/IEC 2022, 情報技術 — 文字コードの構造と拡張技術
[2]ISO/IEC 646, 情報技術 — 情報交換用の ISO 7 ビット コード化文字セット
[3]ISO/IEC 6937, 情報技術 — テキスト通信用のコード化グラフィック文字セット — ラテン アルファベット
[4]ISO/IEC 8859-1, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 1: ラテンアルファベット no. 1
[5]ISO/IEC 8859-2, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 2: ラテンアルファベット no. 2
[6]ISO/IEC 8859-3, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 3: ラテンアルファベット no. 3
[7]ISO/IEC 8859-4, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 4: ラテンアルファベット no. 4
[8]ISO/IEC 8859-5, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 5: ラテン語/キリル文字
[9]ISO/IEC 8859-6, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 6: ラテン語/アラビア語のアルファベット
[10]ISO/IEC 8859-7, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 7: ラテン語/ギリシャ語のアルファベット
[11]ISO/IEC 8859-8, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 8: ラテン語/ヘブライ語のアルファベット
[12]ISO/IEC 8859-9, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 9: ラテンアルファベット no. 5
[13]ISO/IEC 8859-10, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 10: ラテンアルファベット no. 6
[14]ISO/IEC 8859-13, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 13: ラテンアルファベット no. 7
[15]ISO/IEC 8859-14, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 14: ラテンアルファベット no. 8 (セルティックス)
[16]ISO/IEC 8859-15, 情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット — 15: ラテンアルファベット no. 9
[17]ISO/IEC/IEEE 9945:2009, 情報技術 — ポータブル オペレーティング システム インターフェイス (POSIX®) 基本仕様、第 7 号
[18]ISO/IEC TR 30112:2014, 情報技術 — 文化的慣習の仕様方法
[19]CAN/CSA Z243.230-1998, 最小カナダ ソフトウェア ローカリゼーション規則。カナダ規格協会
[20]CAN/CSA Z243.4.1-1998 —カナダの英数字順序基準。カナダ規格協会
[21]DS 377:1980,アルファベットリングレギュレーター、Dansk Standard
[22]技術基準第 34 号、スウェーデン語の英数字の並べ替え、Statskontoret 1992 年
[23]LaBonté A., Règles du classement alphabétique en langue française et procédure informatisée pour le tri, Ministère des Services gouvernementaux du Québec , 1987-1998, http://numerique.banq.qc.ca/patrimoine/details/52327/40723?docref =erOPXaORyny2NGtmB8o73w&docsearchtext=r%C3%A8gles%20du%20classement
[24]L a B onté A. Technique de réduction — Tris informatiques à quatre clés, Ministère des Services gouvernementaux du Québec , https://numerique.banq.qc.ca/patrimoine/details/52327/40720
[25]Gavare R.、語彙論的観点からのアルファベット順。 Computer-Aided Lexicology の研究、1988 年、pp. 63-10
[26]Retskrivningsordbogen . Dansk Sprognævn & Aschehoug Dansk Forlag A/S, 第 2 版、1996 年
[27]ユニコードhバージョン 13.0, Unicode コンソーシアム http://www.unicode.org/versions/Unicode13.0.0/
[28]ユニコードテクニカルレポートNo. 10, Unicode照合アルゴリズム、Unicodeコンソーシアム、 https://unicode.org/reports/tr10/
[29]ユニコードテクニカルレポートNo. 15, Unicode 正規化フォーム、Unicode コンソーシアム、 https://www.unicode.org/reports/tr15/tr15-18.html
[30]Standard sur le tri alphabetique et la recherche de chaînes de caractères, SGQRI004, Gouvernement du Québec, https: //www.tresor.gouv.qc.ca/fileadmin/PDF/ressources_informationnelles/standards_relatifs_interoperabilite/SGQRI004.pdf

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

3.1

character string

sequence of characters considered as a single object

Note 1 to entry: Note to entry: A character string to be ordered does not normally include the characters that delimit it, as for example an “end of line” control character in a text file to be sorted.

3.2

collating symbol

symbol (3.12) used to specify weights assigned to a collating element (3.4)

3.3

collation table

weighting table

mapping from collating elements (3.4) to weighting elements (3.14)

3.4

collating element

sequence of one or more characters that are considered a single entity for ordering (3.7)

3.5

delta

list of the differences between a given collation table (3.3) and another one

Note 1 to entry: The given collation table, together with a given delta, forms a new collation table.

Note 2 to entry: Unless otherwise specified in this document, the term “delta” always refers to differences from the Common Template Table as defined in this document.

3.6

level

collation level

sequence number for a subkey (3.11) in the series of subkeys forming a key

3.7

ordering

collation

process by which, given two strings, it is determined whether the first one is less than, equal to, or greater than the second one

3.8

ordering key

sequence of subkeys (3.11) used to determine an order

3.9

preparation

collation preparation

process in which given character strings (3.1) are mapped to (other) character strings before the calculation of the ordering key (3.8) for each of the strings

3.10

reference comparison method

method for establishing an order between two ordering keys (3.8)

Note 1 to entry: See Clause 6.

3.11

subkey

sequence of weights computed for a character string (3.1)

3.12

symbol

collating element (3.4)

3.13

weight

collation weight

positive integer value, used in subkeys (3.11) , reflecting the relative order of collating elements (3.4)

3.14

weighting element

list of a given number of weights sequentially ordered by level

Bibliography

[1]ISO/IEC 2022, Information technology — Character code structure and extension techniques
[2]ISO/IEC 646, Information technology — ISO 7-bit coded character set for information interchange
[3]ISO/IEC 6937, Information technology — Coded graphic character set for text communication — Latin alphabet
[4]ISO/IEC 8859-1, Information technology — 8-bit single-byte coded graphic character sets — 1: Latin alphabet No. 1
[5]ISO/IEC 8859-2, Information technology — 8-bit single-byte coded graphic character sets — 2: Latin alphabet No. 2
[6]ISO/IEC 8859-3, Information technology — 8-bit single-byte coded graphic character sets — 3: Latin alphabet No. 3
[7]ISO/IEC 8859-4, Information technology — 8-bit single-byte coded graphic character sets — 4: Latin alphabet No. 4
[8]ISO/IEC 8859-5, Information technology — 8-bit single-byte coded graphic character sets — 5: Latin/Cyrillic alphabet
[9]ISO/IEC 8859-6, Information technology — 8-bit single-byte coded graphic character sets — 6: Latin/Arabic alphabet
[10]ISO/IEC 8859-7, Information technology — 8-bit single-byte coded graphic character sets — 7: Latin/Greek alphabet
[11]ISO/IEC 8859-8, Information technology — 8-bit single-byte coded graphic character sets — 8: Latin/Hebrew alphabet
[12]ISO/IEC 8859-9, Information technology — 8-bit single-byte coded graphic character sets — 9: Latin alphabet No. 5
[13]ISO/IEC 8859-10, Information technology — 8-bit single-byte coded graphic character sets — 10: Latin alphabet No. 6
[14]ISO/IEC 8859-13, Information technology — 8-bit single-byte coded graphic character sets — 13: Latin alphabet No. 7
[15]ISO/IEC 8859-14, Information technology — 8-bit single-byte coded graphic character sets — 14: Latin alphabet No. 8 (Celtic)
[16]ISO/IEC 8859-15, Information technology — 8-bit single-byte coded graphic character sets — 15: Latin alphabet No. 9
[17]ISO/IEC/IEEE 9945:2009, Information technology — Portable Operating System Interface (POSIX®) Base Specifications, Issue 7
[18]ISO/IEC/TR 30112:2014, Information technology — Specification methods for cultural conventions
[19]CAN/CSA Z243.230-1998, Minimum Canadian Software Localisation Conventions. Canadian Standards Association
[20]CAN/CSA Z243.4.1-1998 — Canadian Alphanumeric Ordering Standard. Canadian Standards Association
[21]DS 377:1980 Alfabetiseringsregler, Dansk Standard
[22]Teknisk norm Nr. 34, Swedish Alphanumeric Sorting, Statskontoret, 1992
[23]LaBonté A., Règles du classement alphabétique en langue française et procédure informatisée pour le tri, Ministère des Services gouvernementaux du Québec, 1987-1998, http://numerique.banq.qc.ca/patrimoine/details/52327/40723?docref=erOPXaORyny2NGtmB8o73w&docsearchtext=r%C3%A8gles%20du%20classement
[24]LaBonté A. Technique de réduction — Tris informatiques à quatre clés, Ministère des Services gouvernementaux du Québec, https://numerique.banq.qc.ca/patrimoine/details/52327/40720
[25]Gavare R., Alphabetic ordering in a lexicological perspective. Studies in Computer-Aided Lexicology, 1988, pp. 63–102.
[26]Retskrivningsordbogen. Dansk Sprognævn & Aschehoug Dansk Forlag A/S, Second Edition, 1996
[27]The Unicode Standard. Version 13.0, The Unicode Consortium, http://www.unicode.org/versions/Unicode13.0.0/
[28]Unicode Technical Report No. 10, Unicode Collation Algorithm, The Unicode Consortium, https://unicode.org/reports/tr10/
[29]Unicode Technical Report No. 15, Unicode Normalization Forms, The Unicode Consortium, https://www.unicode.org/reports/tr15/tr15-18.html
[30]Standard sur le tri alphabétique et la recherche de chaînes de caractères, SGQRI004, Gouvernement du Québec, https://www.tresor.gouv.qc.ca/fileadmin/PDF/ressources_informationnelles/standards_relatifs_interoperabilite/SGQRI004.pdf