ISO 24229:2022 情報と文書 — 書き言葉変換システムのコード | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) は、各国の標準化団体 (ISO メンバー団体) の世界的な連合です。国際規格の作成作業は、通常、ISO 技術委員会を通じて行われます。技術委員会が設立された主題に関心のある各会員団体は、その委員会に代表される権利を有します。 ISOと連携して、政府および非政府の国際機関もこの作業に参加しています。 ISO は、電気技術の標準化に関するすべての問題について、国際電気標準会議 (IEC) と緊密に協力しています。

この文書の開発に使用された手順と、今後の維持のために意図された手順は、ISO/IEC 指令で説明されています。 1. 特に、さまざまなタイプの ISO 文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令の編集規則に従って作成されました。 2 ( www.iso.org/directives を参照)

このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO は、そのような特許権の一部または全部を特定する責任を負わないものとします。ドキュメントの開発中に特定された特許権の詳細は、序文および/または受信した特許宣言の ISO リストに記載されます ( www.iso.org/patents を参照)

このドキュメントで使用されている商号は、ユーザーの便宜のために提供された情報であり、保証を構成するものではありません。

規格の自発的な性質の説明、適合性評価に関連する ISO 固有の用語と表現の意味、および技術的貿易障壁 (TBT) における世界貿易機関 (WTO) の原則への ISO の準拠に関する情報については、以下を参照してください。 www.iso.org/iso/foreword.html .

この文書は、技術委員会 ISO/TC 46, 情報および文書によって作成されました。

序章

多くの国際出願では、用語、辞書編集、文献目録、および言語学、特に逆音訳、計算言語学、および機械発音を含む、書面による言語変換システムの識別が必要です。

この文書は、書き言葉変換システムのレジストリを維持するために必要な手続きを定めています。

選択された「書き言葉の変換」という用語は、すべてのタイプの変換、つまり、あるスペリング システムから別のスペル システムへの書き言葉の変換を指すことを意図しています。したがって、スクリプト変換 (スクリプトの変更: 音訳、転写) と、スクリプトを変更しないテキストの変換 (たとえば、ターゲット言語のアルファベットを使用した外国の名前または単語の転写、言語の正書法の変更など) の両方が含まれます。 .表現を簡潔にするために、このドキュメントでは「表記言語変換」を「変換」と短縮して、あいまいさを生じないようにしています。

1 スコープ

このドキュメントは、書かれた言語変換システムを表現するためのコードを確立するための原則を提供します。

コードは、文字変換システムやローマ字変換システムなど、コード化された形式で書かれた言語変換システムの表現を必要とするあらゆるアプリケーションで使用できるように考案されています。

2 参考文献

以下のドキュメントは、その内容の一部またはすべてがこのドキュメントの要件を構成するように、本文で参照されています。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。

  • ISO 639-2, 言語名の表現のためのコード— 2: アルファ 3 コード
  • ISO 639-3, 言語名の表現のためのコード— 3: 言語を包括的にカバーする Alpha-3 コード
  • ISO 639-5, 言語名の表現のためのコード— 5: 言語ファミリーおよびグループの Alpha-3 コード
  • ISO 3166-1, 国とその下位区分の名前を表すためのコード — 1: 国コード
  • ISO 5127, 情報と文書 — 基礎と語彙
  • ISO 860, 日付と時刻 — 情報交換の表現
  • ISO 15924, 情報と文書 — スクリプト名の表現のためのコード

3 用語と定義

このドキュメントの目的のために、ISO 5127 および以下に記載されている用語と定義が適用されます。

ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。

3.1

脚本

1つまたは複数の言語を書くために使用される文字セットの特定のグラフィック表現または表現のクラス

[出典:ISO 5127:2017, 3.1.6.02]

3.2

スペル システム

言語の正書法を管理する一連の規則

注記 1:通常、綴りシステムは、言語の話し言葉が書面でどのように表現されるかを定義します。いくつかの言語では正書法の改革が行われています。つまり、異なるスペル システムが使用されています。

3.3

自然言語

人々のコミュニティで活発に使用されている、または使用されていた言語で、その規則は主に用法から推測されるもの

[出典:ISO 5127:2017, 3.1.5.02]

3.4

キャラクター

データの表現、編成、または制御に使用される一連の要素のメンバー

[出典:ISO 5127:2017, 3.1.4.02]

3.5

書かれてる言語

文字 (3.4) を書くことによって実現される 自然言語 (3.3 )

[出典:ISO 5127:2017, 3.1.5.04]

3.6

書き言葉の変換

ある 綴り体系 (3.2) を別の綴り体系に変換するプロセス

注記1:これは、スクリプト変換を含む一般的な用語ですが、たとえば、言語がスクリプトを変更せずに正書法を変更する場合なども含みます。

3.7

音訳

アルファベットまたは音節の書記体系の文字を変換アルファベットの文字で表すことからなるプロセス。

3.8

転記

特定の言語の音が変換言語の記号のシステムによって記録されるプロセス

3.9

ローマ字

音訳 (3.7) 、 転写 (3.8) 、またはその両方による、非ローマ字からローマ字 (3.1) へのスクリプト変換

[出典:ISO 5127:2017, 3.1.6.14]

3.10

書き言葉変換システム

書き言葉変換の一連の規則 (3.6)

3.11

言語コード

言語の名前を表すために使用される文字の組み合わせ

[出典:ISO 5127:2017, 3.2.5.14]

3.12

スクリプト コード

スクリプトの名前を表すために使用される文字の組み合わせ (3.1)

[出典:ISO 15924:2004, 3.8]

3.13

変換システム コード

書かれた言語変換システム (3.10) を表すために構造化された方法で使用される文字の組み合わせ。

参考文献

[1]ISO 9:1995, 情報および文書 — キリル文字のラテン文字への翻字 — スラブ語および非スラブ語
[2]ISO 233-3, 情報と文書 — アラビア文字のラテン文字への音訳 — 3: ペルシャ語 — 簡略化された音訳
[3]ISO 639-1, 言語名の表現のためのコード— 1: アルファ 2 コード
[4]ローマ字化システムに関するN UNGEGN作業部会。国連地名ローマ字化システムの現状に関する報告書、国連地名専門家グループ(UNGEGN):ローマ字化システムに関する作業部会、 https://www.eki.ee/wgrs/
[5]Unicode 音訳ガイドライン UN, Unicode 音訳ガイドライン、 https://cldr.unicode.org/index/cldr-spec/transliteration-guidelines
[6]中英辞典、中英辞典、改訂版。 2, ハーバート・A・ジャイルズ、1912年
[7]Romanization Tables ALA-LC, ALA-LC Romanization Tables: Transliteration Schemes for Non-Roman Scripts 、米国議会図書館、1997 年、 https://www.loc.gov/catdir/cpso/roman.html
[8]BGN/PCGNローマ字表記システム. BGN/PCGN Romanization Systems 、National Geospatial-Intelligence Agency, http: //geonames.nga.mil/gns/html/romanization.html
[9]地名の標準化に関する第 5回国連会議、地名の標準化に関する第 5 回国連会議、モントリオール、1987 年 8 月 18 日 — 1987 年 8 月 31 日。 Vol. I. 会議報告、pp. 40-41
[10]DIN 1460, スラブ言語のキリル文字の変換、1982-04

Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies (ISO member bodies). The work of preparing International Standards is normally carried out through ISO technical committees. Each member body interested in a subject for which a technical committee has been established has the right to be represented on that committee. International organizations, governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.

The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, 1. In particular, the different approval criteria needed for the different types of ISO documents should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, 2 (see www.iso.org/directives ).

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).

Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html .

This document was prepared by Technical Committee ISO/TC 46, Information and documentation.

Introduction

A number of international applications require the identification of written language conversion systems, including for terminology, lexicography, bibliography, and linguistics, especially for reverse transliteration, computational linguistics and machine pronunciation.

This document sets out the necessary procedures to maintain the registry of written language conversion systems.

The chosen term “written language conversion” is intended to refer to all types of conversions, i.e. transformations of written texts from one spelling system to another. It thus includes both script conversion (change of script: transliteration, transcription) and conversion of texts without changing the script (e.g. transcription of foreign names or words using the alphabet of a target language, change of the orthography in a language, etc.). For the sake of compactness of expression, “written language conversion” has been shortened to “conversion” in this document where it does not cause ambiguity.

1 Scope

This document provides principles for establishing codes for the representation of written language conversion systems.

The codes are devised for usage in any application requiring the expression of written language conversion systems, including transliteration and romanization systems, in coded form.

2 Normative references

The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.

  • ISO 639-2, Codes for the representation of names of languages — 2: Alpha-3 code
  • ISO 639-3, Codes for the representation of names of languages — 3: Alpha-3 code for comprehensive coverage of languages
  • ISO 639-5, Codes for the representation of names of languages — 5: Alpha-3 code for language families and groups
  • ISO 3166-1, Codes for the representation of names of countries and their subdivisions — 1: Country code
  • ISO 5127, Information and documentation — Foundation and vocabulary
  • ISO 8601 (all parts), Date and time — Representations for information interchange
  • ISO 15924, Information and documentation — Codes for the representation of names of scripts

3 Terms and definitions

For the purposes of this document, the terms and definitions given in ISO 5127 and the following apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

3.1

script

particular graphic representation or class of representations of a set of characters used to write one or more languages

[SOURCE:ISO 5127:2017, 3.1.6.02]

3.2

spelling system

set of rules governing the orthography of a language

Note 1 to entry: Typically, a spelling system defines how the spoken form of a language is represented in writing. Several languages have undergone orthographic reforms which means they have had different spelling systems.

3.3

natural language

language which is or was in active use in a community of people, and the rules of which are mainly deduced from the usage

[SOURCE:ISO 5127:2017, 3.1.5.02]

3.4

character

member of a set of elements that is used for the representation, organization, or control of data

[SOURCE:ISO 5127:2017, 3.1.4.02]

3.5

written language

natural language (3.3) realized through the writing of characters (3.4)

[SOURCE:ISO 5127:2017, 3.1.5.04]

3.6

written language conversion

process whereby one spelling system (3.2) is converted into another spelling system

Note 1 to entry: This is a general term that includes script conversion but also, e.g. cases when a language changes its orthography without changing the script.

3.7

transliteration

process which consists of representing the characters of an alphabetical or syllabic system of writing by the characters of a conversion alphabet

3.8

transcription

process whereby the sounds of a given language are noted by the system of signs of a conversion language

3.9

romanization

script conversion from non-Roman to Roman script (3.1) by means of transliteration (3.7) , transcription (3.8) or both

[SOURCE:ISO 5127:2017, 3.1.6.14]

3.10

written language conversion system

set of rules for written language conversion (3.6)

3.11

language code

combination of characters used to represent the name of a language or languages

[SOURCE:ISO 5127:2017, 3.2.5.14]

3.12

script code

combination of characters used to represent the name of a script (3.1)

[SOURCE:ISO 15924:2004, 3.8]

3.13

conversion system code

combination of characters used in a structured way to represent a written language conversion system (3.10)

Bibliography

[1]ISO 9:1995, Information and documentation — Transliteration of Cyrillic characters into Latin characters — Slavic and non-Slavic languages
[2]ISO 233-3, Information and documentation — Transliteration of Arabic characters into Latin characters — 3: Persian language — Simplified transliteration
[3]ISO 639-1, Codes for the representation of names of languages — 1: Alpha-2 code
[4]UN UNGEGN Working Group on Romanization Systems. Report on the Current Status of United Nations Romanization Systems for Geographical Names, United Nations Group of Experts on Geographical Names (UNGEGN): Working Group on Romanization Systems, https://www.eki.ee/wgrs/
[5]Unicode Transliteration Guidelines U.N., Unicode Transliteration Guidelines, https://cldr.unicode.org/index/cldr-spec/transliteration-guidelines
[6]A Chinese-English Dictionary, A Chinese-English Dictionary, Revised Ed. 2, Herbert A. Giles, 1912
[7]Romanization Tables A.L.A.-L.C., ALA-LC Romanization Tables: Transliteration Schemes for Non-Roman Scripts, The Library of Congress, 1997, https://www.loc.gov/catdir/cpso/roman.html
[8]BGN/PCGN Romanization Systems. BGN/PCGN Romanization Systems, National Geospatial-Intelligence Agency, http://geonames.nga.mil/gns/html/romanization.html
[9]Fifth United Nations Conference on the Standardization of Geographical Names, Fifth United Nations Conference on the Standardization of Geographical Names, Montreal, 1987-08-18 — 1987-08-31. Vol. I. Report of the Conference, pp. 40–41
[10]DIN 1460, Umschrift kyrillischer Alphabete slawischer Sprachen (Conversion of Cyrillic alphabets of Slavic languages), 1982-04