ISO 639:2023 個々の言語および言語グループのコード | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

導入

この文書は、個々の言語または言語グループの識別と仕様、およびそのコーディングに関する包括的な原則、規則、ガイドラインを提供します。 ISO 639 言語コードは、それぞれ 1 ~ 3 つの言語識別子、1 つの一意の言語参照名、英語とフランス語の 0 個以上の言語名、およびコード要素スコープで構成される言語コード要素で構成されます。各言語識別子は、認識された個別の言語または言語グループを指定します。

歴史的な理由により、言語識別子はいくつかのセットに編成されてきました。これらのセットは、以前の ISO 639 シリーズのコード テーブルに対応しています (すべて「個別の言語および言語グループを表現するためのコード」という一般的なタイトルの下にあります)この文書では、これらのセットを、それぞれ 1 ~ 3 つの言語識別子を持つ言語コード要素の統一システムにマージします。一部の言語識別子は、次のセットの複数に属します (詳細については、5.2 を参照)

  • セット 1 は、主要な、ほとんどが各国の個別言語の 2 文字の言語識別子 (以前の ISO 639-1 に準拠) で構成されます。このセットは、1967 年に発行された規範文書から発展したものです。
  • セット 2 は、広く知られている多数の個別言語の 3 文字の言語識別子 (以前の ISO 639-2 に準拠) で構成されています。セット 2 には、セット 1 でカバーされるすべての個別言語が含まれており、それぞれが 2 つの異なる 3 文字の言語識別子 (書誌用途 (2B) 用と用語用途 (2T) 用) を持つ個別言語の 20 個の言語コード要素を含みます。後者の区別は、1970 年代以来広く使用されている文書に基づいています。これは、一方では図書館とドキュメンテーションの分野、もう一方では用語やその他の言語アプリケーションの分野における 2 つの異なる言語コーディングの取り組みから生まれました。
  • セット 3 も 3 文字の言語識別子 (旧 ISO 639-3 に準拠) で構成され、すべての個別言語 (セット 2 でカバーされるすべての個別言語を含む) を包括的にカバーすることを目的としています。
  • セット 5 も 3 文字の言語識別子 (以前の ISO 639-5 に準拠) で構成され、より大きな言語グループのセット (セット 2 でカバーされるすべての言語グループを含む) をカバーします。セット 5 は 2008 年に確立されました。セット 2 の言語グループのすべての言語識別子もセット 5 に属します。

ISO 639 言語コードのこれら 4 つの言語識別子のセットは、非常に大規模なユーザー コミュニティによって使用されており、高度に調整されたコードの安定性が求められます。数十年にわたり、ISO 639 言語コードの開発に関与する関係者は活動を調整し、その結果、現在有効な言語コード要素が 1 つの共通コード空間を構成するようになりました。これは、言語識別子がどのセットに属しているかに関係なく、すべての言語コード要素が ISO 639 言語コードを構成することを意味します。したがって、このドキュメントのタイトルには「コード」が単数形で表示されます。

上記の言語識別子のセットは、ISO 639 言語コードのデータをホストする言語コーディング機関 (LCA) でアクセスできます (付録 B を参照)

個々の言語または言語グループの言語識別子は、さまざまなアプリケーションで使用できます。これらには、テキストで使用される言語の仕様、辞書または用語データベース内の用語の言語、口頭プレゼンテーションで使用される言語、言語熟練度の識別、ソフトウェアで人間の言語を処理する能力、文書化が含まれます。言語識別子のさまざまなセットは、IETF BCP 47 [ 12] 言語タグなどの規範文書を含む幅広いアプリケーションに実装されています。

Introduction

This document provides comprehensive principles, rules and guidelines for the identification and specification of individual languages or language groups, as well as for their coding. The ISO 639 language code comprises language code elements each consisting of one to three language identifiers, one unique language reference name, zero or more language names in English and French, and a code element scope. Each language identifier designates a recognized individual language or language group.

For historical reasons, the language identifiers have been organized into several sets. These sets correspond to the code tables of the former ISO 639 series (all under the general title Codes for the representation of individual languages and language groups). This document merges these sets into a unified system of language code elements with one to three language identifiers each. Some language identifiers belong to more than one of the following sets (for more details, see 5.2):

  • Set 1 comprises two-letter language identifiers (in accordance with the former ISO 639-1) for major, mostly national individual languages. This set has evolved from normative documents published in 1967.
  • Set 2 comprises three-letter language identifiers (in accordance with the former ISO 639-2) for a larger number of widely known individual languages. Set 2 includes all individual languages covered by Set 1 and encompasses 20 language code elements for individual languages that each have two different three-letter language identifiers: one for bibliographic use (2B) and one for terminological use (2T). The latter distinction is based on documents widely used since the 1970s. It has emerged from two diverging language coding initiatives in the fields of librarianship and documentation on the one hand and terminology and other language applications on the other.
  • Set 3 also comprises three-letter language identifiers (in accordance with the former ISO 639-3) and aims at covering comprehensively all individual languages (including all individual languages covered by Set 2).
  • Set 5 also comprises three-letter language identifiers (in accordance with the former ISO 639-5), covering a larger set of language groups (including all language groups covered by Set 2). Set 5 was established in 2008. All language identifiers for language groups in Set 2 also belong to Set 5.

These four sets of language identifiers of the ISO 639 language code are used by very large user communities, which demands a high degree of coordinated code stability. Over the decades the stakeholders involved in developing the ISO 639 language code have coordinated their activities with the result that the currently valid language code elements constitute one single common code space. This implies that all language code elements, independently of which set or sets their language identifiers belong to, constitute the ISO 639 language code. Therefore, “code” occurs in the singular in the title of this document.

The above-listed sets of language identifiers are accessible at the Language Coding Agencies (LCA) hosting the data for the ISO 639 language code (see Annex B).

The language identifiers for individual languages or language groups can be used in a variety of applications. These include the specification of the language used in a text, the language of terms or words in a dictionary or terminology database, the language used in a spoken presentation, the identification of language proficiency, the capability of handling human language in software, the documentation of language resources, etc. The various sets of language identifiers are implemented in a broad range of applications, including normative documents, such as those for IETF BCP 47[12] language tags.