ISO/IEC 8859-2:1999 情報技術  —  8ビットのシングルバイトコード化グラフィック文字セット  —  パート2:ラテンアルファベットNo. 2 | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。

情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC1 を設立しました。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

国際規格 ISO/IEC 8859-2 は、合同技術委員会 ISO/IEC JTC 1, 情報技術、小委員会 SC 2, コード化文字セットによって作成されました。

この版は、技術的に改訂された ISO 8859-2:1987 を取り消して置き換えます。

ISO/IEC 8859 は、次の部分で構成されており、一般的なタイトルは「情報技術 — 8 ビットのシングルバイト コード化グラフィック文字セット」です。

  • Part 1: ラテン アルファベット no. 1
  • Part 2: ラテン アルファベット no. 2
  • Part 3: ラテン アルファベット no. 3
  • Part 4: ラテン アルファベット no. 4
  • Part 5: ラテン語/キリル文字
  • Part 6: ラテン語/アラビア語のアルファベット
  • Part 7: ラテン語/ギリシャ語のアルファベット
  • Part 8: ラテン語/ヘブライ語のアルファベット
  • Part 9: ラテン アルファベット no. 5
  • Part 10: ラテン アルファベット no. 6

ISO/IEC 8859 のこの部分の附属書 A から C は、情報提供のみを目的としています。

序章

ISO/IEC 8859 はいくつかの部分で構成されています。各部分は、最大 191 個のグラフィック文字のセットと、単一の 8 ビット バイトによるこれらの文字のコード化表現を指定します。各セットは、特定の言語グループで使用することを目的としています。

1 スコープ

ISO/IEC 8859 のこの部分では、ラテン アルファベット No. 2.

このコード化されたグラフィック文字のセットは、データおよびテキスト処理アプリケーションでの使用と、情報の交換を目的としています。

このセットには、一般的なオフィス環境で汎用アプリケーションに使用される、少なくとも次の言語のグラフィック文字が含まれています。

アルバニア語、クロアチア語、チェコ語、英語、ドイツ語、ハンガリー語、ラテン語、ポーランド語、ルーマニア語、スロバキア語、スロベニア語、ソルブ語。

このコード化されたグラフィック文字のセットは、ISO/IEC 2022 または ISO/IEC 4873 のレベル 1 に準拠した 8 ビット コードのバージョンと見なすことができます。

ISO/IEC 8859 のこの部分は、ISO/IEC 8859 の他の部分と組み合わせて使用​​することはできません。複数の部分からのコード化文字を一緒に使用する場合は、コード拡張技術を使用して、 ISO/IEC 10367 は、レベル 2 またはレベル 3 の ISO/IEC 4873 のバージョン内で代わりに使用する必要があります。

このセットのコード化文字は、ISO/IEC 6429 から選択されたコード化制御機能と組み合わせて使用​​できます。ただし、制御機能を使用して、2 つ以上のグラフィック文字から複合グラフィック シンボルを作成することはできません (6 節を参照)

注 — ISO/IEC 8859 は、ITU-T によって定義されたテレマティック サービスでの使用を意図していません。 ISO/IEC 8859 に従ってコード化された情報をそのようなサービスに転送する場合、アクセス ポイントでこれらのサービスの要件に準拠する必要があります。

3 参考文献

以下の規格には、このテキストでの参照を通じて、ISO/IEC 8859 のこの部分の規定を構成する規定が含まれています。発行の時点で、示されている版は有効でした。すべての規格は改訂される可能性があり、ISO/IEC 8859 のこの部分に基づく契約の当事者は、以下に示す規格の最新版を適用する可能性を調査することをお勧めします。 IEC および ISO のメンバーは、現在有効な国際規格の登録簿を維持しています。

  • ISO/IEC 2022:1994, 情報技術 — 文字コードの構造と拡張技術。
  • ISO/IEC 4873:1991, 情報技術 — 情報交換のための ISO 8 ビット コード — 実装のための構造と規則。
  • ISO/IEC 8824-1:1995, 情報技術 — 抽象構文記法 1 (ASN.1): 基本表記法の仕様。

4 つの定義

ISO/IEC 8859 のこの部分では、次の定義が適用されます。

4.1

ビットの組み合わせ

文字の表現に使用されるビットの順序付けられたセット。

4.2

バイト

単位として操作されるビット文字列。

4.3

キャラクター

データの編成、制御、または表現に使用される一連の要素のメンバー。

4.4

コード表

コード内の各ビットの組み合わせに割り当てられた文字を示す表。

4.5

コード化された文字セット;コード

文字セットと、セットの文字とそのビットの組み合わせとの間の 1 対 1 の関係を確立する明確な規則のセット。

4.6

コード化文字データ要素 (CC データ要素)

コード化された文字セットの 1 つ以上の識別された標準に従って、文字のコード化された表現のシーケンスで構成されるように指定された交換情報の要素。

4.7

グラフィックキャラクター

制御機能以外の文字で、通常は手書き、印刷、または表示される視覚的表現を持ち、1 つまたは複数のビットの組み合わせで構成されるコード化された表現を持ちます。

注記 1 ISO/IEC 8859 では、各文字を表すために 1 つのビットの組み合わせが使用されます。

4.8

グラフィック アイコン

グラフィック文字または制御機能の視覚的表現。

4.9

位置

列と行の座標によって識別されるコード テーブルの部分。

附属書C

(参考)

参考文献

ISO/IEC 6429:1992, 情報技術 — コード化文字セットの制御機能。
ISO/IEC 10367:1991, 情報技術 — 8 ビット コードで使用するための標準化されたコード化グラフィック文字セット。
ISO/IEC 10646-1:1993, 情報技術 — Universal Multiple-Octet Coded Character Set (UCS) — 1: アーキテクチャと基本的な多言語面。
エスケープ シーケンスで使用されるコード化文字セットの ISO 国際レジスタ

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and nongovernmental, in liaison with ISO and IEC, also take part in the work.

In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC1. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.

International Standard ISO/IEC 8859-2 was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology, Subcommittee SC 2, Coded character sets.

This edition cancels and replaces ISO 8859-2:1987 which has been technically revised.

ISO/IEC 8859 consists of the following parts, under the general title Information technology — 8-bit single-byte coded graphic character sets:

  • Part 1: Latin alphabet No. 1
  • Part 2: Latin alphabet No. 2
  • Part 3: Latin alphabet No. 3
  • Part 4: Latin alphabet No. 4
  • Part 5: Latin/Cyrillic alphabet
  • Part 6: Latin/Arabic alphabet
  • Part 7: Latin/Greek alphabet
  • Part 8: Latin/Hebrew alphabet
  • Part 9: Latin alphabet No. 5
  • Part 10: Latin alphabet No. 6

Annexes A to C of this part of ISO/IEC 8859 are for information only.

Introduction

ISO/IEC 8859 consists of several parts. Each part specifies a set of up to 191 graphic characters and the coded representation of these characters by means of a single 8-bit byte. Each set is intended for use for a particular group of languages.

1 Scope

This part of ISO/IEC 8859 specifies a set of 191 coded graphic characters identified as Latin alphabet No. 2.

This set of coded graphic characters is intended for use in data and text processing applications and also for information interchange.

The set contains graphic characters used for general purpose applications in typical office environments in at least the following languages:

Albanian, Croat, Czech, English, German, Hungarian, Latin, Polish, Romanian, Slovak, Slovene and Sorbian.

This set of coded graphic characters may be regarded as a version of an 8-bit code according to ISO/IEC 2022 or ISO/IEC 4873 at level 1.

This part of ISO/IEC 8859 may not be used in conjunction with any other parts of ISO/IEC 8859. If coded characters from more than one part are to be used together, by means of code extension techniques, the equivalent coded character sets from ISO/IEC 10367 should be used instead within a version of ISO/IEC 4873 at level 2 or level 3.

The coded characters in this set may be used in conjunction with coded control functions selected from ISO/IEC 6429. However, control functions are not used to create composite graphic symbols from two or more graphic characters (see clause 6).

NOTE — ISO/IEC 8859 is not intended for use with Telematic services defined by ITU-T. If information coded according to ISO/IEC 8859 is to be transferred to such services, it will have to conform to the requirements of those services at the access-point.

3 Normative references

The following standards contain provisions which, through reference in this text, constitute provisions of this part of ISO/IEC 8859. At the time of publication, the editions indicated were valid. All standards are subject to revision, and parties to agreements based on this part of ISO/IEC 8859 are encouraged to investigate the possibility of applying the most recent editions of the standards indicated below. Members of IEC and ISO maintain registers of currently valid International Standards.

  • ISO/IEC 2022:1994, Information technology — Character code structure and extension techniques.
  • ISO/IEC 4873:1991, Information technology — ISO 8-bit code for information interchange — Structure and rules for implementation.
  • ISO/IEC 8824-1:1995, Information technology — Abstract Syntax Notation One (ASN.1): Specification of basic notation.

4 Definitions

For the purposes of this part of ISO/IEC 8859 the following definitions apply.

4.1

bit combination

An ordered set of bits used for the representation of characters.

4.2

byte

A bit string that is operated upon as a unit.

4.3

character

A member of a set of elements used for the organization, control, or representation of data.

4.4

code table

A table showing the characters allocated to each bit combination in a code.

4.5

coded character set; code

A set of unambiguous rules that establishes a character set and the one-to-one relationship between the characters of the set and their bit combinations.

4.6

coded-character-data-element (CC-data-element)

An element of interchanged information that is specified to consist of a sequence of coded representations of characters, in accordance with one or more identified standards for coded character sets.

4.7

graphic character

A character, other than a control function, that has a visual representation normally handwritten, printed or displayed, and that has a coded representation consisting of one or more bit combinations.

Note 1 to entry: In ISO/IEC 8859 a single bit combination is used to represent each character.

4.8

graphic symbol

A visual representation of a graphic character or of a control function.

4.9

position

That part of a code table identified by its column and row coordinates.

Annex C

(informative)

Bibliography

ISO/IEC 6429:1992, Information technology — Control functions for coded character sets.
ISO/IEC 10367:1991, Information technology — Standardized coded graphic character sets for use in 8-bit codes.
ISO/IEC 10646-1:1993, Information technology — Universal Multiple-Octet Coded Character Set (UCS) — 1: Architecture and Basic Multilingual Plane.
ISO International register of coded character sets to be used with escape sequences.