ISO/IEC 10367:1991 情報技術—8ビットコードで使用するための標準化されたコード化グラフィック文字セット | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。

情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC1 を設立しました。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

国際規格 ISO/IEC 10367 は、合同技術委員会 ISO/IEC JTC1, 情報技術によって作成されました。

附属書 A および C は、この規格の不可欠な部分を形成します。附属書 B は情報提供のみを目的としています。

序章

過去数年間で、2 つの異なる 8 ビット コードが ISO/IEC/JTC1/SC2 によって開発されました。国際規格 ISO/IEC 6937 は、CCITT で定義された Telematic サービス (Teletex および Videotex) のニーズを満たす目的で開発されました。これは、グラフィック文字の基本セットと補助セットに基づいており、後者には、アクセント付き文字を生成するための一連のいわゆるノンスペーシング ダイアクリティカル マークが含まれています。したがって、グラフィック文字のコード化表現は、1 つまたは複数のビットの組み合わせで構成されます。標準では、333 文字の許容レパートリーが指定されています。 ISO/IEC 6937 は、8 ビット コーディングだけでなく、7 ビット コーディングにも適用されます。

8 ビット コード テーブルのファミリである ISO 8859 も開発され、特にデータ処理アプリケーションでのシングルバイト コード化グラフィック文字のニーズを満たすために開発されました。複数の部分で構成され、それぞれが最大 191 文字の 8 ビットのシングルバイト コード化グラフィック文字セットを指定します。各セットの文字の選択は、比較的一貫性のある大規模な地理的領域の複数の言語のニーズを満たすようなものです。 ISO 8859 のさまざまな部分は、ラテン文字だけでなく、アラビア語、キリル文字、ギリシャ文字、ヘブライ文字もカバーしています。

多くのアプリケーションでは、情報交換で複数のスクリプトを表現できるコード構造が必要です。たとえば、Latin Alphabet No. 1 (「西」ヨーロッパ) ギリシャ文字またはラテン アルファベット No. 2 (「東」ヨーロッパ) キリル文字。この目的には、ISO/IEC 4873 が適しています。ISO 2022 が提供するいくつかの機能を使用して、4 つの G セットにグループ化された最大 382 個のグラフィック文字を使用できるからです。

この構造内では、ISO 8859 のさまざまな部分のグラフィック文字セットを相互に組み合わせて使用​​できます。一部の文字はこれらのセットの複数に出現するため、そのようなセットが一緒に使用される場合、文字とそのコード化表現との間の 1 対 1 の関係の原則に違反しないようにするための規則が必要です。 ISO/IEC 4873 の新しいバージョン (1991 年の第 3 版) には、そのような規則が含まれています。

同様に、ISO/IEC 6937 は、ISO 8859 の一部から取得した追加の非ラテン グラフィック文字セットと組み合わせて使用​​できます。

したがって、この国際規格は、ISO/IEC 4873 の構造内で使用できるコード化されたグラフィック文字セットのコレクションを指定します。

1 スコープ

この国際規格は、GO セットとして使用するための一意のコード化グラフィック文字セットと、ISO/IEC 4873 のバージョンで Gl, G2, および G3 セットとして使用するための最大 96 文字の一連のコード化グラフィック文字セットを指定します。この国際規格は、8 ビット コードの要素として示されます。

これらのセットは、データおよびテキスト処理アプリケーションでの使用を目的としており、情報交換にも使用できます。これらには、一般的なオフィス環境で汎用アプリケーションに使用されるグラフィック文字が含まれています。

この国際規格は、ISO/IEC 4873 のバージョンの CO および Cl セットに割り当てられる制御機能を指定していません。ISO/IEC 6429 は、これらの制御機能を指定しています。必要な制御機能は、考慮されるアプリケーションに応じて、その国際規格から選択されるものとします。

3 参考文献

次の規格には、このテキストで参照することにより、この国際規格の規定を構成する規定が含まれています。発行の時点で、示されている版は有効でした。すべての規格は改訂される可能性があり、この国際規格に基づく契約の当事者は、以下にリストされている規格の最新版を適用する可能性を調査することをお勧めします。 1EC および ISO のメンバーは、現在有効な国際規格の登録簿を維持しています。

  • ISO 2022:1986, 情報技術 - ISO 7 ビットおよび 8 ビット コード化文字セット - コード拡張技術
  • ISO/IEC 4873:1991, 情報技術 - 情報交換のための 8 ビット コード - 実装のための構造と規則。
  • ISO/IEC 6429: 1)情報技術 - 7 ビットおよび 8 ビットのコード化文字セットの制御機能。
  • ISO/IEC 6937: 1)情報技術 - ラテン アルファベットを使用したテキスト通信用のコード化されたグラフィック文字セット。
  • ISO/IEC 8859, 情報処理 - 8 ビットのシングルバイト コード化グラフィック文字セット。

4 つの定義

この国際規格の目的のために、次の定義が適用されます。

4.1

ビットの組み合わせ

文字の表現に使用されるビットの順序付けられたセット。

4.2

キャラクター

データの編成、制御、または表現に使用される一連の要素のメンバー。

4.3

コード化文字データ要素 (CC データ要素)

コード化された文字セットの 1 つ以上の識別された標準に従って、文字のコード化された表現のシーケンスで構成されるように指定された交換情報の要素。

1年生から入園まで:
  • 1.システム相互接続のための参照モデル (ISO 7498) による通信環境では、CCdata 要素は、その国際デフォルトで定義されたプレゼンテーション プロトコル データ ユニット (PPDU) に対応する情報のすべてまたは一部を形成します。
  • 2.情報交換が交換可能なメディアによって達成される場合、CC データ要素は、フォーマットおよび初期化中に記録されたものではなく、ユーザー データに対応する情報のすべてまたは一部を形成します。

4.4

コード化文字セット;コード

文字セットと、そのセットの文字と 1 つ以上のビットの組み合わせによるコード化された表現との間の 1 対 1 の関係を確立する、明確な規則のセット。

4.5

コード表

コード内の各ビットの組み合わせに割り当てられた文字を示す表。

4.6

制御機能

データの記録、処理、送信、または解釈に影響を与え、1 つまたは複数のビットの組み合わせで構成されるコード化された表現を持つアクション。

4.7

デバイス

CC データ要素内のコード化された情報を送信および/または受信できる情報処理機器のコンポーネント。

注記 1:従来の意味での入力/出力デバイス、またはアプリケーション プログラムやゲートウェイ機能などのプロセスである可能性があります。

4.8

エスケープ シーケンス

コード拡張手順で制御目的で使用されるビットの組み合わせの文字列。これらのビットの組み合わせの最初のものは、制御機能 ESCAPE を表します。

4.9

グラフィックキャラクター

制御機能以外の文字で、通常は手書き、印刷、または表示される視覚的表現を持ち、1 つまたは複数のビットの組み合わせで構成されるコード化された表現を持ちます。

4.10

グラフィック アイコン

グラフィック文字または制御機能の視覚的表現。

4.11

位置

列と行の座標によって識別されるコード テーブルのその部分。

4.12

レパートリー

コード化文字セットの 1 つまたは複数のビットの組み合わせによって表される指定された文字セット。

4.13

ユーザー

デバイスによって提供されるサービスを呼び出す人またはその他のエンティティ。

1年生から入園まで:
  • 1.このエンティティは、たとえば「デバイス」がコード コンバータまたはゲートウェイ機能である場合、アプリケーション プログラムなどのプロセスである可能性があります。
  • 2.上記の 2.2 が満たされている場合、文字は、ユーザーによって提供されるか、ユーザーが利用できるように、デバイスにローカルなコードの形式、または従来とは異なる可視表現の形式である場合があります。

Foreword

ISO (the International organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.

In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC1. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75% of the national bodies casting a vote.

International Standard ISO/IEC 10367 was prepared by Joint Technical Committee ISO/IEC JTC1, Informationtechnology.

Annexes A and C form an integral part of this International Standard. Annex B is for information only.

Introduction

In the course of the past years two different 8-bit codes were developed by ISO/IEC/JTC1/SC2. An International Standard, ISO/IEC 6937, was developed with a view to satisfying the needs of CCITT-defined Telematic services: Teletex and Videotex. It is based on a primary and supplementary set of graphic characters, the latter containing a series of so-called non-spacing diacritical marks for the generation of accented letters. Thus, the coded representation of a graphic character may consist of one or more bit combinations. The standard specifies the allowed repertoire of 333 characters. ISO/IEC 6937 is applicable not only to 8-bit coding but also to 7-bit coding.

A family of 8-bit code tables, ISO 8859, was also developed to satisfy a need for single-byte coded graphic characters in particular in data processing applications. It consists of several parts, each specifying an 8-bit singlebyte coded graphic character set of up to 191 characters. The selection of characters for each set is such that it satisfies the needs of several languages of a large, relatively coherent, geographical area. The different parts of ISO 8859 cover not only the Latin script but also the Arabic, Cyrillic, Greek and Hebrew scripts.

Many applications need a code structure which permits more than one script to be represented in information interchange, for example Latin Alphabet No. 1 ("Western" Europe) with the Greek script or Latin Alphabet No. 2 ("Eastern" Europe) with the Cyrillic script. For this purpose ISO/IEC 4873 is suitable since it allows up to 382 graphic characters grouped in four G sets, by using a small selection of the facilities offered by ISO 2022.

Within this structure the graphic character sets from the various parts of ISO 8859 may be used in conjunction with each other. Since some characters appear in more than one of these sets, rules are needed to avoid violation of the principle of one-to-one relationship between a character and its coded representation when such sets are used together. The new version of ISO/IEC 4873 (3rd edition of 1991) contains such rules.

In a similar way ISO/IEC 6937 may be used in conjunction with additional non-Latin graphic character sets taken from the parts of ISO 8859.

Thus this International Standard specifies a collection of coded graphic character sets usable within the structure of ISO/IEC 4873.

1 Scope

This International Standard specifies a unique coded graphic character set for use as GO set and a series of coded graphic character sets of up to 96 characters for use as the Gl, G2 and G3 sets in versions of ISO/IEC 4873. All sets specified in this International Standard are shown as elements of an 8-bit code.

These sets are intended for use in data and text processing applications and may also be used for information interchange. They contain graphic characters used for general purpose applications in typical office environments.

This International Standard does not specify the control functions to be allocated to the CO and Cl sets of versions of ISO/IEC 4873. ISO/IEC 6429 specifies these control functions; the required control functions shall be selected from that International Standard depending on the application considered.

3 Normative references

The following standards contain provisions which, through reference in this text, constitute provisions of this International Standard. At the time of publication, the editions indicated were valid. All standards are subject to revision, and parties to agreements based on this International Standard are encouraged to investigate the possibility of applying the most recent editions of the standards listed below. Members of 1EC and ISO maintain registers of currently valid International Standards.

  • ISO 2022:1986, Information technology - ISO 7-bit and 8-bit coded character sets - Code extension techniques
  • ISO/IEC 4873:1991, Information technology - 8-bit code for information interchange - Structure and rules for implementation.
  • ISO/IEC 6429: 1) , Information technology - Control functions for 7-bit and 8-bit coded character sets.
  • ISO/IEC 6937: 1) , Information technology - Coded graphic character set for the communication of texts using the Latin alphabet.
  • ISO/IEC 8859, Information processing - 8-bit single-byte coded graphic character sets.

4 Definitions

For the purpose of this International Standard the following definitions apply.

4.1

bit combination

An ordered set of bits used for the representation of characters.

4.2

character

A member of a set of elements used for the organization, control or representation of data.

4.3

coded-character-data-element (CC-data-element)

An element of interchanged information that is specified to consist of a sequence of coded representations of characters, in accordance with one or more identified standards for coded character sets.

Note 1 to entry:
  • 1. In a communication environment according to the Reference Model for Often Systems Interconnection (ISO 7498), a CCdata-element will form all or part of the information that corresponds to the Presentation-Protocol-Data-Unit (PPDU) defined in that International Standard.
  • 2. When information interchange is accomplished by means of interchangeable media, a CC-data-element will form all or part of the information that corresponds to the user data, and not that recorded during formatting and initialization.

4.4

coded character set; code

A set of unambiguous rules that establishes a character set and the one-to-one relationship between the characters of the set and their coded representation by one or more bit combinations.

4.5

code table

A table showing the character allocated to each bit combination in a code.

4.6

control function

An action that affects the recording, processing, transmission, or interpretation of data, and that has a coded representation consisting of one or more bit combinations.

4.7

device

A component of information processing equipment which can transmit and/or receive coded information within CC-data-elements.

Note 1 to entry: It may be an input/output device in the conventional sense, or a process such as an application program or a gateway function.

4.8

escape sequence

A string of bit combinations that are used for control purposes in code extension procedures. The first of these bit combinations represents the control function ESCAPE.

4.9

graphic character

A character, other than a control function, that has a visual representation normally handwritten, printed or displayed, and that has a coded representation consisting of one or more bit combinations.

4.10

graphic symbol

A visual representation of a graphic character or of a control function.

4.11

position

That part of a code table identified by its column and row co-ordinates.

4.12

repertoire

A specified set of characters that are represented by means of one or more bit combinations of a coded character set.

4.13

user

A person or other entity that invokes the services provided by a device.

Note 1 to entry:
  • 1. This entity may be a process such as an application program if the"device" is a code convertor or a gateway function, for example.
  • 2. The characters, as supplied by the user or made available to him, may be in the form of codes local to the device, or of nonconventional visible representations, provided that 2.2 above is satisfied.