この規格ページの目次
- 情報技術−文字符号の構造及び拡張法
- 序文
- 1. 適用範囲
- 2. 規格に対する適合性
- 2.1 適合の種類
- 2.2 情報交換の適合性
- 2.3 装置の適合性
- 2.3.1 装置の記述
- 2.3.2 送信装置
- 2.3.3 受信装置
- 3. 引用規格
- 4. 定義
- 4.1 ビット組合
- 4.2 バイ
- 4.3 文字
- 4.5 符号化文字集
- 4.6 符号拡
- 4.7 符号
- 4.8 結合文
- 4.9 制御文字
- 4.10 制御機能
- 4.11 指示す
- 4.12 装
- 4.13 エスケープシーケンス
- 4.14 終端バイト
- 4.15 図形文
- 4.16 図形記
- 4.17 中間バイト
- 4.18 呼び出す
- 4.19 レパート
- 4.20 表現する
- 4.21 利用
- 5. 記法,符号表及び名前
- 5.1 記法
- 5.2 符号表
- JIS X 0202:1998の引用国際規格 ISO 一覧
- JIS X 0202:1998の国際規格 ICS 分類一覧
- JIS X 0202:1998の関連規格と引用規格一覧
日本工業規格(日本産業規格) JIS
X 0202 : 1998
(ISO/IEC 2022 : 1994)
情報技術−文字符号の構造及び拡張法
Information technology−Character code structure and extension techniques
序文
この規格は,1994年に第4版として発行されたISO/IEC 2022,Information technology−Character code
structure and extension techniquesを翻訳し,技術的内容及び規格票の様式を変更することなく作成した日本
工業規格である。
なお,この規格で点線の下線を施してある“参考”は,原国際規格にはない事項である。
第1章 一般
1. 適用範囲
この規格は,文字集合の符号化のための8ビット符号及び7ビット符号の構造を規定する。
この構造の符号要素は,8ビット符号及び7ビット符号で共通とする。この符号は,基本的な8ビット及
び7ビットの符号の機能を拡張するために各種の方法を用いる。
8ビット符号が最近広く利用されていることから,規格のこの版は,前の版に比べて8ビット符号を強
調する。
8ビット及び7ビットの符号構造の共通要素を使用することによって,簡単でかつ直接的な方法で,適
合する8ビット符号を等価な7ビット符号に,又はその逆方向に変換できる。
ISO/IEC 4873は,ここで規定する8ビット符号の構造に適合し,ISO/IEC 646は,7ビット符号の構造
に適合する。
参考 JIS X 0221 (ISO/IEC 10646-1) で規定する符号化文字集合は,この規格の規定とは別の構造をし
ている。
この規格で規定する符号構造機能は,符号で使用できる制御機能及び図形文字の数を拡張する各種の方
法を含む。さらに,特定の符号の定義を組み立てて形式化する技術,その構造の符号化及びそのような符
号の構成要素を識別する技術を含む。
特定の符号は,ISO 8824に従って,オブジェクト識別子で識別されてもよい。このオブジェクト識別子
は,附属書Aで規定する。
これらの8ビット及び7ビットの符号で用いようとする個々の文字集合及び制御機能は,ISO 2375(附
属書B参照)に従って,ISO国際登録機関に登録されたエスケープシーケンスを使用する符号化文字集合
とする。登録は,個々の文字集合及び制御機能と符号化表現との関連付けの詳細及びその文字集合の符号
化の識別を含む。
この規格で確立した原理は,補助符号構造機能を作るために用いてよい。例えば,JIS X 0211は,パラ
――――― [JIS X 0202 pdf 6] ―――――
2
X 0202 : 1998 (ISO/IEC 2022 : 1994)
メタ化した制御機能を形式化するために,このような手続を用いている。
ここに示す8ビット及び7ビットの符号の一つの形式による符号構造技術の使用は,次の利点をもつ。
− 情報処理システム設計における符号構造に対する同一の形式での規定を可能にする。
− 合意された文字集合の呼出しの標準化された方法を提供する。
− 8ビット及び7ビットの文字集合を用いる環境間で相互のデータ交換を可能にする。
− 相互間操作が要求されるシステム間の矛盾の危険性を軽減する。
符号構造機能の実装水準が異なる二つのシステム間で通信が必要な場合,それらのシステムは,双方が
共通にもつ符号構造機能を用いる。
ここで規定する符号は,データが正方向に順次処理されるように設計されている。他の方法で処理され
たデータの場合,又は固定長レコード処理形式のデータの場合,これらの符号列は,望ましくない結果を
生じることがあり,正しく解釈するには,この規格の規定のほかに特別な扱いが要求されることがある。
参考 この版の構成は,前の版と比べて,参照資料として使いやすいように大幅に変更し,次の3章
構成にしてある。
第1章 一般
第2章 文字集合及び符号
第3章 符号識別及びエスケープシーケンス
2. 規格に対する適合性
2.1 適合の種類
規格に完全に適合するとは,規格が要求する事項をすべて満たすことをいう。規格に
任意機能がない場合には,適合は,一意に定まる。規格に任意機能がある場合には,それらの機能は,規
格中で明確にされなければならず,その規格に対する適合性を主張するときには,採用した任意機能を明
示することが要求される。
この規格の適合性は,この種のものと異なる。すなわち,この規格は,多数の機能を規定し,個々の応
用に適するように,それらの機能を選択できるようにしている。したがって,この規格では,あらかじめ
選択肢を規定していない。しかし,この規格への適合性を主張する場合には,どの機能を組み合わせたか
を明示しなければならない。この種の識別された組合せの適合は,限定適合と呼ばれる。
特定の応用で使用するために,この規格から選択した機能の組合せは,通常,仕様書に書く。仕様書に
は,また,採用した機能の説明とともに特定の符号を定義するのに十分な情報を示す。このような仕様書
は,この規格に従っているとみなす (10.1参照)。
2.2 情報交換の適合性
交換用の符号化情報のCCデータ要素は,その要素中の符号化表現が次の条件
を満足するとき,この規格に適合する。
a) それらは,図形文字,制御機能及び符号識別機能を表現しなければならない。これらは,この規格で
規定する機能を基にした識別された組合せに従っていなければならない(10.1参照)。
b) この規格で規定する符号拡張技術を使用する場合,それらは,この規格で規定する意味及び符号化表
現を使用し,この規格で定義する制御機能及び符号識別機能によって,実行しなければならない。
c) 登録のために保留されていて,割り当てられていない符号化表現又は将来の標準化のために保留され
ている符号化表現を使用してはならない。
d) 登録によって定義されているものと違った意味で,登録エスケープシーケンスを使用してはならない。
――――― [JIS X 0202 pdf 7] ―――――
3
X 0202 : 1998 (ISO/IEC 2022 : 1994)
2.3 装置の適合性
2.3.1の要件と,2.3.2及び2.3.3の一方又は両方の要件とを満たす場合に,装置はこ
の規格に適合する。適合していると主張する場合は,2.3.1で規定する内容を含む文書を示さなければなら
ない。
2.3.1 装置の記述
この規格に適合する装置は,次に示す記述を備えなければならない。
a) この規格に従って,直接又は仕様書を参照することによって,利用者が装置にCCデータ要素を供給
するための方法,又はCCデータ要素が利用者に提示されたときにそのCCデータ要素を利用できる
ようにするための方法について,この規格から選択した機能を明示しなければならない。
b) 2.3.2及び2.3.3に規定するとおり,それぞれ,利用者が対応する文字及び機能を用意する方法,又は
利用者が文字及び機能を認識する方法を,明示しなければならない。
2.3.2 送信装置
送信装置は,一つ以上の図形文字集合の図形文字の符号化表現並びにこの規格に適合し
た制御機能の識別された組合せ及び符号識別機能の明示的な符号化表現を,CCデータ要素として送信で
きなければならない。
このような装置は,適切な集合から選ばれた文字又はその符号化表現が送信されるべき図形文字,制御
機能及び符号識別機能を明示的又は暗黙的に決定するその他の指示を利用者が供給できなければならない。
2.3.3 受信装置
受信装置は,一つ以上の図形文字集合の図形文字の符号化表現並びにこの規格に適合し
た制御機能の識別された組合せ及び符号識別機能の明示的な符号化表現を,CCデータ要素として受信し,
解釈できなければならない。
このような装置は,適切な集合から選ばれた文字又はその符号化表現が受信された図形文字,制御機能
及び符号識別機能を,明示的又は暗黙的に決定するその他の指示を利用者に供給できなければならない。
3. 引用規格
次に掲げる規格は,この規格に引用されることによって,この規格の規定の一部を構成す
る。これらの引用規格は,その最新版(追補を含む。)を適用する。
ISO 2375 : 1985 Data processing−Procedure for registration of escape sequences
JIS X 0211 : 1994 符号化文字集合用制御機能
備考 ISO/IEC6429 : 1992,Information technology−Control functions for coded character setsがこの規
格に一致している。
ISO/IEC 8824 : 1990 Information technology−Open Systems Interconnection−Specification of Abstract
Syntax Notation One (ASN.1)
ISO/IEC 8825 : 1990 Information technology−Open Systems Interconnection−Specification of Basic
Encoding Rules for Abstract Syntax Notation One (ASN.1)
ISO International Register of Coded Character Sets to be used with Escape Sequences
4. 定義
この規格で使用する用語の定義は,次のとおりとする。
4.1 ビット組合
せ (bit combination)文字表現に用いる順序付けられたビットの集合。4.2 バイ
ト (byte) 一つの単位として操作するビット列。各ビットは,0又は1の値をもつ。4.3 文字
(character) データの構成,制御又は表現に用いる構成単位の集合の要素。
4.4 符号化文
符号化文字データ要素 (coded-character-data-element),CCデータ要素 (CC-data-element)
字集合に関する一つ以上の規格に適合し,かつ,文字の符号化表現の列によって構成される,情報交換の
構成単位。
参考1. JIS X 5003(開放型システム間相互接続の基本参照モデル)に従う通信環境においては,CC
――――― [JIS X 0202 pdf 8] ―――――
4
X 0202 : 1998 (ISO/IEC 2022 : 1994)
データ要素は,JIS X 5003で定義されているプレゼンテーションプロトコルデータ単位
(PPDU) に対応する情報の全部又は一部を構成する。
2. 交換可能な媒体によって情報交換を実現している場合,CCデータ要素は,利用者データに
対応する情報の全部又は一部を構成し,媒体の初期化中に記録される情報の全部又は一部を
構成しない。
4.5 符号化文字集
合 (coded character set),符号 (code)文字集合を定め,かつ,その集合内の文字とビット組合せとを1対1に関係付ける,あいまいでない規則の集合。参考 “符号化文字集合”と“符号”とは,交替可能な用語である。例えば,“7ビット符号化集合”
は,“7ビット符号”と,同じ意味である。
4.6 符号拡
張 (code extension) 与えられた符号化文字集合に含まれていない文字の符号化のために用いる手法。4.7 符号
表 (code table) 符号化文字集合の中の各ビット組合せに割り当てた文字を示す表。4.8 結合文
字 (combining character)符号化文字集合の識別された部分集合の構成単位であって,先行する非結合文字(以下,基底文字という。)と組み合わせることを意図したもの,又は基底文字の後に結合文字の列が続いた形のものと組み合わせることを意図したもの。
4.9 制御文字
(control character)一つのビット組合せだけで表現する制御機能。
4.10 制御機能
(control function)データの記録,処理,伝送及び解釈に影響を及ぼす作用で,一つ以上
のビット組合せで表現するもの。
文字集合を,即座に又は更に他の制御機能が出現してから,所定の方法で
4.11 指示す
る (to designate)表現できるように指定する。4.12 装
置 (device) CCデータ要素の符号化情報を送信,受信又は送受信できる情報処理機械の一部分。 参考 通常の意味での入出力装置のほか,応用プログラム,ゲートウェイなどの場合もある。符号拡張手順において制御のために使用する一つ以上の
4.13 エスケープシーケンス
(escape sequence)
ビット組合せ。先頭のビット組合せは,制御文字ESCAPE(エスケープ)を表現する。
参考 この規格では,ESCAPEは,常に制御文字として引用される。
4.14 終端バイト
(Final Byte) エスケープシーケンス又は制御シーケンスを終わらせるビット組合せ。
4.15 図形文
字 (graphic character)制御機能以外で,通常,手書き・印字・表示の可視表現をもち,一つ以上のビット組合せからなる符号化表現をもつ文字。4.16 図形記
号 (graphic symbol)図形文字又は制御機能の視覚的表現。4.17 中間バイト
(Intermediate Byte) スケープシーケンスの中で,制御文字ESCAPE(ESC,エスケープ)
と終端バイトとの間に現れてもよいビット組合せ。
4.18 呼び出す
(to invoke)所定のビット組合せが出現するだけで,指示された文字集合が表現できる状
態にする。
符号化文字集合の一つ以上のビット組合せによって表現される,規定され
4.19 レパート
リ (repertoire)た文字の集合。4.20 表現する
(to represent)次のいずれかの意味を表す。
a) ある文字集合を指示し呼び出してあるとき,所定のビット組合せをその文字集合内の文字の意味に使
用する。
b) エスケープシーケンスを追加の制御機能の意味に使用する。
4.21 利用
者 (user) 装置が提供するサービスを使う人又はそれに代わるもの。――――― [JIS X 0202 pdf 9] ―――――
5
X 0202 : 1998 (ISO/IEC 2022 : 1994)
参考1. “装置”が符号変換機能又はゲートウェイ機能であるならば,利用者は,応用プログラムの
ようなものであってよい。
2. 利用者が用意するか又は利用者に提供される文字は,2.3を満足するものであれば,装置固有
の符号化形式又は通常と異なる表示形式であってよい。
5. 記法,符号表及び名前
5.1 記法
8ビット符号のビット組合せのビットは,b8,b7,b6,b5,b4,b3,b2及びb1で表し,b8を最
上位ビットとし,b1を最下位ビットとする。
7ビット符号のビット組合せのビットは,b7,b6,b5,b4,b3,b2及びb1で表し,b7を最上位ビットとし,
b1を最下位ビットとする。
ビット組合せは,2進整数の値の表現として解釈してもよく,8ビット符号では0255,7ビット符号で
は0127の整数とする。個々のビットの重みは,次のとおりとする。
ビット b8 b7 b6 b5 b4 b3 b2 b1
重み 128 64 32 16 8 4 2 1
この規格では,ビット組合せは,x/yの形式で表現する。ここで,x及びyは,015の整数とする。
x/y形式の表現とビットb8(又はb7)b1のビット組合せとの対応は,次のとおりとする。
− 8ビット符号のxはb8b5で表現する整数とし,それぞれのビットの重みは8,4,2及び1とする。
− 7ビット符号のxはb7b5で表現する整数とし,それぞれのビットの重みは4,2及び1とする。
− yはb4b1で表現する整数とし,それぞれのビットの重みは8,4,2及び1とする。
x/y形式は,符号表の位置を示すためにも用い,xで列番号を表し,yで行番号を表現する(5.2参照)。
5.2 符号表
8ビット符号の符号表は,16列,16行の256位置からなる。列及び行には,0015の番号
を付ける(図1参照)。
7ビット符号の符号表は,8列,16行の128位置からなる。列には0007の番号を付け,行には0015
の番号を付ける(図1参照)。
符号表の位置は,x/y形式で表し,xを列番号とし,yを行番号とする。ここでは,列番号及び行番号は,
先頭の0を含めて表現する(例えば,02/01)。
符号表の位置は,符号のビット組合せと1対1に対応する。符号表の位置の記法は,対応するビット組
合せと同じとする。
――――― [JIS X 0202 pdf 10] ―――――
次のページ PDF 11
JIS X 0202:1998の引用国際規格 ISO 一覧
- ISO/IEC 2022:1994(IDT)
JIS X 0202:1998の国際規格 ICS 分類一覧
- 35 : 情報技術.事務機械 > 35.040 : 文字セット及び符号化
JIS X 0202:1998の関連規格と引用規格一覧
- 規格番号
- 規格名称