JIS X 0221:2014 国際符号化文字集合(UCS) | ページ 3

6
X 0221 : 2014 (ISO/IEC 10646 : 2012)
4.19
制御機能(control function)
符号単位列によって表現され,データの記録,処理,伝送又は解釈に影響を及ぼす動作。
4.20
分解写像(decomposition mapping)
一つの文字を,基準等価又は互換等価な一つ以上の文字の一つの列に写す写像。
4.21
既定状態(default state)
状態が明示的に指定されていないときに,想定する状態。
注記 F.2.2F.2.4参照。
4.22
装置(device)
符号単位列内の符号化情報を送信及び/又は受信できる情報処理機器の一部分。
注記 装置は,通常の入出力機器であってもよく,応用プログラム又はゲートウェイ機能のような処
理であってもよい。
4.23
符号化形式(encoding form)
UCSの文字を表す個々のUCS符号位置を,その符号化形式が用いる一つ以上の符号単位によって表す
方法を決定するもの。
注記 この規格は,符号化形式としてUTF-8,UTF-16及びUTF-32を規定する。
4.24
符号化方式(encoding scheme)
符号化形式を構成する符号単位をオクテットの並びに直列化する方法の規定。
注記 UCSの符号化方式には,符号化形式と同じ呼び名をもつものがある。しかし,符号化方式の呼
び名と符号化形式の呼び名とは,異なる文脈で用いる。UCSの符号化形式は,メモリ上及び応
用インタフェースでのテキストデータの表現に言及する。UCSの符号化方式は,オクテットの
並びに直列化されたテキストデータに言及する。
4.25
拡張組(extended collection)
正規形NFCである符号位置の列を含んでもよい組。
注記1 3 LATIN EXTENDED-A,4 LATIN EXTENDED-B,15 ARABIC EXTENDEDなどのように
“extended”(拡張)という語を名前に含む組が多数あるが,組の名前に“extended”という
語が含まれていることとその組が拡張組であることとの間には,関係がない。
注記2 正規形NFCについては,箇条21参照。
注記3 符号位置の列は,名前付きUCS列識別子(箇条25参照)によって参照される。
4.26
確定組(fixed collection)
識別された範囲に含まれる全ての符号位置に文字が割り当てられている組であって,この規格の将来の
版においても(その組に含まれるレパートリが)変わらないことを意図しているもの。

――――― [JIS X 0221 pdf 11] ―――――

                                                                                              7
X 0221 : 2014 (ISO/IEC 10646 : 2012)
4.27
書式文字(format character)
周囲の文字の配置又は処理に作用することを主な機能とする文字。
注記 書式文字は,通常,それ自身の可視化表現をもたない。
4.28
一般分類,GC(General Category, GC)
字,句読点,記号類などの文字の重要な分類を決定するために,個々のUCS符号位置に割り当てた値。
注記1 実際の値は,ユニコード標準の2文字省略形を用いた一般分類特性として定める(箇条3に
示す最新のユニコード標準の一般分類を参照。)。
注記2 最初の文字が同一であるような全ての一般分類をまとめて扱うときには,一般分類の値の最
初の文字だけを用いて表すことがある。例えば,“L”は,“Lu”,“Ll”,“Lt”,“Lm”及び“Lo”
という字に関する一般分類の全体を表す。
4.29
図形文字(graphic character)
制御機能でも書式文字でもない文字であって,通常は,手書き,印字又は表示の可視化表現をもつもの。
4.30
図形記号(graphic symbol)
図形文字又は合成列の可視化表現。
4.31
上位サロゲート符号位置(high-surrogate code point)
UTF-16で用いるために保留されているD800DBFFの範囲の符号位置。
4.32
上位サロゲート符号単位(high-surrogate code unit)
UTF-16でサロゲートペアの先頭の符号単位として用いるD800DBFFの範囲の16ビットの符号単位。
注記 9.2参照。
4.33
誤った形式の符号単位列(ill-formed code unit sequence)
UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合しない
もの。
例 対をなさないサロゲート符号単位は,誤った形式の符号単位列の例である。
4.34
誤った形式の符号単位列部分集合(ill-formed code unit sequence subset)
ある符号単位列の空でない部分集合であって,その符号単位列の,正しい形式の符号単位の最小列であ
るようなサブセットに属する符号単位を含まないもの。
注記 誤った形式の符号単位列部分集合は,正しい形式の符号単位の最小列と重ならない。
4.35
交換(interchange)
通信手段又は交換可能な媒体によって,ある利用者から他の利用者に文字の符号化データを転送するこ
と。
注記 交換は,データを直列化し,UCSの符号化方式を用いる。

――――― [JIS X 0221 pdf 12] ―――――

8
X 0221 : 2014 (ISO/IEC 10646 : 2012)
4.36
相互動作(interworking)
それぞれ異なる符号化文字集合を採用している二つ以上のシステム間で,意味のある文字の符号化デー
タの交換ができるようにすること。
注記 二つの符号の間での変換を含むこともある。
4.37
ISO/IEC 10646-1
この規格の対応国際規格が以前に部編成であったときに,体系及び基本多言語面(BMP)を規定してい
た部。
注記1 ISO/IEC 10646の第1部とも呼ぶ。
注記2 ISO/IEC 10646-1には,第1版と第2版とがあった。
4.38
ISO/IEC 10646-2
この規格の対応国際規格が以前に部編成であったときに,追加多言語面(SMP),追加漢字面(SIP)及
び追加特殊用途面(SSP)を規定していた部。
注記1 ISO/IEC 10646の第2部とも呼ぶ。
注記2 ISO/IEC 10646-2には,第1版だけがあった。
4.39
下位サロゲート符号位置(low-surrogate code point)
UTF-16で用いるために保留されているDC00DFFFの範囲の符号位置。
4.40
下位サロゲート符号単位(low-surrogate code unit)
UTF-16でサロゲートペアの末尾の符号単位として用いるD800DBFFの範囲の16ビットの符号単位。
注記 9.2参照。
4.41
正しい形式の符号単位の最小列(minimal well-formed code unit sequence)
正しい形式の符号単位列であって,一つのUCSスカラ値に写像されるもの。
4.42
鏡像文字(mirrored character)
右から左に配置するテキストにおいて,その像が水平に反転される文字。
4.43
オクテット(octet)
8ビットの符号単位。
注記 この規格では,オクテットの値は,16進数を用いて00FFとして表記する(附属書K参照)。
4.44
面(plane)
UCS符号空間の一部分であって,65 536の符号位置からなるもの。
注記 UCS符号空間は,17の面からなる。
4.45
表示(presentation)

――――― [JIS X 0221 pdf 13] ―――――

                                                                                              9
X 0221 : 2014 (ISO/IEC 10646 : 2012)
図形記号を書いたり,印字したり,画面表示したりする処理。
4.46
表示形(presentation form)
(一部の言語の用字を表示する際に,)他の文字との相対的な位置に依存して文字を表現する図形記号の
形。
4.47
私用面(private use plane)
この符号化文字集合中の面であって,この規格で文字を規定しない面。
注記 面0F及び面10が私用面である。
4.48
レパートリ(repertoire)
符号化文字集合で表現する文字の指定された集合。
4.49
区(row)
面の一部であって,256の倍数の符号位置から始まり256個の連続する符号位置からなる,00FFの数
値によって識別されるもの。
4.50
用字(script)
一つ以上の言語の表記形で使用する図形文字の集合。
4.51
追加面(supplementary plane)
UCS符号空間の面00以外の面。
注記 追加面は,基本多言語面に割り当てていない文字を収容する。
4.52
用字及び記号のための追加多言語面,SMP(Supplementary Multilingual Plane for scripts and symbols, SMP)
UCS符号空間の面01。
4.53
追加漢字面,SIP(Supplementary Ideographic Plane, SIP)
UCS符号空間の面02。
4.54
追加特殊用途面,SSP(Supplementary Special-purpose Plane, SSP)
UCS符号空間の面0E。
4.55
サロゲートペア(surrogate pair)
二つの16ビット符号単位からなる一文字の表現であって,ペアの最初の値が上位サロゲート符号単位で
あり,二番目の値が下位サロゲート符号単位であるもの。
4.56
第三漢字面,TIP(Tertiary Ideographic Plane, TIP)
UCS符号空間の面03。

――――― [JIS X 0221 pdf 14] ―――――

10
X 0221 : 2014 (ISO/IEC 10646 : 2012)
4.57
UCS符号空間(UCS codespace)
UCSの文字のレパートリを割り当てるために用いる,010FFFF(16進数)の整数からなる符号空間。
4.58
UCSスカラ値(UCS scalar value)
上位サロゲート符号位置及び下位サロゲート符号位置を除く任意のUCS符号位置。
4.59
対をなさないサロゲート符号単位(unpaired surrogate code unit)
符号単位列の中の符号単位であって,次のいずれかであるもの。
− 上位サロゲート符号単位であって,下位サロゲート符号単位が直後にないもの。
− 下位サロゲート符号単位であって,上位サロゲート符号単位が直前にないもの。
4.60
利用者(user)
装置が提供するサービスを使う人又はそれに代わるもの。
注記 “装置”が符号変換機又はゲートウェイ機能の場合,これは,応用プログラムのような処理で
あってもよい。
4.61
正しい形式の符号単位列(well-formed code unit sequence)
UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合し,誤
った形式の符号単位列部分集合を含まないもの。

5 国際符号化文字集号の全体構造

  ここでは,国際符号化文字集合(以下,“この符号化文字集合”という。)の大まかな構造について示し,
図1に図示する。構造の規定は,箇条6及び箇条8による。
この符号化文字集合の基準形式(規格を理解するための形式)は,010FFFFの整数からなるUCS符号
空間を用いる。
この規格は,次の面の符号化文字を定義する。
− 基本多言語面(BMP,すなわち,面00)。
− 用字及び記号のための追加多言語面(SMP,すなわち,面01)。
− 追加漢字面(SIP,すなわち,面02)。
− 追加特殊用途面(SSP,すなわち,面0E)。
第三漢字面(TIP,面03)を漢字のために保留する。TIPは,現在空である。面040Dは,将来の標準
化のために保留する。
面0F及び10は,私用のために保留する。
符号空間の部分集合を,図形文字の部分レパートリを定めるために使ってもよい。

6 基本構造及び名称

6.1 構造

  この規格が規定する国際符号化文字集合は,17の面からなる一つのものとみなさなければならない。

――――― [JIS X 0221 pdf 15] ―――――

次のページ PDF 16

JIS X 0221:2014の引用国際規格 ISO 一覧

  • ISO/IEC 10646:2012(IDT)

JIS X 0221:2014の国際規格 ICS 分類一覧

JIS X 0221:2014の関連規格と引用規格一覧