この規格ページの目次
21
X 0221 : 2014 (ISO/IEC 10646 : 2012)
Ps... は,選択パラメタが複数個あってもよいことを示す。パラメタは,附属書Aに示す部分集合の組番号
からなる。パラメタが二つ以上ある場合,それぞれのパラメタ値は,03/11の値をもつオクテットで区切る。
パラメタ値は,数字09にそれぞれ対応するオクテット値03/0003/09の数字で表現する。
このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ
ット組合せのとおりでなければならない。
この制御シーケンスは,この規格に適合した符号単位列中に現れる場合,箇条11の規定に従って詰め込
まなければならない。
12.4 制御機能集合の識別
JIS X 0202のエスケープシーケンスを使う場合,この規格と一緒に使用するJIS X 0211の制御機能の集
合(箇条11参照)は,次に示す形の識別シーケンスで識別する。
ESC 02/01 04/00 JIS X 0211の全C0集合を識別する。
ESC 02/02 04/03 JIS X 0211の全C1集合を識別する。
これら以外のC0集合又はC1集合については,終端オクテットFは,符号化文字集合の国際登録簿から
得る。これらの集合の識別シーケンスを,次に示す。
ESC 02/01 F C0集合を識別する。
ESC 02/02 F C1集合を識別する。
このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ
ット組合せのとおりでなければならない。
このエスケープシーケンスは,この規格に適合した符号単位列中に現れる場合,箇条11の規定に従って
詰め込まなければならない。
12.5 JIS X 0202の符号化方式の識別
JIS X 0202のエスケープシーケンスを使う場合,UCSからJIS X 0202の符号化方式への復帰又は遷移は,
エスケープシーケンスESC 02/05 04/00による。このエスケープシーケンスは,この規格に適合した符号単
位列中に現れる場合,箇条11の規定に従って詰め込まなければならない。
このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ
ット組合せのとおりでなければならない。
注記 ESC 02/05 04/00のエスケープシーケンスは,通常,JIS X 0202から移ったときに保持されたJIS
X 0202の状態に復帰するために使われる。ここで規定するESC 02/05 04/00のエスケープシー
ケンスは,詰込みオクテットがあるために,JIS X 0202に規定されたものと同一ではないこと
がある。このため,12.2のUCSを識別するためのエスケープシーケンスは,復帰が必ずしも
JIS X 0202に適合しないことを示すために02/15オクテットを含んでいる。
13 符号表及び一覧表の構造
箇条31に図形文字の詳細符号表及び文字の名前の一覧表を示す。これによって,それぞれの文字に対す
る,図形記号,符号化表現及び文字の名前を規定する。
注記 箇条31は,名付け若しくは用法又は付随する図形記号のような,文字の幾つかの特徴を明らか
にするための,文字についての追加情報も含む。
図形記号は,文字の代表的な可視化表現とする。この規格は,各文字の正確な形又は色を規定しようと
するものではない。文字の形は,採用するフォント又はその他の表示手段のデザインに左右されるもので
あり,この規格の適用範囲外とする。この規格における代表字形は,一貫して白黒で表示されているが,
――――― [JIS X 0221 pdf 26] ―――――
22
X 0221 : 2014 (ISO/IEC 10646 : 2012)
この規格は,特定の一色若しくは複数の色をもつ図形記号,一部若しくは全部をアニメーション化した図
形,又はその両方を組み合わせて実装することを妨げるものではない。文字が特定の色と関連付けられて
いる場合には,符号表では,ヨーロッパの紋章で使用される慣習を用いて,単色の線画として表示してい
る。さらに,文字名に現れるBLACK(“黒”)又はWHITE(“白”)の語は,特定の色を指定するものでは
なく,単にいわゆるベタ文字といわゆる袋文字とを識別するためのものである。
この規格で規定する図形文字は,その名前で一意に識別される。名前が異なっていても,図形文字を可
視化した図形記号が常に異なるわけではない。類似の図形記号をもつ図形文字の例としては,LATIN
CAPITAL LETTER A(ラテン大文字A),GREEK CAPITAL LETTER ALPHA(ギリシア大文字A)及び
CYRILLIC CAPITAL LETTER A(キリル大文字A)がある。
文字のもつ意味は,この規格では規定しない。これは,国によって異なったり,適用業務によって異な
ったりする。
アルファベット類の用字については,文字をほぼアルファベット順に区の中に配列することを基本原則
とする。用字に大文字と小文字とがある場合には,対にして配列する。しかし,例えば,用字を配列した
規格が存在する場合には,基本原則よりもその規格に従うことを優先して文字を割り当てる。このように
文字を符号表中に配列することによって,既存の規格とこの符号化文字集合との間の変換が容易になる。
しかし,一般的には,この符号化文字集合と他の符号化文字集合との間の変換には,変換表を使うことに
なると考えられる。
この規格では,利用者が必要とする文字が,符号表のどこかの部分にまとまって見つかることを意図し
ていないし,実際に分散していることが多い。
さらに,利用者は,どの用字を使うにせよ,必要とする文字の幾つかが,この符号化文字集合の別の所
で定義されているのに気付くことが多いであろう。これは,特に,数字,記号及び複数の用字を使う場合
のラテン文字などについていえることである。
したがって,この符号化文字集合の利用者は,最初にA.2のブロック名の一覧表又は図7図12の面の
概観を調べ,その後に関連する用字,記号及び数字の符号表を調べるのが望ましい。附属書Gにアルファ
ベット順に分類した文字の名前の一覧を示す。
14 ブロック及び組の名前
14.1 ブロックの名前
連続した符号位置からなる名前の付いたブロックを,共通の特性(例えば,用字)をもった文字を割り
当てる目的で,面の中に定める。BMP,SMP,SIP及びSSPの中に定義されたブロックをA.2に示し,図
7図12に図示する。
ブロックの名前を構成するための規則は,24.5.1で規定する。
14.2 組の名前
組は,附属書Aで定義する。
組の名前を構成するための規則は,24.5.2で規定する。
15 双方向文脈での鏡像文字
15.1 鏡像文字
ある種の文字は,双方向テキストの文脈で,特別な意味をもつ。これらの文字の解釈及び表示は,符号
単位列中にその文字の符号化表現が現れた時点での文字の進行方向に関係する。これらの文字の一覧は,
――――― [JIS X 0221 pdf 27] ―――――
23
X 0221 : 2014 (ISO/IEC 10646 : 2012)
ユニコード標準の“BidiMirrord”属性が“Y”に設定されているものからなる。これらの値は,ユニコー
ド標準第6.1版の双方向鏡像属性(箇条3参照)で決定される。
注記1 一般的には,鏡像文字は,右から左に並べられたときに用いる水平方向に裏返した画像をも
つ。しかし,幾つかの数学記号においては,“鏡像”は,単純な裏返しにはならない。詳細は,
ユニコード技術報告書 UTR #25“Unicode Support for Mathematics”(ユニコードの数学向け機
能)を参照。
このような文字の裏返しは,対になった文字に限定されるものでなく,同種の文字全てに適用しなけれ
ばならない。
例 右から左のテキスト断片では,GREATER-THAN SIGN(左から右のテキストでは“>”と表示さ
れる。)は,“<”という図形記号で表示されることがある。
注記2 多くの古代文字及び幾つかの現在の用字では,右から左及び左から右の両方で書くことがで
きる。これらの用字の中には,しばしば慣習的に,垂直軸の周りで対称でない図形記号の任
意の文字表現に,適切な鏡像図形記号を用いるものがある。この場合,図形画像を運用上の
書記方向に合わせて適切に表示するのは,表示システムの責任となる。文字符号表の代表図
形記号の方向は,用字の既定の書記方向と対応する。これらの用字に属する文字は,ユニコ
ード標準の“BidiMirrored”属性が“N”に設定されている(箇条3のユニコード標準双方
向鏡像属性を参照)。
このような用字には,既定の書記方向が左から右である古代用字である古代イタリア文字,
及び既定の用字方向が右から左である古代用字であるキプロス文字が含まれる。
15.2 双方向テキストの方向性
The Unicode Bidirectional Algorithm(ユニコード双方向アルゴリズム)(箇条3参照)は,双方向テキス
トの方向性を決定するアルゴリズムについて記載している。この規格でもそれを用いる。
16 特殊文字
印字できる図形記号がないか,又は他の何らかの点で特別な文字がある。
16.1 空白の文字
次の文字は,空白の文字とする。これらは,一般分類の値が“Zs”である全ての文字の一覧である。
符号位置文字の名前
0020 SPACE
00A0 NO-BREAK SPACE
1680 OGHAM SPACE MARK
180E MONGOLIAN VOWEL SEPARATOR
2000 EN QUAD
2001 EM QUAD
2002 EN SPACE
2003 EM SPACE
2004 THREE-PER-EM SPACE
2005 FOUR-PER-EM SPACE
2006 SIX-PER-EM SPACE
2007 FIGURE SPACE
2008 PUNCTUATION SPACE
2009 THIN SPACE
200A HAIR SPACE
202F NARROW NO-BREAK SPACE
205F MEDIUM MATHEMATICAL SPACE
3000 IDEOGRAPHIC SPACE
――――― [JIS X 0221 pdf 28] ―――――
24
X 0221 : 2014 (ISO/IEC 10646 : 2012)
注記1 文字1680 OGHAM SPACE MARKは,中心ステム線を示す見えるグリフによって表現されるこ
とも多いが,ステムなし書体のフォントでは空白のグリフによって表現される。
注記2 180E MONGOLIAN VOWEL SEPARATORは,語の最後のMONGOLIAN LETTER A又はMONGOLIAN
LETTER Eと,これに先行する子音の字との間で使ってもよい。これは,MONGOLIAN LETTER
A又はMONGOLIAN LETTER Eの字及び先行する子音の図形記号の特別な形を指示する。可
視的に表示する場合,一般には文字の間の幅の狭いスペースのように表すが,時には,利用
者の補助のため,特定の図形記号として表してもよい。
注記3 202F NARROW NO-BREAK-SPACEは,改行しないスペース文字(non-breaking space)である。
00A0 NO-BREAK SPACE(ノーブレークスペース)と同様であるが,これより表示幅が狭い。
モンゴルの用字とともに使われるとき,通常この文字は,普通のスペースの3分の1の幅で
表示され,モンゴル語の語幹から接尾辞を分離する。これによって,その位置に語の境界が
ないことを示しながら,モンゴル文字の字形選択の通常の規則が適用できる。
16.2 通貨記号
この規格の通貨記号は,必ずしもある国の通貨を特定するものではない。例えば,YEN SIGN(円記号)
は,日本の円に使うこともできるが,中国の元に使うこともできる。さらに,DOLLAR SIGN(ドル記号)
は,米国も含め,多くの国で使用できる。
16.3 書式文字
次の文字は,書式文字とする(6.3.3参照)。これらは,一般分類の値が“Cf”,“Zl”及び“Zp”である
全ての文字の一覧である。附属書Fを参照。
符号位置文字の名前
00AD SOFT HYPHEN
0600 ARABIC NUMBER SIGN
0601 ARABIC SIGN SANAH
0602 ARABIC FOOTNOTE MARKER
0603 ARABIC SIGN SAFHA
0604 ARABIC SIGN SAMVAT
06DD ARABIC END OF AYAH
070F SYRIAC ABBREVIATION MARK
17B4 KHMER VOWEL INHERENT AQ
17B5 KHMER VOWEL INHERENT AA
200B ZERO WIDTH SPACE
200C ZERO WIDTH NON-JOINER
200D ZERO WIDTH JOINER
200E LEFT-TO-RIGHT MARK
200F RIGHT-TO-LEFT MARK
2028 LINE SEPARATOR
2029 PARAGRAPH SEPARATOR
202A LEFT-TO-RIGHT EMBEDDING
202B RIGHT-TO-LEFT EMBEDDING
202C POP DIRECTIONAL FORMATTING
202D LEFT-TO-RIGHT OVERRIDE
202E RIGHT-TO-LEFT OVERRIDE
2060 WORD JOINER
2061 FUNCTION APPLICATION
2062 INVISIBLE TIMES
2063 INVISIBLE SEPARATOR
2064 INVISIBLE PLUS
206A INHIBIT SYMMETRIC SWAPPING
206B ACTIVATE SYMMETRIC SWAPPING
206C INHIBIT ARABIC FORM SHAPING
――――― [JIS X 0221 pdf 29] ―――――
25
X 0221 : 2014 (ISO/IEC 10646 : 2012)
206D ACTIVATE ARABIC FORM SHAPING
206E NATIONAL DIGIT SHAPES
206F NOMINAL DIGIT SHAPES
FEFF ZERO WIDTH NO-BREAK SPACE
FFF9 INTERLINEAR ANNOTATION ANCHOR
FFFA INTERLINEAR ANNOTATION SEPARATOR
FFFB INTERLINEAR ANNOTATION TERMINATOR
110BD KAITHI NUMBER SIGN
1D173 MUSICAL SYMBOL BEGIN BEAM
1D174 MUSICAL SYMBOL END BEAM
1D175 MUSICAL SYMBOL BEGIN TIE
1D176 MUSICAL SYMBOL END TIE
1D177 MUSICAL SYMBOL BEGIN SLUR
1D178 MUSICAL SYMBOL END SLUR
1D179 MUSICAL SYMBOL BEGIN PHRASE
1D17A MUSICAL SYMBOL END PHRASE
E0001 LANGUAGE TAG
E0020E007F
TAG SPACE CANCEL TAG
16.4 漢字構成記述文字
漢字構成記述文字(Ideographic Description Character,以下IDCという。)は,漢字構成記述文字列
(Ideographic Description Sequence,以下IDSという。)を作り出すため,他の図形文字の列とともに使われ
る図形文字である。この種の文字列は,この規格で規定されていない漢字のような文字(ideographic
character)を記述する目的で使ってもよい。附属書Iに詳細な説明がある。IDCは,次による。
符号位置名前
2FF0 IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO RIGHT
2FF1 IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO BELOW
2FF2 IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE AND RIGHT
2FF3 IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND BELOW
2FF4 IDEOGRAPHIC DESCRIPTION CHARACTER FULL SURROUND
2FF5 IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM ABOVE
2FF6 IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM BELOW
2FF7 IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LEFT
2FF8 IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER LEFT
2FF9 IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER RIGHT
2FFA IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LOWER LEFT
2FFB IDEOGRAPHIC DESCRIPTION CHARACTER OVERLAID
16.5 字形選択子及び字形指示列
字形選択子は,特別な種類の結合文字であって,分解可能でない基底文字の直後に置かれ,その基底文
字の図形記号の特定の変形を示す。文字が分解可能であるとは,文字に等価な合成列が存在することをい
う。分解可能でない基底文字とそれに続く字形選択子との列を字形指示列という。
注記1 モンゴル自由字形選択子のように用字に固有な字形選択子もあり,数学記号その他各種の基
底文字に併用する字形選択子もある。
この箇条で定義又は参照される字形指示列だけが,図形記号の特定の変形を規定する。他の全ての字形
指示列は,許容しない。さらに,他の基底文字及び結合文字の次に来る字形選択子は,符号化文字に対応
する図形記号の選択に何の効果ももたない。
VARIATION SELECTOR-2(字形選択子2)VARIATION SELECTOR-16(字形選択子16)の文字を
用いる字形指示列は,この規格のこの版では定義しない。
基底文字として統合漢字を用い,追加特殊用途面(SSP)のVARIATION SELECTOR-17(字形選択子
17)VARIATION SELECTOR-256(字形選択子256)の文字とともに構成される字形指示列は,ユニコ
――――― [JIS X 0221 pdf 30] ―――――
次のページ PDF 31
JIS X 0221:2014の引用国際規格 ISO 一覧
- ISO/IEC 10646:2012(IDT)
JIS X 0221:2014の国際規格 ICS 分類一覧
- 35 : 情報技術.事務機械 > 35.040 : 文字セット及び符号化
JIS X 0221:2014の関連規格と引用規格一覧
- 規格番号
- 規格名称
- JISX0202:1998
- 情報技術―文字符号の構造及び拡張法
- JISX0211:1994
- 符号化文字集合用制御機能