JIS X 0221:2014 国際符号化文字集合(UCS) | ページ 7

26
X 0221 : 2014 (ISO/IEC 10646 : 2012)
ード技術標準 UTS #37によって規定される漢字字形データベース(Ideographic Variation Database,IVD)
に登録される。この規格では,箇条3に示す版を用いる。
注記2 この規格は,2010-11-14版の漢字字形データベースの字形指示列の一覧を参照し,取り込ん
でいる。これは,次にある。<http://www.unicode.org/ivd/data/2010-11-14/>
字形選択子と組み合わせてもよい全ての数学記号の基底文字と,それに対応する変形とを,次に示す。
注記3 VARIATION SELECTOR-1(字形選択子1)は,数学記号とともに使用する唯一の字形選択
子である。
列のUIDによる表記 変形
<2229, FE00> セリフをもつINTERSECTION
<222A, FE00> セリフをもつUNION
<2268, FE00> 垂直画線をもつLESS-THAN BUT NOT EQUAL TO
<2269, FE00> 垂直画線をもつGREATER-THAN BUT NOT EQUAL TO
<2272, FE00> 下側の斜線に沿うLESS-THAN OR EQUIVALENT TO
<2273, FE00> 下側の斜線に沿うGREATER-THAN OR EQUIVALENT TO
<228A, FE00> 底部の要素を貫通する画線をもつSUBSET OF WITH NOT EQUAL TO
<228B, FE00> 底部の要素を貫通する画線をもつSUPERSET OF WITH NOT EQUAL TO
<2293,FE00> セリフをもつSQUARE CAP
<2294,FE00> セリフをもつSQUARE CUP
<2295,FE00> 隙間のあるCIRCLED PLUS
<2297,FE00> 隙間のあるCIRCLED TIMES
<229C, FE00> 等号が円に接触するCIRCLED EQUALS
<22DA, FE00> 傾斜した等号をもつLESS-THAN EQUAL TO OR GREATER-THAN
<22DB, FE00> 傾斜した等号をもつGREATER-THAN EQUAL TO OR LESS-THAN
<2A3C, FE00> 縦長で下辺の幅の狭いINTERIOR PRODUCT
<2A3D, FE00> 縦長で下辺の幅の狭いRIGHTHAND INTERIOR PRODUCT
<2A9D, FE00> 上部の斜線に沿う相似記号をもつSIMILAR OR LESS-THAN
<2A9E, FE00> 上部の斜線に沿う相似記号をもつSIMILAR OR GREATER-THAN
<2AAC, FE00> 傾斜した等号をもつSMALLER THAN OR EQUAL TO
<2AAD, FE00> 傾斜した等号をもつLARGER THAN OR EQUAL TO
<2ACB, FE00> 底部の要素を貫通する画線をもつSUBSET OF ABOVE NOT EQUAL TO
<2ACC, FE00> 底部の要素を貫通する画線をもつSUPERSET OF ABOVE NOT EQUAL TO
字形選択子と組み合わせてもよい全てのモンゴル文字の基底文字と,それに対応する変形とを,次に示
す。モンゴル自由字形選択子とともに用いるモンゴル文字の基底文字の幾つかの表示形だけが変形を生成
する。
注記4 モンゴル文字は,符号単位列中の位置に依存して,各種の異なる表示形をもつ。これらの表
示形は,語頭形(initial),語中形(medial),語末形(final)又は独立形(isolate)のいずれか
に分類される。
列のUIDによる表記 位置 変形
<1820, 180B> 独立形,中間形,語末形 MONGOLIAN LETTER Aの第2形式
<1820, 180C> 中間形 MONGOLIAN LETTER Aの第3形式
<1821, 180B> 語頭形,語末形 MONGOLIAN LETTER Eの第2形式
<1822, 180B> 中間形 MONGOLIAN LETTER Iの第2形式
<1823, 180B> 中間形,語末形 MONGOLIAN LETTER Oの第2形式
<1824, 180B> 中間形 MONGOLIAN LETTER Uの第2形式
<1825, 180B> 中間形,語末形 MONGOLIAN LETTER OEの第2形式
<1825, 180C> 中間形 MONGOLIAN LETTER OEの第3形式

――――― [JIS X 0221 pdf 31] ―――――

                                                                                             27
X 0221 : 2014 (ISO/IEC 10646 : 2012)
<1826, 180B> 独立形,中間形,語末形 MONGOLIAN LETTER UEの第2形式
<1826, 180C> 中間形 MONGOLIAN LETTER UEの第3形式
<1828, 180B> 語頭形,中間形 MONGOLIAN LETTER NAの第2形式
<1828, 180C> 中間形 MONGOLIAN LETTER NAの第3形式
<1828, 180D> 中間形 MONGOLIAN LETTER NAの分離形式
<182A, 180B> 語末形 MONGOLIAN LETTER BAの代替形式
<182C, 180B> 語頭形,中間形 MONGOLIAN LETTER QAの第2形式
<182C, 180B> 独立形 MONGOLIAN LETTER QAの女性形第2形式
<182C, 180C> 中間形 MONGOLIAN LETTER QAの第3形式
<182C, 180D> 中間形 MONGOLIAN LETTER QAの第4形式
<182D, 180B> 語頭形,中間形 MONGOLIAN LETTER GAの第2形式
<182D, 180B> 語末形 MONGOLIAN LETTER GAの女性形
<182D, 180C> 中間形 MONGOLIAN LETTER GAの第3形式
<182D, 180D> 中間形 MONGOLIAN LETTER GAの女性形
<1830, 180B> 語末形 MONGOLIAN LETTER SAの第2形式
<1830, 180C> 語末形 MONGOLIAN LETTER SAの第3形式
<1832,
180B> 中間形 MONGOLIAN LETTER TAの第2形式
<1833,
180B> 語頭形,中間形,語末形 MONGOLIAN LETTER DAの第2形式
<1835,
180B> 語末形 MONGOLIAN LETTER JAの第2形式
<1836,
180B> 語頭形,中間形 MONGOLIAN LETTER YAの第2形式
<1836, 180C> 中間形 MONGOLIAN LETTER YAの第3形式
<1838, 180B> 語末形 MONGOLIAN LETTER WAの第2形式
<1844, 180B> 中間形 MONGOLIAN LETTER TODO Eの第2形式
<1845, 180B> 中間形 MONGOLIAN LETTER TODO Iの第2形式
<1846, 180B> 中間形 MONGOLIAN LETTER TODO Oの第2形式
<1847, 180B> 独立形,中間形,語末形 MONGOLIAN LETTER TODO Uの第2形式
<1847, 180C> 中間形 MONGOLIAN LETTER TODO Uの第3形式
<1848, 180B> 中間形 MONGOLIAN LETTER TODO OEの第2形式
<1849, 180B> 独立形,中間形 MONGOLIAN LETTER TODO UEの第2形式
<184D, 180B> 語頭形,中間形 MONGOLIAN LETTER TODO QAの女性形
<184E, 180B> 中間形 MONGOLIAN LETTER TODO GAの第2形式
<185D, 180B> 中間形,語末形 MONGOLIAN LETTER SIBE Eの第2形式
<185E, 180B> 中間形,語末形 MONGOLIAN LETTER SIBE Iの第2形式
<185E, 180C> 中間形,語末形 MONGOLIAN LETTER SIBE Iの第3形式
<1860, 180B> 中間形,語末形 MONGOLIAN LETTER SIBE UEの第2形式
<1863, 180B> 中間形 MONGOLIAN LETTER SIBE KAの第2形式
<1868, 180B> 語頭形,中間形 MONGOLIAN LETTER SIBE TAの第2形式
<1868, 180C> 中間形 MONGOLIAN LETTER SIBE TAの第3形式
<1869, 180B> 語頭形,中間形 MONGOLIAN LETTER SIBE DAの第2形式
<186F, 180B> 語頭形,中間形 MONGOLIAN LETTER SIBE ZAの第2形式
<1873, 180B> 中間形,語末形 MONGOLIAN LETTER MANCHU Iの第2形式
<1873, 180C> 中間形,語末形 MONGOLIAN LETTER MANCHU Iの第3形式
<1873, 180D> 中間形 MONGOLIAN LETTER MANCHU Iの第4形式
<1874, 180B> 中間形 MONGOLIAN LETTER MANCHU KAの第2形式
<1874, 180B> 語末形 MONGOLIAN LETTER MANCHU KAの女性形第1形式
<1874, 180C> 中間形 MONGOLIAN LETTER MANCHU KAの女性形第1形式
<1874, 180C> 語末形 MONGOLIAN LETTER MANCHU KAの女性形第2形式
<1874, 180D> 中間形 MONGOLIAN LETTER MANCHU KAの女性形第2形式
<1876, 180B> 語頭形,中間形 MONGOLIAN LETTER MANCHU FAの第2形式

――――― [JIS X 0221 pdf 32] ―――――

28
X 0221 : 2014 (ISO/IEC 10646 : 2012)
<1880, 180B> 全て MONGOLIAN LETTER ALI GALI ANUSVARA ONEの第
2形式
<1881, 180B> 全て MONGOLIAN LETTER ALI GALI VISARGA ONEの第
2形式
<1887, 180B> 独立形,語末形 MONGOLIAN LETTER ALI GALI Aの第2形式
<1887, 180C> 語末形 MONGOLIAN LETTER ALI GALI Aの第3形式
<1887, 180D> 語末形 MONGOLIAN LETTER ALI GALI Aの第4形式
<1888, 180B> 語末形 MONGOLIAN LETTER ALI GALI Iの第2形式
<188A, 180B> 語頭形,中間形 MONGOLIAN LETTER ALI GALI NGAの第2形式
字形選択子と組み合わせてもよい全てのパスパ文字の基底文字と,それに対応する変形とを,次に示す。
これらの字形選択子の列は,特定の可視化表示を選択するのではなく,字形選択子の直前の文字から予測
される通常の形とは左右反転した表示を選択する。
列のUIDによる表記 変形
<A856, FE00> PHAGS-PA LETTER SMALL Aの左右反転した形
<A85C, FE00> PHAGS-PA LETTER HAの左右反転した形
<A85E, FE00> PHAGS-PA LETTER Iの左右反転した形
<A85F, FE00> PHAGS-PA LETTER Uの左右反転した形
<A860, FE00> PHAGS-PA LETTER Eの左右反転した形
<A868, FE00> PHAGS-PA SUBJOINED LETTER YAの左右反転した形
注記5 字形選択子は,既存の符号化文字の異なる字形を選択するだけである。字形選択子は,一般
的な符号拡張のための仕組みを意図したものではない。
注記6 漢字字形指示列以外の標準の字形指示列は,ユニコードの文字データベースでも
StandardizedVariants.html
(http://www.unicode.org/Public/4.0-Update/StandardizedVariants-4.0.0.html)として網羅されてい
る。

17 文字の表示形

  文字の表示形は,特定の文脈で使用するために,他の図形文字領域にある文字又はそれらの文字列がも
つ通常の形に対する代替の形を与える。通常の形から表示形への変換は,置換,重ね合せ又は組合せによ
ってもよい。
重ね合せ,形の異なる文字なのか若しくは合字(ligature)への組合せなのかの選択,又は連結(これは,
極度に複雑になることが多い。)のための規則は,この規格では規定しない。
表示形は,一般に,この符号化文字集合で規定する図形文字の通常の形の代替として使用することを意
図していない。しかし,特定の適用業務では,既存の装置との互換性などの特殊事情のために,通常の形
の代わりに表示形を用いてもよい。表示形の探索・分類及び表示形に対するその他の処理操作の規則は,
この規格の適用範囲外とする。
BMPでは,これらの文字のほとんどは,区FBFF内の符号位置に割り当ててある。

18 互換用文字

  この規格には互換用文字が含まれているが,これは,既存の符号化文字集合との互換性を保ち,情報を
失うことなく双方向の符号変換を可能にすることを目的としている。
BMPでは,これらの文字の多くは,区F9,FA,FE及びFF内並びに区31及び33内の符号位置に割り
当てている。互換用文字の幾つかは,他の区の中にも割り当てている。

――――― [JIS X 0221 pdf 33] ―――――

                                                                                             29
X 0221 : 2014 (ISO/IEC 10646 : 2012)
注記1 BMPの区FAの中には,CJK統合漢字として割り当てた符号位置が12か所ある。
追加漢字面(SIP)では,これらの文字は,区F8FAの中の符号位置に割り当てている。
CJK互換漢字とは,附属書Sに示す統合の規則によってCJK統合漢字の一つに統合される漢字である。
それにもかかわらずCJK互換漢字がこの規格に含まれているのは,特定の国及び地域に特有の様々な国家
的,文化的又は歴史的な理由に基づいて,それらの文字がある国家又は地域の規格で異なる符号位置に割
り当てられているからである。
注記2 このため,互換漢字は,特定の国家,地域又はその他の規格との間の往復の変換を維持及び
担保するためにだけ用いることが望ましい。他の用途には用いないことを強く推奨する。

19 文字の順序

  通常,符号化文字は,論理的な順序で符号単位列として現れる(論理的な順序又は記憶順序とは,おお
よそ,キーボードから文字が入力され,挿入,削除及び重ね打ちをした後の順序に対応する。)。これは,
進行方向が異なる文字が混在する場合にも適用する。例えば,左から右への用字(ギリシア文字,ラテン
文字,タイ文字など)と,右から左への用字(アラビア文字,ヘブライ文字など)又は縦への用字(モン
ゴル文字など)とが混在する場合にも,適用する。
幾つかの文字は,最終の出力テキスト中に同じ順序で現れない場合がある。例えば,DEVANAGARI VOWEL
SIGN I(デーヴァナーガリー母音記号I)の中間形は,符号単位列で論理的にある文字の後にそのデーヴ
ァナーガリー母音記号Iが続くとき,その文字の前にそのデーヴァナーガリー母音記号Iを表示する。

20 結合文字

  ここでは,結合文字の使用方法を規定する(4.14参照)。

20.1 結合文字の順序

  結合文字の符号化表現は,それが結合される基底文字の符号化表現の後に置かなければならない。例え
ば,LATIN SMALL LETTER A(ラテン小文字A)の後にCOMBINING TILDE[チルド(合成可能)]が
続く符号化表現は,ラテンの合成列“”を表現する。
一つの結合文字自身を合成列とみなさなければならない場合,その結合文字は,文字00A0 NO-BREAK
SPACE(ノーブレークスペース)と結合した合成列として符号化しなければならない。例えば,グレーブ
アクセントは,00A0のNO-BREAK SPACEの後に0300のCOMBINING GRAVE ACCENT[グレーブアクセ
ント(合成可能)]を置いて合成できる。
注記 インド系の用字で母音を意味する結合文字は,特殊な部類の結合文字である。理由は,その表
示が周囲の二つ以上の文字に依存できるからである。したがって,インド系の用字の結合文字
をNO-BREAK SPACEと結合させるのは,望ましくない。

20.2 結合クラス及び基準順序

  それぞれの結合文字は,ユニコード標準によって定められた結合クラスの値をもつ。これらの値は,ユ
ニコード標準第6.1版の結合クラス属性に従って定める(箇条3参照)。結合クラスは,正規化手続
(normalization process)の一部である規範順序を定めるために用いる(箇条21参照)。基準順序では,結
合文字を結合クラスの昇順に並べ替える。結合クラスの値がゼロである文字と組み合わされた結合文字は,
他の文字との相対位置に並べ直すことはない。

20.3 符号表上での形

  基底文字に相対的に位置決めしようとする結合文字は,文字符号表上では,基底文字との相対的位置を

――――― [JIS X 0221 pdf 34] ―――――

30
X 0221 : 2014 (ISO/IEC 10646 : 2012)
示すための破線の円の上,下,右,左,中,周り又は貫通位置に示す。結合文字は,表示のときに,先立
つ基底文字に相対的に位置決めされることを意図したものであって,それ自身では,基底文字として独立
して存在したり,基底文字の機能を果たしたりしない。そのため,結合文字と名付けられている。
注記 ダイアクリティカルマーク(diacritics)は,ヨーロッパのアルファベットで用いられる結合文
字の主要種類となっている。インド及び東南アジアで使われる他の多くの用字では,結合文字
は,母音の字を符号化したものである。そのため,通常,“ダイアクリティカルマーク”とは呼
ばない。

20.4 符号化表現のばらつき

  複数の結合文字を異なった順序で使用したり,文字と合成列との等価な組合せを混用したりすることに
よって,テキストの符号化表現にばらつきが生じる。ばらつきのある符号化表現の結果として,一つのテ
キストが複数の表現をもつことになる。ばらつきのある符号化表現を正規化(箇条21参照)することによ
って,完全に排除できないまでも,符号化表現のばらつきが大幅に減る。
注記 例えば,フランス語の“l”は,LATIN SMALL LETTER L(ラテン小文字L)の次にLATIN SMALL
LETTER A WITH GRAVE(グレーブアクセント付きA小文字)が続くと表現できるし,LATIN
SMALL LETTER L(ラテン小文字L),次にLATIN SMALL LETTER A(ラテン小文字A),そ
の次にCOMBINING GRAVE ACCENT[グレーブアクセント(合成可能)]が続くと表現できる。
これらの符号化表現のばらつきに正規化を適用することによって,ただ一つの符号化表現が残
る。残る符号化表現の形式は,どの正規形を用いるかによって異なる。

20.5 結合文字の重複

  二つ以上の結合文字が一つの基底文字に結合されることもある。この規格では,一つの基底文字に結合
される結合文字の個数は,制限しない。結合文字の重複の規則は,次のとおりとする。
a) 結合文字同士が(例えば,COMBINING MACRON[マクロン(合成可能)]とCOMBINING DIAERESIS
[ダイエレシス(合成可能)]とが)表示に影響し合う場合,結果の図形表示中での結合文字の位置は,
結合文字の符号化表現の順序による。結合文字の表示は,基底文字から外に向かって位置決めする。
例えば,基底文字の上に置く結合文字は,符号化表現の列で最初に出てきたものから始め,基底文字
に続く符号化された結合文字のある限り,順次,上に積み重ねる。基底文字の下に置く結合文字の場
合,積重ねの状態は,逆になり,基底文字から始め,結合文字を順次,下に重ねる。
基底文字の上に複数の結合文字を置く例がタイ文字にある。タイ文字では,子音字の上に0E34
0E37の母音記号の一つを置くことができ,更にその上に0E480E4Bの四つの声調記号(tone mark)
の一つを置くことができる。この符号化表現の順序は,子音字の基底文字,次に母音記号,その次に
声調記号となる。
b) ある特別の結合文字は,既定の積重ね動作に従わず,縦ではなく横に並べたり,隣り合った結合文字
と合字(ligature)を作ったりする。横に並べるときは,符号化表現の順序は,結合文字を使用する用
字の主要な進行方向中での位置によって決まる。例えば,左から右への用字では,横に並べて置かれ
るアクセントは,左から右へ符号化する。
既定の積重ね動作をしない,このような特別な文字は,特定の用字又はアルファベットで使われる。
例えば,COMBINING GREEK KORONIS(0343)と,それに続くアキュートアクセント記号又はグレ
ーブアクセント記号とを一緒に用いる場合,COMBINING GREEK KORONISの上にアクセント記号を
積み重ねず,一つの文字の上でそれらを横に並べなければならない。符号化表現の順序は,文字自身,
次に気息記号(breathing mark),その次にアクセント記号の順とする。ラテンのアキュートアクセン

――――― [JIS X 0221 pdf 35] ―――――

次のページ PDF 36

JIS X 0221:2014の引用国際規格 ISO 一覧

  • ISO/IEC 10646:2012(IDT)

JIS X 0221:2014の国際規格 ICS 分類一覧

JIS X 0221:2014の関連規格と引用規格一覧