JIS X 0221:2014 国際符号化文字集合（ＵＣＳ）

この規格ページの目次

24.3 名前の単一性
24.4 名前の不変性
24.5 名前の一意性
24.6 漢字の名前
24.7 ハングル音節文字の名前
25 名前付きUCS列識別子
26 基本多言語面の構造
JIS X 0221:2014の引用国際規格 ISO 一覧
JIS X 0221:2014の国際規格 ICS 分類一覧
JIS X 0221:2014の関連規格と引用規格一覧

                                                                                             41
                                                                X 0221 : 2014 (ISO/IEC 10646 : 2012)
− SPACE(スペース)
− HYPHEN-MINUS(ハイフン,負符号)
− FULL STOP(ピリオド)(組の名前に限る。)
  名前の最初の文字は,ラテンの大文字とする。名前の最後の文字は,ラテンの大文字又は数字とする。
  名前は,連続する2個以上のSPACE又は連続する2個以上のHYPHEN-MINUSを含んではならない。さ
らに,組以外のものの名前は,SPACEに続く数字(DIGIT ZERODIGIT NINE)を含んではならない。
組の名前は,連続する2個以上のFULL STOPを含んではならない。
  SPACEにHYPHEN-MINUSが続く列,又はHYPHEN-MINUSにSPACEが続く列は,文字の名前又は名前
付きUCS列識別子の名前にだけ現れてもよい。
    例1 次に示す二つの文字の名前は,SPACEとHYPHEN-MINUSとの並びを含んでいる。
                        TIBETAN LETTER -A
                        TIBETAN MARK BKA- SHOG YIG MGO
  FULL STOPは,組の名前の中で,二つの英数字(LATIN CAPITAL LETTER ALATIN CAPTITAL LETTER
Z又はDIGIT ZERODIGIT NINE)の間にだけ現れてもよい。
    例2 次に示す組の名前は,2個の数字DIGIT FOUR(4)とDIGIT ONE(1)との間にFULL STOP
          を含む。
                        UNICODE 4.1
    例3 次に示す組の名前は,1個のラテン文字LATIN CAPITAL LETTER D(ラテン大文字D)と1
          個の数字DIGIT SEVEN(7)との間にFULL STOPを含む。
                        BMP-AMD.7

24.3 名前の単一性

  この規格の中で名前付けられる全てのものは,それぞれ名前を一つだけ付与する。
    注記 この規定は,明確化を目的とし,参考のために使用する別名又は省略形の使用を妨げるもので
          はない。しかし,規定としての名前は,一つだけである。こうした,参考としての別名は,文
          字の名前として同じ名前空間を共有し,規定事項である文字の別名と混同しないほうがよい。

24.4 名前の不変性

  ある種の名前は,この規格の将来の版においても変更されない。この性質は,文字の名前及び文字の別
名に適用される。箇条7参照。

24.5 名前の一意性

  名前は,この箇条で示すように,対応する名前空間内で一意でなければならない。
24.5.1 ブロックの名前
  ブロックの名前の集合は,一つの名前空間を構成する。一つ一つのブロックの名前は,一意であって,
この規格が規定する他の全てのブロックの名前と区別できなければならない。
24.5.2 組の名前
  組の名前の集合は,一つの名前空間を構成する。一つ一つの組の名前は,一意であって,この規格が規
定する他の全ての組の名前と区別できなければならない。
24.5.3 文字の名前,文字の別名及び名前付きUCS列識別子
  文字の名前,文字の別名及び名前付きUCS列識別子は,それらを共に含む集合が一つの名前空間を構成
する。一つ一つの文字の名前,文字の別名又は名前付きUCS列識別子は,一意であって,この規格が規定
する他の全ての文字の名前,文字の別名及び名前付きUCS列識別子と区別できなければならない。

――――― [JIS X 0221 pdf 46] ―――――

42
X 0221 : 2014 (ISO/IEC 10646 : 2012)
24.5.4 一意性の判定
  ブロックの名前及び組の名前は,二つの名前をSPACE及び中間のHYPHEN-MINUSを無視して比較を行
っても異なる場合に,一意であって区別できるものとみなす。
    注記1 中間のHYPHEN-MINUSとは,SPACE以外の文字に挟まれた1個のHYPHEN-MINUSである。
    例1 次に示す架空のブロックの名前は,一意であって区別できる。
                        LATIN-A
                        LATIN-B
    例2 次に示す架空のブロックの名前は,一意ではなく区別できない。
                        LATIN-A
                        LATIN A
                        LATINA
  文字の名前及び名前付きUCS列識別子の名前は,二つの名前をSPACE及び中間のHYPHEN-MINUSを
無視し,更に,“LETTER”,“CHARACTER”及び“DIGIT”の語を無視して比較を行っても異なる場合に,
一意であって区別できるものとみなす。
    例3 次に示す二つの架空の文字の名前は,一意ではなく区別できない。
                        MANICHAEAN CHARACTER A
                        MANICHAEAN LETTER A
    例4 次に示す二つの実在の文字の名前は,中間のHYPHEN-MINUSでない一つのHYPHEN-MINUSに
          よって異なるので,一意であって区別できる。
                        TIBETAN LETTER A
                        TIBETAN LETTER -A
  ただし,次に示す二つの文字の名前は,一意であって区別できるものとみなす。
                        HANGUL JUNGSEONG OE
                        HANGUL JUNGSEONG O-E
    注記2 これら二つの文字の名前だけは,特別に例外として取り扱う。なぜならば,これらは,この
            規格の以前の版で規定されたものであって,その版ではまだ名前の一意性に関する要求事項
            が規定されていなかったからである。これら二つの文字は,この規格での一意性に関する規
            則における唯一の例外であって,今後ともこれ以外の例外を設けることはない。

24.6 漢字の名前

  CJK統合漢字の名前は,“CJK UNIFIED IDEOGRAPH-”(CJK統合漢字)の後に,CJK互換漢字の名前
は,“CJK COMPATIBILITY IDEOGRAPH-”(CJK互換漢字)の後に,それぞれ16進表記の符号化表現を
付けることによって,アルゴリズム的に構成する。
  BMPの漢字では,符号化表現は,4桁の16進数で表現された2オクテットの値で示す。例えば,BMP
中の最初のCJK統合漢字は,“CJK UNIFIED IDEOGRAPH-3400”という名前をもつ。
  SIPの漢字では,符号化表現は,5桁の16進数の値である。例えば,SIP中の最初のCJK統合漢字は,
“CJK UNIFIED IDEOGRAPH-20000”という名前をもつ。

24.7 ハングル音節文字の名前

  符号位置AC00D7A3のハングル音節文字の名前は,その符号位置の値から,次の計算手順によって導
出する。これらの文字の名前の一覧は,符号表に示さない。
a) ハングル音節文字の符号位置の数を得る。これは,h1h2h3h4の形式である。ここで,数h1h2h3h4は,AC00

――――― [JIS X 0221 pdf 47] ―――――

                                                                                             43
                                                                X 0221 : 2014 (ISO/IEC 10646 : 2012)
    D7A3の範囲にある。
b) それぞれ,16進数h1,h2,h3及びh4と値が等しい10進数d1,d2,d3及びd4を導出する。
c) 文字の指標Cを,次の式によって計算する。
                        C=4 096×(d1−10)+256×(d2−12)+16×d3+d4
d) 音節要素(syllablecomponent)の指標I,P及びFを次の式によって計算する。
                        I=C/588                    (0≦I≦18)
                        P=(C%588)/28               (0≦P≦20)
                        F=C%28                     (0≦F≦27)
      ここに,“/”は,整数除算(すなわち,x/yは,商の整数部分とする。)を示し,“%”は,剰余演算
    (すなわち,x%yは,整数除算x/yの剰余とする。)を示す。
e) 三つの指標I,P及びFに対応するラテンの文字列を,それぞれ表5の欄2,欄3及び欄4から得る(I
    =11及びF=0に対応する文字列は,空である。)。この三つの文字列を左から右の順に連結し,音節
    名(syllable-name)の文字列を得る。
f)  このとき,符号位置h1h2h3h4の文字の名前は,次のとおりとする。
                        HANGUL SYLLABLE s-n
      ここに,“s-n”は,e)で得られた音節名を示す。
      例 符号位置D4DEの文字では,次のようになる。
                        d1=13,d2=4,d3=13,d4=14
                        C=10462
                        I=17,P=16,F=18
            対応するラテンの文字列は,P,WI及びBSである。音節名は,PWIBSであり,文字の名前
          は,HANGUL SYLLABLE PWIBSである。
      それぞれのハングル音節文字に対して,短い注記を規定し,附属書Rにそれぞれの文字名とともに
    示す。この注記は,そのハングル音節文字のラテン文字への,代替の翻字からなる。これらも,また,
    その符号位置の数値から,次の同様の計算手順によって導き出される。
g) 上のa)   d)の段階を実行する。
h) 表5の欄5,欄6及び欄7から,I,P及びFの三つの指標に相当するラテンの文字列を得る(I=11
    とF=0とに対応する文字列は,空である。)。この三つの文字列を左から右の順に連結し,一つの文
    字列を得る。
      例 符号位置D4DEの文字では,次のようになる。
                        d1=13,d2=4,d3=13,d4=14
                        C=10 462
                        I=17,P=16,F=18
            対応するラテンの文字列は,ph,wi及びpsである。追加情報は,phwipsとなる。
    注記 附属書Rにハングル音節の名前を添付ファイルで参照できるようにしてある。

――――― [JIS X 0221 pdf 48] ―――――

44
X 0221 : 2014 (ISO/IEC 10646 : 2012)
                         表5−ハングル音節文字の名前及び追加情報の要素
                               音節名の要素                       注記の要素
         指標の数値  Iの文字列  Pの文字列  Fの文字列   Iの文字列  Pの文字列  Fの文字列
         0          G           A                     k           a
         1          GG          AE         G          kk          ae         k
         2          N           YA         GG         n           ya         kk
         3          D           YAE        GS         t           yae        ks
         4          DD          EO         N          tt          eo         n
         5          R           E          NJ         r           e          nc
         6          M           YEO        NH         m           yeo        nh
         7          B           YE         D          p           ye         t
         8          BB          O          L          pp          o          l
         9          S           WA         LG         s           wa         lk
         10         SS          WAE        LM         ss          wae        lm
         11                     OE         LB                     oe         lp
         12         J           YO         LS         c           yo         ls
         13         JJ          U          LT         cc          u          lth
         14         C           WEO        LP         ch          weo        lph
         15         K           WE         LH         kh          we         lh
         16         T           WI         M          th          wi         m
         17         P           YU         B          ph          yu         p
         18         H           EU         BS         h           eu         ps
         19                     YI         S                      yi         s
         20                     I          SS                     i          ss
         21                                NG                                ng
         22                                J                                 c
         23                                C                                 ch
         24                                K                                 kh
         25                                T                                 th
         26                                P                                 ph
         27                                H                                 h
         注記1 表5に示す音節名の要素のI及びFの文字列は,符号表の11001112(110Bを除く)及
                び11A811C2の範囲のハングル字母の名前の後に注記として示されているハングル字
                母の短い名前に対応する。短い名前は,これらのハングルの音訳である。
         注記2 音節名の要素のI及びFの文字列は,ISO/TR 11941:1996 Information and documentation−
                Transliteration of Korean script into Latin charactersの方法Iに基づく。同じ表の注記の要素
                のI及びFは,ISO/TR 11941の方法IIに基づく。音節名の要素及び注記の要素のPの文
                字列は,ISO/TR 11941に基づく。ISO/TR 11941は,2000年7月4日に大韓民国文化観光
                部が発行したRevised Romanization of Korean script(改訂版韓国語用字のローマ字表記)
                とは,異なっている。

25 名前付きUCS列識別子

  名前付きUCS列識別子(以下,“名前付きUSI”又は“NUSI”という。)は,文字の名前と同じ規則に
従った名前を伴うUSIとする。名前付きUCS列識別子の名前付けの規則は,箇条24に従う。
    注記1 UCS列識別子に名前を付ける目的は,一まとまりとして扱う文字の列を特定することであ
            る。例えば,フォント又はキーボードの,特定の種類の処理,規格による参照又はレパート

――――― [JIS X 0221 pdf 49] ―――――

                                                                                             45
                                                                X 0221 : 2014 (ISO/IEC 10646 : 2012)
            リの列挙である。
  各NUSIに対応するUCS列識別子の値は,正規形NFC(箇条21参照)によって決定される符号化表現
を使って記述される。それぞれの名前付きUCS列識別子は,一意の符号化表現をもつ。この規格に含まれ
る全ての名前付きUCS列識別子は,添付ファイルで参照できる。他の全ての名前付き列は,定義されてい
ない。
  添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを
使用する。ファイルの先頭の5行は,ヘッダであり,その後に名前付きUCS列識別子が示される。各行は,
次の情報がTAB文字で区切られた項目で構成されている。
− 項目1は,6.6で定義された文法によるUCS列である。
− 項目2は,NUSIの名前である(箇条24の規則に従う。)。
  参照ファイルは,添付ファイル“NUSI.txt”である。
    注記2 (対応国際規格の注記2は,この規格では該当しないため不採用とした。)
    注記3 この国際規格によって許容される全ての名前付きUCS列識別子は,ユニコード附属書 UAX
            #34, Unicode Named Character Sequences: https://www.unicode.org/reports/tr34/tr34-11.htmlでも示
            される。

26 基本多言語面の構造

  基本多言語面の概観を図7に示し,区0033のそれより詳細な概観を図8に示す。
  基本多言語面には,表音文字,音節文字及び漢字の用字で一般的に用いる文字並びに様々な記号及び数
字が含まれる。

――――― [JIS X 0221 pdf 50] ―――――

次のページ PDF 51

JIS X 0221:2014の引用国際規格 ISO 一覧

ISO/IEC 10646:2012(IDT)

JIS X 0221:2014の国際規格 ICS 分類一覧

35 : 情報技術.事務機械　>　35.040 : 文字セット及び符号化

JIS X 0221:2014の関連規格と引用規格一覧

規格番号: 規格名称
JISX0202:1998: 情報技術―文字符号の構造及び拡張法
JISX0211:1994: 符号化文字集合用制御機能