134
X 4151-1992
例 <p>公式
<q><formura notation=EQN>E equals m
times c squared</formura></q>
は,エネルギEが質量mと速度cの自乗とによることを表している。</p>
3. 変形具象構文 規格参照具象構文での回避文字番号指定及び機能文字指定の引数は,できる限り広い
範囲のSGMLシステム間で情報交換が間違いなく行われることを目指した設定にしてある。専用の文書処
理装置を除けば,文書処理応用システムの多くは,応用システムから制御しようのない操作系 (operating
system) の上で稼働する。その操作系は,システム方式や情報交換についてのISO規格に必ずしも適合し
ていないから,SGMLでデータとして扱いたいビット組合せを制御文字として解釈してしまって,結果と
して異常な動作を引き起こすことがある。このような誤りを防ぐため,規格参照具象構文では,原則とし
て,何かの制御に使われ得るビット組合せを文書の中に直接書けないようにしてある。許しているのは,
普遍的な機能文字4種類だけである。
しかしながら,国語によっては更に幾つかの機能文字が必要になる。それらを使って符号拡張を行い,
文章を入力したり改定したりする際にけん盤及び表示装置が文字集合を切り替えなければならないからで
ある。3.では,SGML実体で符号拡張ができるようにするための機能文字も許して,二つの公開変形具象
構文を定義する。いずれも,その機能文字及び追加になる図形文字が誤ってマークと解釈されるおそれが
ない設定になっている。
3.1 多符号具象構文 多符号基本具象構文は,参考5図1に示すSGML宣言の具象構文引数のとおりと
する。その公開識別子は,次のとおりとする。
”ISO 8879-1986//SYNTAX Multicode Basic//EN”
多符号核具象構文は,その “SHORTREF” 引数が “NONE” となっていることを除いて,多符号基本具
象構文と同じとする。その公開識別子は,次のとおりとする。
”ISO 8879-1986//SYNTAX Multicode Core//EN”
これらの構文では,G0集合にあるときだけマークを認知する。G1集合,G2集合又はG3集合の呼出し
は,マークの認知を抑制する機能文字(MSOCHAR又はMSSCHAR)で始まるからである。
LS0機能は,G0集合を呼び出すとともに,MSICHARの機能によってマークの認知を再開させる。マー
クの認知を再開させるには,LS0は,エスケープシーケンスに続けて書いておかなければならない。
備考 JIS X 0202 (ISO 2022) を支援する装置及びJIS X 0202 (ISO 2022) を支援しない装置を混合し
て使うことのできる装置独立符号拡張の方法は,参考6の3.で述べる。
参考 マークの再開は,MSOCHARのLS1,又はLS1R,LS2,LS2R,LS3及びLS3Rのようにエスケ
ープで行われる。
参考5図1 多符号基本具象構文
SYNTAX
SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18 19 20 21 22 23 24 25 26 27 28 29 30 31 127 255
BASESET ”ISO 646-1983//CHARSET
International Reference Version (IRV) //ESC 2/5 4/0”
DESCSET 0 14 0
14 1 ”LS0 in ISO 2022”
15 1 ”LS1 in ISO 2022”
――――― [JIS X 4151 pdf 141] ―――――
135
X 4151-1992
16112 16
128 14 UNUSED
142 1 ”SS2 in ISO 2022”
143 1 ”SS3 in ISO 2022”
144112 UNUSED
FUNCTION RE 13
RS 10
SPACE 32
TAB SEPCHAR 9
−−図形種目符号拡張機能−−
−−G0集合を列マークへ呼び出した状態でだけマークを認識する。−−
ESC MSOCHAR 27−−エスケープ−−
LS0 MSICHAR 15−−ロッキングシフト0(G0集合の呼出し)−−
LS1 MSOCHAR 141−−ロッキングシフト1(G1集合の呼出し)−−
−−LS1R,LS2,LS2R,LS3及びLS3Rは,−−
−−エスケープシーケンスから始まる。−−
SS2 MSSCHAR 142−−シングルシフト2(G2集合の呼出し)−−
SS3 MSSCHAR 143−−シングルシフト3(G3集合の呼出し)−−
NAMING LCNMSTRT ””
UCNMSTRT ””
LCNMCHAR ”−.” −−英小文字のハイフン及びピリオドは,−−
UCNMCHAR ”−.” −−英大文字 (45 46) と同じとする。 −−
NAMECASE GENERAL YES
ENTITY NO
DELIM GENERAL SGMLREF
SHORTREF SGMLREF
NAMES SGMLREF
QUANTITY SGMLREF
備考 参考5図1において,注釈の部分は,ISO 646の文字で記述すべきであるが,読者の理解を助
けるために,ここでは日本文字を使用している。
4. 実体集合 何万種類もの図形文字が出版に用いられているが,そのうちの比較的少数のものが規格と
しての符号化文字集合に取り入れられているにすぎない。符号化表現の規格があっても,けん盤から入力
しにくかったり,その文字の望む図形表示を表示装置に出せなかったりすることもある。
これらの障壁を乗り越えてSGML文書を間違いなく交換する一助として,4.では,広く使われている特
殊文字の幾つかのための文字実体を定義する。これらの文字集合は,符号化文字集合の国際規格として制
定されたり提案されたりしているもの及び産業界・専門分野で使用されているものに基づいている。
備考 実体集合は,文字集合に比べると,一般に高位の構成体を扱うから,どうしても大きくなり反
復的になる。例えば,実体集合では,アクセント記号付きのラテン文字それぞれに固有の実体
を設けているが,文字集合ではこれらを文字とアクセント記号との組合せで表現する。これら
の実体集合は,新しい文字集合規格への要求としてしてはならない。
4.1 設計方針 この参考に定義する公開実体集合についての設計方針を示す。
4.1.1 宣言の書式 それぞれの実体の定義は,その主旨だけを定める。その実体文は,実体名を大括弧で
くくったものだけからなる。その後には,その記号を解説した注釈があるだけで,装置に依存した符号化
表現は書いていない。
例 <!ENTITY frac78 SDATA ”[frac78]” −−=fraction seven-eights−−>
――――― [JIS X 4151 pdf 142] ―――――
136
X 4151-1992
上の例のように,注釈の中に等号があるときは,その解説はISO 6937によるものである。ISO 6937に
は,その文字の図形表現がある。
次のように,注釈の中に斜線に続けて名前(長さは問わない。)が書いてある例のときは,その名前は,
米国数学会出版のMathSci(1)の中の図形表現の名前である。
例 <!ENTITY frown SDATA ”[frown]” −−/frown R : down curve−−>
注(1) athSci-an expansion of mathfile, the American Mathematical Society, 201 Charles St., Providence, RI
02940, USA (1985-04-26).
注釈には,ISO 6937による解説及び1個以上のMathSciによる名前が任意個並ぶ。
備考 MathSciでは,名前の前にくるのは斜線ではなく,逆斜線である。
直前の例のように,注釈の中にコロンを付けた英大文字(1字)を書くことがある。この英字は,実体
の表す文字が数学の版組で普通の文字とは違った,次のとおりの扱いを受けることを示す。
活字 扱い
A 矢印関係 [Relation (arrow) ]
B 二値演算子 (Binary operator)
C 終了区切り子 (Closing delimiter)
L 多数演算子 (Large operator)
N 否定関係 [Relation (negated) ]
O 開始区切り子 (Opening delimiter)
P 句読点 (Punctuation)
R 関係 (Relation)
4.1.2 対応する表示実体集合 システムは,その対象とする出力装置用の表示実体集合を提供する。この
とき,それぞれの実体文を,望む図形をもたらす処理指令又は文字列で置き換える。もちろん,実体名と
注釈とは,そのまま残す。
例 ISO 6937/2の機能をもたない出力装置用の表示実体
<!ENTITY frac78 SDATA ”7/8” −−=fraction seven-eighths−−>
ISO 6937/2の機能をもつ8単位符号出力用の表示実体
<!ENTITY frac78 SDATA ”ß” −−=fraction seven-eighths−−>
写植機を使った書式付けシステムでの表示実体
<!ENTITY frac78 SDATA ”・bf pi;・pf” −−=fraction seven-eighths−−>
備考 実体宣言は,すべて見出し語 “SDATA” を使う。これは,その実体文にシステム固有の文字デ
ータがあって他の出力装置又は応用を対象とする場合に書換えがいる可能性があることを示唆
するためである。
4.1.3 実体名 実体名は,英語に基づいている。覚えやすいことを第一義として,論理的・系統的な省略
法を一貫して用いている。
備考 他の言語向きには,翻訳してもよい。
実体名は,大文字・小文字を区別する。名前の中の大文字・小文字は,その表す文字の大文字・小文字
の別,二重線にするかしないかの別など,幾つかの約束を示す。
実体名は,どれも6文字以下であり,英字・数字だけしか使っていない。したがって,様々な具象構文
にそのまま使うことができる。
備考 頻繁に使うことからもっと短い名前が望ましい場合には,その文書の中で短い名前を定義すれ
ばよい。
――――― [JIS X 4151 pdf 143] ―――――
137
X 4151-1992
文字の中には,応用によって別の意味合いをもつものがある。こうしたものについては,複数の実体が
宣言してある。
備考 特定の文書の中で,別な名前にしたほうが意味が通りやすいのであれば,その文書の中で定義
し直せばよい。
4.1.4 実体集合の組織 実体集合は,原理的には,ISO 6937の文字集合の構成を反映する形に組織して
ある。つまり,似通った文字をできるだけまとめてある。この組織の仕方は,多くの応用にとって最適と
はいえない。それぞれの応用では,幾つもの集合から実体を組み合わせることが必要になるからである。
適合SGMLシステム及び適合SGML応用は,ここで定義する公開実体集合の全部又は一部を,いかなる
形で複製して利用しても差し支えない。ただし,その複製物には,すべて,ISOの著作権表示(複製許諾
表示を含む。)を行わなければならない。特に,公開集合の幾つかから複製して新しい集合を作った場合に
は,その新しい集合にISOの著作権表示を行わなければならない。
備考 複数の公開集合から同じ実体名をもつものをもってきて文書に使う必要があるときは,その文
書の中で別の名前を宣言して与えることが望ましい。
4.2 アルファベット文字 ここでの文字実体集合では,実体名の命名に次の一貫した方式をとる。文字
そのもの又はその字訳に続けて,必要に応じてアクセントの略記及び非ラテン文字の指示を置く。実体名
での文字を大文字としたときは,その実体が表す文字が大文字形であることを示す。
4.2.1 ラテン文字 次の実体集合は,UC Letter及びLC Letterに入っていない,西欧言語でのラテン文字
からなる。
<!−− (C) nternational Organization for Standardization 1986
Permission to copy in any form is granted for use with
conforming SGML systems and applications as defined in
ISO 8879, provided this notice is included in all copies.
−−>
<!−−文字実体集合の典型的な呼出し :
<!ENTITY % ISOlat1 PUBLIC
”ISO 8879-1986//ENTITIES Added Latin 1//EN”>
%ISOlat1;
−−>
<!ENTITY aacute SDATA ”[aacute ]” −−=small a, acute accent−−>
<!ENTITY Aacute SDATA ”[Aacute ]” −−=capital A, acute accent−−>
<!ENTITY acirc SDATA ”[acirc ]” −−=small a, circumflex accent−−>
<!ENTITY Acirc SDATA ”[Acirc ]” −−=capital A, circumflex accent−−>
<!ENTITY agrave SDATA ”[agrave ]” −−=small a, grave accent−−>
<!ENTITY Agrave SDATA ”[Agrave ]” −−=capital A, grave accent−−>
<!ENTITY aring SDATA ”[aring ]” −−=small a, ring−−>
<!ENTITY Aring SDATA ”[Aring ]” −−=capital A, ring−−>
<!ENTITY atilde SDATA ”[atilde ]” −−=small a, tilde−−>
<!ENTITY Atilde SDATA ”[Atilde ]” −−=capital A, tilde−−>
<!ENTITY auml SDATA ”[auml ]” −−=small a, dieresis or umlaut mark−−>
<!ENTITY Auml SDATA ”[Auml ]” −−=capital A, dieresis or umlaut mark−−>
――――― [JIS X 4151 pdf 144] ―――――
138
X 4151-1992
<!ENTITY aelig SDATA ”[aelig ]” −−=small ae diphthong (ligature) −−>
<!ENTITY AElig SDATA ”[AElig ]” −−=capital AE diphthong (ligature) −−>
<!ENTITY ccedil SDATA ”[ccedil ]” −−=small c, cedilla−−>
<!ENTITY Ccedil SDATA ”[Ccedil ]” −−=capital C, cedilla−−>
<!ENTITY eth SDATA ”[eth ]” −−=small eth, Icelandic−−>
<!ENTITY ETH SDATA ”[ETH ]” −−=capital Eth, Icelandic−−>
<!ENTITY eacute SDATA ”[eacute ]” −−=small e, acute accent−−>
<!ENTITY Eacute SDATA ”[Eacute ]” −−=capital E, acute accent−−>
<!ENTITY ecirc SDATA ”[ecirc ]” −−=small e, circumflex accent−−>
<!ENTITY Ecirc SDATA ”[Ecirc ]” −−=capital E, circumflex accent−−>
<!ENTITY egrave SDATA ”[egrave ]” −−=small e, grave accent−−>
<!ENTITY Egrave SDATA ”[Egrave ]” −−=capital E, grave accent−−>
<!ENTITY euml SDATA ”[euml ]” −−=small e, dieresis or umlaut mark−−>
<!ENTITY Euml SDATA ”[Euml ]” −−=capital E, dieresis or umlaut mark−−>
<!ENTITY iacute SDATA ”[iacute ]” −−=small i, acute accent−−>
<!ENTITY Iacute SDATA ”[Iacute ]” −−=capital I, acute accent−−>
<!ENTITY icirc SDATA ”[icirc ]” −−=small i, circumflex accent−−>
<!ENTITY Icirc SDATA ”[Icirc ]” −−=capital I, circumflex accent−−>
<!ENTITY igrave SDATA ”[igrave ]” −−=small i, grave accent−−>
<!ENTITY Igrave SDATA ”[Igrave ]” −−=capital I, grave accent−−>
<!ENTITY iuml SDATA ”[iuml ]” −−=small i, dieresis or umlaut mark−−>
<!ENTITY Iuml SDATA ”[Iuml ]” −−=capital I, dieresis or umlaut mark−−>
<!ENTITY ntilde SDATA ”[ntilde ]” −−=small n, tilde−−>
<!ENTITY Ntilde SDATA ”[Ntilde ]” −−=cacpital N, tilde−−>
<!ENTITY oacute SDATA ”[oacute ]” −−=small o, acute accent−−>
<!ENTITY Oacute SDATA ”[Oacute ]” −−=capital O, acute accent−−>
<!ENTITY ocirc SDATA ”[ocirc ]” −−=small o, circumflex accent−−>
<!ENTITY Ocirc SDATA ”[Ocirc ]” −−=capital O, circumflex accent−−>
<!ENTITY ograve SDATA ”[ograve ]” −−=small o, grave accent−−>
<!ENTITY Ograve SDATA ”[Ograve ]” −−=capital O, grave accent−−>
<!ENTITY oslash SDATA ”[oslash ]” −−=small o, slash−−>
<!ENTITY Oslash SDATA ”[Oslash ]” −−=Capital O, slash−−>
<!ENTITY otilde SDATA ”[otilde ]” −−=small o, tilde−−>
<!ENTITY Otilde SDATA ”[Otilde ]” −−=capital O, tilde−−>
<!ENTITY ouml SDATA ”[ouml ]” −−=small o, dieresis or umlaut mark−−>
<!ENTITY Ouml SDATA ”[Ouml ]” −−=capital O, dieresis or umlaut mark−−>
<!ENTITY szlig SDATA ”[szlig ]” −−=small sharp s, German (sz ligature) −−>
<!ENTITY thorn SDATA ”[thorn ]” −−=small thorn, Icelandic−−>
<!ENTITY THORN SDATA ”[THORN ]” −−=capital THORN, Icelandic−−>
<!ENTITY uacute SDATA ”[uacute ]” −−=sma11 u, acute accent−−>
――――― [JIS X 4151 pdf 145] ―――――
次のページ PDF 146
JIS X 4151:1992の引用国際規格 ISO 一覧
- ISO 8879:1986(MOD)
- ISO 8879:1986/AMENDMENT 1(MOD)
JIS X 4151:1992の国際規格 ICS 分類一覧
- 35 : 情報技術.事務機械 > 35.240 : 情報技術(IT)の応用 > 35.240.30 : 情報,ドキュメンテーション及び出版業務におけるITの応用
JIS X 4151:1992の関連規格と引用規格一覧
- 規格番号
- 規格名称
- JISX0202:1998
- 情報技術―文字符号の構造及び拡張法
- JISX0208:1997
- 7ビット及び8ビットの2バイト情報交換用符号化漢字集合