この規格ページの目次
59
X 4151-1992
ps+,文書文字集合,
ps+,容量集合,
ps+,具象構文範囲,
ps+,具象構文,
ps+,機構使用,
ps+,応用特有情報,ps*,mdc −(171)
SGML宣言の最小表記の最小データは, “ISO 8879 : 1986” とする。
SGML宣言には,文書の残りで使う具象構文が何であれ,規格参照具象構文を使わなければならない。
SGML宣言の引数及び注釈には,(規格参照具象構文での)マーク文字及び最小データ文字だけを使う
ことができる。
ただし,文字参照の置換文には,マーク文字又は最小データ文字以外のSGML文字を使っても差し支え
ない。
備考1. SGML宣言は,機械処理ばかりでなく,(印字して)人間の役に立てることも意図している。
文書の受け手は,SGML宣言を見て,システムがその文書を“そのまま”処理できるか,文
字変換などの機械的な変換が必要(例えば,文書マーク機構や別の区切り子集合を使ってい
る。)か,更に変換に人手をかける必要がある(例えば,文書型機構又は別の容量集合を使っ
ている。)かどうかを判断することができる。
2. “Þ” といった文字参照は,その置換文がマーク文字又は最小データ文字以外になるもの
の,それ自身はマーク文字及び最小データ文字でできているので,SGML宣言の中でも正当
である。
3. 実体参照は,SGML宣言の中には(まだ一つも実体の宣言を行っていないので)書くことが
できない。
12.1 文書文字集合
文書文字集合 =“CHARSET”,ps+,文字集合記述 −(172)
文書文字集合の文字集合記述には,重要なSGML文字それぞれについて,固有のビット組合せの符号化
表現を含めておかなければならない。
備考 文書に二つの具象構文を使う場合,その二つの具象構文のマーク文字すべてが重要なSGML文
字となる。
文書を新しい文字集合に変換するに際しては,この引数の中の文字番号及び文書の中に現れる文字番号
を使った文字参照を変更しなければならない。
備考 文書を機械処理にかける前に,そのシステム文字集合に変換しておくのは,文書の受け手の責
任とする。これに関する情報の交換には,次の(1)(2)の二つの方式がある。
(1) その文字集合が規格によるもの,登録してあるもの又は名前や番号などの識別子で参照でき
るものであれば,その識別子を文書の受け手に通知すればよい。この通知は,その文書とは
別に渡すことになる。例えば,文書交換を行うデータ流の一部を利用するとか,その他の媒
体(おそらくは,電子的でないもの)を利用するとかといった方法が使える。
(2) そうでない文字集合では,SGML宣言を人間が読める形で渡せばよい。
12.1.1 文字集合記述
文字集合記述 =基本文字集合,ps+,文字集合区分,
(ps+,基本文字集合,
――――― [JIS X 4151 pdf 66] ―――――
60
X 4151-1992
ps+,文字集合区分)* −(173)
文字集合記述の中の文字集合区分は,全体として,文字集合のすべての文字番号を重複なく記述してい
なければならない。
12.1.1.1 基本文字集合
基本文字集合 =“BASESET”,ps+,公開識別子 −(174)
基本文字集合の公開識別子は,その文字集合区分の基本とする基本集合を人間が識別するための識別子
とする。
備考 例えば,規格名称,登録番号,標号などの,想定できるその文書の受け手が理解できるもの。
他機構引数に “FORMAL YES” と指定してあれば,この公開識別子は,公的公開識別子であってその公
開文種別が “CHARSET” であるものでなければならない。
12.1.1.2 文字集合区分
文字集合区分 =“DESCSET”,(ps+,文字記述) + −(175)
文字記述 =先頭文字番号,ps+,文字個数,ps+, −(176)
(基本集合文字番号|最小表記| “UNUSED”)
先頭文字番号 =文字番号 −(177)
基本集合文字番号 =文字番号 −(178)
文字個数 =数 −(179)
文字集合区分は,文字集合の文字のうち,そこに指定した先頭文字番号から始まる文字個数だけの文字
に,次の(1)(3)のとおりに意味を与える。
(1) 基本集合文字番号が指定してある場合,それぞれの文字は,基本集合の中のその文字番号から始まる
一連の文字それぞれがもつ意味をもつ。
備考 その一連の文字の中に,基本集合で意味をもたないものがあれば,それに対応する文字も文字
集合の中で意味をもたない。
(2) 最小表記が指定してある場合,それぞれの文字は,その最小表記に記述してあるとおりの意味をもつ。
備考 最小表記による指定は,基本集合の中に望む意味をもつ文字がない場合だけに使うことが望ま
しい。
(3) “UNUSED” が指定してある場合,それぞれの文字は,意味をもたない。
12.1.2 非SGML文字の認定
文字集合区分で意味をもたないと指定した文字は,非SGML文字と認定し,
NONSGMLに加える。
備考 文書を受け取って変換を施した後でも,その新しい文書文字集合が制御文字に別の符号化表現
を対応付けていれば,非SGML文字の種類が違ってくることがある。
回避文字は,それが重要なSGML文字でない限り,非SGML文字とする。
備考1. 表8及び表9では,文字番号9,10及び13の文字が,機能文字であることから,回避文字であり
ながら非SGML文字には割り当ててない。
2. 文書に二つの具象構文を使う場合,その両方の回避文字がこの規定の対象となる。
12.2 容量集合
容量集合 =“CAPACITY”,ps+,
((”PUBLIC”,ps+,公開識別子)|
(”SGMLREF”,(ps+,名前,ps+,数)+)) −(180)
容量集合の中に指定する名前は,表5に示す容量値の名前でなければならない。その名前の容量値には,
――――― [JIS X 4151 pdf 67] ―――――
61
X 4151-1992
指定した数が表す値を与える。
容量集合で値を与えなかった容量値は,規格参照容量集合での値を与える。
備考 見出し語 “SGMLREF” は,公開識別子を使わない場合に文脈上必すとなる(したがって,冗長
なものである。)が,これはSGML宣言を読む人に対するこの規定の備忘となっている。
それぞれの容量値は,文書が超えてはならない限界を示す。その値は,一時に処理する可能性がある並
列実現値及び連結処理の連鎖での最大の要求にも耐えられるものでなければならない。
“TOTALCAP” に割り当てる値は,個々の容量値の最大のもの以上でなければならない。
他機構引数で “FORMAL YES” と指定してある場合,容量集合の公開識別子は,公的公開識別子であっ
て,その公開文種別が “CAPACITY” となっているものでなければならない。
12.3 具象構文範囲
この引数は,SGML宣言で指定する具象構文を文書全体に適用するかどうかを指定
する。言い換えれば,前書きに対して規格参照具象構文が使えるかどうかを指定する。
具象構文範囲 =“SCOPE”,ps+,
(“DOCUMEM” | “INSTANCE”) −(181)
具象構文範囲での見出し語の意味は,次の(1)(2)のとおりとする。
(1) OCUMENT 指定する具象構文を,文書全体に適用する。
(2) NSTANCE 前書きには規格参照具象構文を適用し,文書実現値集合には指定する具象構文を適用す
る。
“INSTANCE” を指定した場合,SGML宣言で指定する具象構文は,次の(3)(5)の条件を満たしていな
ければならない。
(3) その構文参照文字集合が,規格参照具象構文のものと同じである。
(4) その重要なSGML文字が,前書きの終わりと文書実現値集合の始まりとを区別できるものとなってい
る。
(5) その量集合に指定した値が,規格参照量集合での値以上になっている。
12.4 具象構文
具象構文 = “SYNTAX”, ps+,
(公開具象構文|
(回避文字番号指定,
ps+,構文参照文字集合,
ps+,機能文字指定,
ps+,命名方式,ps+,区切り子集合,
ps+,予約名使用,ps+,量集合)) −(182)
けん盤の能力,表示装置の能力,用いる自然言語の特性などから変形具象構文が必要になる場合を除け
ば,規格参照具象構文又は核具象構文を使うことが望ましい。
12.4.1 公開具象構文
公開具象構文 = “PUBLIC”,ps+,公開識別子,
(ps+, “SWITCHES”,
(ps+,文字番号,ps+,文字番号)+)・ −(183)
公開具象構文での見出し語 “SWITCHES” は,その公開識別子で指定した具象構文のマーク文字の幾つ
かを切り替えることを示す。
公開具象構文の中の文字番号は,その公開識別子で指定した公開具象構文の構文参照文字集合の中の,
――――― [JIS X 4151 pdf 68] ―――――
62
X 4151-1992
Digit,LC Letter又はUC Letter以外の文字の文字番号でなければならない。文字番号の対は,実現値の中
にその第1の文字番号の文字が現れたとき,その第2の文字番号の文字で代替することを指定する。
備考 “SWITCHES” を使って得た具象構文は,明示的に指定した具象構文と同じく,この規格の要件
を満たしていなければならない。
他機構引数で “FORMAL YES” と指定してある場合,その公開識別子は,公的公開識別子であって,そ
の公開文種別が “SYNTAX” となっているものでなければならない。
12.4.2 回避文字番号指定
回避文字番号指定 = “SHUNCHAR”,ps+,
(“NONE” |
((”CONTROLS” |文字番号),
(ps+,文字番号)*)) −(184)
回避文字番号指定での見出し語の意味は,次の(1)(2)のとおりとする。
(1) ONE 回避文字がないことを指定する。
(2) ONTROLS システム文字集合で制御文字となっている文字及び図形文字でない文字すべてが回避文
字であることを指定する。
回避文字番号指定の中に指定した文字番号の文字は,すべて回避文字とする。
備考 この引数に現れた文字番号は,文書を別の文字集合に変換する場合に変更する必要がない(し
たがって,変更しないことが望ましい。)。
12.4.3 構文参照文字集合
構文参照文字集合 =文字集合記述 −(185)
構文参照文字集合には,すべての重要なSGML文字に対する,固有のビット組合せの符号化表現を記述
しておかなければならない。
12.4.4 機能文字指定
機能文字指定 = “FUNCTION”,
ps+, “RE”,ps+,文字番号,
ps+, “RS”,ps+,文字番号,
ps+, “SPACE”,ps+,文字番号,
(ps+,追加機能,ps+,機能種別,ps+,文字番号)* −(186)
追加機能 =名前 −(187)
機能種別 =“FUNCHAR” | “MSICHAR” | “MSOCHAR” | −(188)
“MSSCHAR” | “SEPCHAR”
追加クラスでの見出し語は,次の(1)(5)のとおりに,追加機能の種別を指定する。
(1) UNCHAR 休止機能文字
(2) SICHAR マーク認知開始文字
(3) SOCHAR マーク認知終了文字
(4) SSCHAR マーク認知抑制文字
(5) EPCHAR 分離子文字
機能文字指定は,それぞれの機能文字にその文字番号を割り当てる。
同じ文字番号を2個以上の機能文字に割り当ててはならない。
追加機能に割り当てた文字番号は, “RE”, “RS”, “SPACE” 又は他の追加機能に割り当ててはならな
――――― [JIS X 4151 pdf 69] ―――――
63
X 4151-1992
い。
“MSOCHAR” を指定した場合, “MSICHAR” も指定しなければならない。
備考 符号拡張を使う場合,シフト文字をマーク認知抑制文字とすれば,区切り子の誤った認知を避
けることができる。ただし,装置独立性を保つために実体参照を使うことだけはできなくなる。
12.4.5 命名方法
命名方法 = “NAMING”,
ps+, “LCNMSTRT”, ps+,引数表記,
ps+, “UCNMSTRT”, ps+,引数表記,
ps+, “LCNMCHAR”, ps+,引数表記,
ps+, “UCNMCHAR”, ps+,引数表記,
ps+, “NAMECASE”,
ps+, “GENERAL”, ps+,(“NO” | “YES”),
ps+, “EMITY”, ps+,(“NO” | “YES”) −(189)
命名方法での見出し語の意味は,次の(1)(5)のとおりとする。
(1) CNMSTRT その引数表記の中の文字(があれば,それ)をLCNMSTRTに加える。
(2) CNMSTRT その引数表記の中の文字(があれば,それ)を, “LCNMSTRT” の引数表記の中の対
応する位置にある文字の大文字として,UCNMSTRTに加える。
(3) CNMCHAR その引数表記の中の文字(があれば,それ)をLCNMCHARに加える。
(4) CNMCHAR その引数表記の中の文字(があれば,それ)を, “LCNMCHAR” の引数表記の中の
対応する位置にある文字の大文字として,UCNMCHARに加える。
(5) AMECASE 大文字への代替を行うかどうかを指定する。 “EMITY” は実体参照及び実体名に対す
る指定を行い, “GENERAL” はその他の名前,名前字句,数字句及び区切り子に対
する指定を行う。
(a) ES LC Letterの文字は対応するUC Letterの文字で代替し,LCNMSTRT又はLCNMCHARの文字は
対応するUCNMSTRT又はUCNMCHARの文字で代替する。
(b) O 大文字への代替を行わない。
名前文字の大文字は,その小文字と同じであってもよい。
LCNMCHAR,UCNMCHAR,LCNMSTRT又はUCNMSTRTに加える文字は,LC Letter,UC Letter,Digit,
RE,RS,SPACE又はSEPCHARであってはならない。
LCNMCHAR又はUCNMCHARに加えた文字は,LCNMSTRT又はUCNMSTRTに加えてはならない。
LCNMCHARの文字の個数とUCNMCHARの文字の個数とは,同じでなければならない。LCNMSTRT
の文字の個数とUCNMSTRTの文字の個数とは,同じでなければならない。
12.4.6 区切り子集合
区切り子集合 = “DELIM”,
ps+,一般区切り子,ps+,短縮参照区切り子 −(190)
区切り子又は文脈依存区切り子は,他の区切り子及び同じ認知様相で認知できる文脈依存区切り子とそ
の文字列が違っていなければならない。
備考 認知様相CXTでは,別の区切り子機能が同じ文字列になっていてもよい。ただし,それらの文
脈依存区切り子が一意に認知できなければならない。
名前開始文字又はDigitを区切り子の文字列の中に使うことは推奨しない。
――――― [JIS X 4151 pdf 70] ―――――
次のページ PDF 71
JIS X 4151:1992の引用国際規格 ISO 一覧
- ISO 8879:1986(MOD)
- ISO 8879:1986/AMENDMENT 1(MOD)
JIS X 4151:1992の国際規格 ICS 分類一覧
- 35 : 情報技術.事務機械 > 35.240 : 情報技術(IT)の応用 > 35.240.30 : 情報,ドキュメンテーション及び出版業務におけるITの応用
JIS X 4151:1992の関連規格と引用規格一覧
- 規格番号
- 規格名称
- JISX0202:1998
- 情報技術―文字符号の構造及び拡張法
- JISX0208:1997
- 7ビット及び8ビットの2バイト情報交換用符号化漢字集合