JIS X 4081:2002 日本語電子出版検索データ構造

JIS X 4081:2002 規格概要

この規格 X4081は、再生専用形光ディスク(CD-ROM)など書換えをしない媒体を用いた日本語を主とする電子出版物を統一した操作性で検索できるように,次の事項について規定。 a)日本語電子出版物の高速検索を実現するためのデータ構造 b)検索結果を表示するためのデータ構造

JISX4081 規格全文情報

規格番号
JIS X4081 
規格名称
日本語電子出版検索データ構造
規格名称英語訳
Retrieval data structure for Japanese electronic publication
制定年月日
1996年11月20日
最新改正日
2016年10月20日
JIS 閲覧
‐ 
対応国際規格

ISO

国際規格分類

ICS

35.080, 35.240.30, 37.100.99
主務大臣
経済産業
JISハンドブック
‐ 
改訂:履歴
1996-11-20 制定日, 2002-02-20 改正日, 2007-02-20 確認日, 2011-10-20 確認日, 2016-10-20 確認
ページ
JIS X 4081:2002 PDF [28]
X 4081 : 2002

まえがき

  この規格は,工業標準化法に基づいて,日本工業標準調査会の審議を経て,経済産業大臣が改正した日
本工業規格である。これによって,JIS X 4081 : 1996は改正され,この規格に置き換えられる。
今回の改正では,新しい技術の取込みを中心に見直し,機能拡張の規格書への反映をさせる改正を行っ
た。

(pdf 一覧ページ番号 )

――――― [JIS X 4081 pdf 1] ―――――

                                       日本工業規格(日本産業規格)                             JIS
X 4081 : 2002

日本語電子出版検索データ構造

Retrieval data structure for Japanese electronic publication

序文 この規格は,1996年に制定されたJIS X 4081について,音声・画像技術やインターネット技術の電
子出版機能としての取込みを中心に見直しを行い,実装されている機能拡張の実情に対応させて改正した
規格である。
1. 適用範囲 この規格は,再生専用形光ディスク (CD-ROM) など書換えをしない媒体を用いた日本語
を主とする電子出版物を統一した操作性で検索できるように,次の事項について規定する。
a) 日本語電子出版物の高速検索を実現するためのデータ構造
− キーワード指定による検索のためのインデックス構造
− メニュー選択のための構造
− 複数種類の検索キーを用いた検索を実現する構造
b) 検索結果を表示するためのデータ構造
− 表示制御のためのコード
− 項目から別の項目を参照するための構造
2. 引用規格 次に掲げる規格は,この規格に引用されることによって,この規格の規定の一部を構成す
る。これらの規格は,その最新版(追補を含む。)を適用する。
JIS X 0201 7ビット及び8ビットの情報交換用符号化文字集合
JIS X 0208 7ビット及び8ビットの2バイト情報交換用符号化漢字集合
3. 定義 この規格で用いる主な用語の定義は,次のとおりとする。
a) 書籍 この規格に従って,電子出版される一まとまりの内容。CD-ROMなどの媒体には,一まとまり
が複数個存在する場合がある。
b) 採録書籍名管理ファイル 媒体に記録する全書籍に関する管理情報を格納するファイル。旧規格では,
登録としていたが,用語の分かりやすさのため採録に変更した。
c) 書籍ファイル 各種検索方法を含めた,書籍全体を管理する情報及び書籍データ本体を格納するデー
タ群。書籍データ本体,検索方法に関する指標を含め,各検索インデックスの存在位置情報,本文の
位置情報,図版データ位置情報及び書籍定義文字パターン位置情報からなる。
d) バイト 8ビットからなるビット列。
e) ブロック ファイルをファイルの先頭から2 048バイトずつに分割した1区画。

――――― [JIS X 4081 pdf 2] ―――――

2
X 4081 : 2002
f) ブロック番号 ファイルの先頭のブロックを1として,各ブロックに順に付けた番号。各ブロックの
位置を示すために用いる。
g) 2進化10進数 10進数の1けた(桁)を4ビットとして表す数値表現方法。
例 10進数の15の表現 : 0001 0101
10進数の48の表現 : 0100 1000
10進数の7 683の表現 : 0111 0110 1000 0011
この規約の中では,各けた独立で使用する場合がある。その場合は,最上位のけたを1けた目
と呼ぶ。
h) ファイル名用文字 JIS X 0201のラテン文字用図形文字集合の8ビット表現。ファイル名に用いる。
i) 仮名インデックス 本文中の項目を平仮名又は片仮名(以下,両者を合わせて仮名という。)で検索す
るためのインデックス。日本語の読み及び元々仮名で構成される日本語を検索するために用意する。
j) 表記形インデックス 本文中の項目を漢字仮名混じり表現(英字表現を含む。)で検索するためのイン
デックス。日本語一般の表記そのもので検索するために用意する。
k) 前方一致検索 インデックス内のキーワードの先頭から順番にみた部分文字列が検索語として入力さ
れた文字列と一致する場合に,検索が成功したとみなす検索。
l) 後方一致検索 インデックス内のキーワードの末尾から順番にみた部分文字列が検索語として入力さ
れた文字列と一致する場合に,検索が成功したとみなす検索。
m) 条件検索 ある項目に対して,付与された複数のキーワードの組合せで行う検索。
n) 複合検索 検索キーワードをカテゴリごとに分類できる場合に,ある項目をその分類ごとに付与した
キーワードの組合せで行う検索。
o) IS文字 JIS X 0208で定められた符号化文字集合の文字。一つの文字を2バイトで表現する。
P) 書籍定義文字 JIS文字に存在しない文字を書籍ごとにパターンを定義し,使用する表現用の図形文
字。一つの文字を2バイトで表現する。
q) 文字 o)とp)とを合わせたもの。
r) 本文データ内記述子 検索結果を表示するための,改行,字下げ,強調表示,スクロール制御及び関
連項目の参照などの制御タグ。
s) URL (Uniform Resource Locator) インターネット上のアドレス。
t) インライン画像 検索結果の文字列内に表示する画像データ。数式や化学式などの表示に用いる。
4. 使用する値の領域 この規格で使用する各値の領域は,次のとおりとする。
a) IS文字 2121H7426Hを使用。
b) 書籍定義文字 A121HFE7EHを使用。
c) 本文データ内記述子 1F00H1FFFHを使用。
d) 2進化10進数 00H09Hまでの4ビット二つで8ビット構成を使用。けた数を必要とする場合は,1
バイト2けた単位で表現を拡張する。
e) バイナリ値 0000HFFFFHの任意の値。
備考 2121HなどのHは,2121が16進数 (hexadecimal) 表現であることを示している。
5. 表記法
5.1 実体構造の表記法 この規格で規定する各実体構造の表記方法は,次のとおりとする。

――――― [JIS X 4081 pdf 3] ―――――

                                                                                              3
X 4081 : 2002
実体構造の名称 : := 式
式は,構造成分名,接続子,出現指示子及び括弧でくくった式からなる。
5.2 構成成分の表記法 構成成分のデータ表現法及び意味を,次の形式で定義する。
構成成分名(データの型/データ長) 構成成分の意味
構成成分名 : 式に現れた名称と説明とを対応付ける。
データの型 : 記録データ形式を示す。次の表現形式を使用する。
バイナリ値
文字,書籍定義文字,JIS文字
2進化10進数
ファイル名用文字
データ長 : 記録データの長さ。バイト数又はビット数で記述する。
ただし,予備領域は内容をもたないため,データの型は記述せず,データ長だけを( )内に示す。固
定値をもつ成分については,直値表現を用いて示す。バイナリ値は,最上位バイトが先頭にくる記述表現
とする。
5.3 接続子及び出現指示子 接続子及び出現指示子は,次の意味をもつ。
a) 接続子
, 式の構成順に現れなければならない。
| |で区切られたもののうち,いずれか一つが現れなければならない。
& すべてが現れなければならないが,その順序は任意でよい。
← 左に示す構成成分が,右に示す管理情報内に位置情報が記録されていることを示す。
b) 出現指示子
? 任意選択(0回又は1回)
* 任意選択(0回以上の反復)
+ 必す(須)(1回以上の反復)
6. 実体構造
6.1 採録書籍名管理ファイル 当該媒体に記録する書籍に関する管理情報からなる。採録書籍名管理フ
ァイルの構成は,次のとおりとする。
採録書籍名管理ファイル : := 採録書籍数,予備領域1,書籍ファイル管理情報+,書籍ファイル管理拡
張情報+
書籍ファイル管理情報 : := 予備領域2,書籍名称,書籍ディレクトリ名,書籍ファイルディレクトリ
位置,書籍管理情報記録位置,予備領域3
書籍ファイル管理拡張情報 : := 機能種別,書籍ファイル名,予備領域4, 連続再生ファイルディレクト
リ位置,連続再生ファイル名,マルチメディアファイルディレクトリ
位置,マルチメディアデータ種別,マルチメディアファイル1名,圧
縮種別,マルチメディアファイル2名,刷数,予備領域5
マルチメディアデータ種別 : := 予備領域6,データ種別1,データ種別2,データ種別3
圧縮種別 : := 予備領域7,圧縮種別1,圧縮種別2,圧縮種別3
各構成成分のデータ表現法及び意味は,次のとおりとする。
a) 採録書籍名管理ファイルの構成成分のデータ表現法及び意味

――――― [JIS X 4081 pdf 4] ―――――

4
X 4081 : 2002
1) 採録書籍数(バイナリ値/2バイト) 媒体に記録されている書籍数。
2) 予備領域1(14バイト) 将来拡張のための領域
3) 書籍ファイル管理情報(164バイト) 格納される各書籍について,再生システムが利用者に検索
対象として選択させるための情報を示す。データ表現法は,b)による。
4) 書籍ファイル管理拡張情報(164バイト) 格納される音声や動画などのマルチメディアデータを
含む各書籍について,再生システムが利用者に検索対象として選択させるための情報を示す。デー
タ表現法は,c)による。
b) 書籍ファイル管理情報の構成成分のデータ表現法及び意味
1) 予備領域2(2バイト) 実装において定義するための領域。
2) 書籍名称(JIS文字/80バイト) 書籍名称を記録する。再生システムが利用者に検索対象を選択
させるために用いる。
3) 書籍ディレクトリ名(ファイル名用文字/8バイト) 書籍に対応するデータ群が記録されている
ディレクトリ名。このディレクトリに書籍ファイルの存在位置を示す情報を記録する。
4) 書籍ファイルディレクトリ位置(バイナリ値/4バイト) 書籍ディレクトリの媒体上の物理位置
を記録する。必すではないが,再生システムが高速に書籍ファイルの存在位置を獲得するために実
装に依存して記録することができる。省略するときは,4バイトにバイナリ値00Hを記録する。
5) 書籍管理情報記録位置(バイナリ値/2バイト) 書籍ファイルの中の書籍管理情報が記録されて
いる位置。ブロック番号で記録する。
6) 予備領域3(68バイト) 実装において定義するための領域。
c) 書籍ファイル管理拡張情報の構成成分のデータ表現法及び意味
1) 機能種別(バイナリ値/4バイト) 再生に必要な機能を定義する。実装で定義する。
2) 書籍ファイル名(ファイル名用文字/8バイト) 本文データが格納される書籍ファイルのファイ
ル名を示す。
3) 予備領域4(12バイト) 実装の過去の互換を保持するための領域。
4) 連続再生ファイルディレクトリ位置(バイナリ値/4バイト) 連続再生対象ファイルの媒体上の
物理位置を記録する。必すではないが,再生システムが高速に連続再生するファイルの存在位置を
獲得するために実装に依存して記録することができる。省略するときは,4バイトにバイナリ値00H
を記録する。
5) 連続再生ファイル名(ファイル名用文字/8バイト) 連続再生対象のデータが記録されているフ
ァイル名を示す。
6) マルチメディアファイルディレクトリ位置(バイナリ値/4バイト) マルチメディア再生対象フ
ァイルの媒体上の物理位置を記録する。必すではないが,再生システムが高速に連続再生するファ
イルの存在位置を獲得するために実装に依存して記録することができる。省略するときは,4バイ
トにバイナリ値00Hを記録する。
7) マルチメディアデータ種別(バイナリ値/4バイト) マルチメディアファイル名で示すファイル
に記録したデータの種別を記録する。データ表現法は,d)による。
8) マルチメディアファイル1名(ファイル用文字/8バイト) マルチメディアデータが格納される
ファイル名を示す。
9) 圧縮種別(バイナリ値/4バイト) マルチメディアデータ及び本文データの圧縮種別について記
録する。データ表現法は,e)による。

――――― [JIS X 4081 pdf 5] ―――――

次のページ PDF 6

JIS X 4081:2002の国際規格 ICS 分類一覧

JIS X 4081:2002の関連規格と引用規格一覧