ISO/IEC TR 22250-1:2002 情報技術—ドキュメントの説明と処理言語— XMLの正規言語の説明(RELAX)—パート1:RELAXコア | ページ 2

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序文

ISO (国際標準化機構) と IEC (国際電気標準会議) は、世界標準化のための専門システムを形成しています。 ISO または IEC のメンバーである国家機関は、技術活動の特定の分野を扱うために、それぞれの組織によって設立された技術委員会を通じて、国際規格の開発に参加しています。 ISO と IEC の技術委員会は、相互に関心のある分野で協力しています。 ISO および IEC と連携して、政府および非政府の他の国際機関もこの作業に参加しています。情報技術の分野では、ISO と IEC が合同技術委員会 ISO/IEC JTC 1 を設立しました。

国際規格は、ISO/IEC 指令で指定された規則に従って起草されます。 3.

合同技術委員会の主な任務は、国際規格を作成することです。合同技術委員会によって採択された国際規格草案は、投票のために各国の機関に回覧されます。国際規格として発行するには、投票を行う国の機関の少なくとも 75% による承認が必要です。

例外的な状況では、合同技術委員会は、次のいずれかのタイプのテクニカル レポートの発行を提案することができます。

  • タイプ 1: 国際規格の発行に必要なサポートが得られない場合、何度も努力したにもかかわらず、
  • タイプ 2, 主題がまだ技術開発中である場合、またはその他の理由により、国際規格に関する合意の可能性はあるが、すぐには実現できない場合。
  • タイプ 3 は、合同技術委員会が、国際規格として通常公開されているものとは異なる種類のデータを収集した場合 ( 「最先端」など)

タイプ 1 およびタイプ 2 のテクニカル レポートは、発行から 3 年以内に審査され、国際規格に変換できるかどうかが決定されます。タイプ 3 のテクニカル レポートは、それらが提供するデータがもはや有効または有用でないと見なされるまで、必ずしもレビューする必要はありません。

ISO/IEC TR 22250 のこの部分の要素の一部が特許権の対象となる可能性があることに注意してください。 ISO および IEC は、そのような特許権の一部またはすべてを特定する責任を負わないものとします。

タイプ 3 のテクニカル レポートである ISO/IEC TR 22250-1 は、JISC によって (JIS/TR X 0029 として) 作成され、合同技術委員会 ISO/IEC によって、特別な「ファスト トラック手順」の下で採用されました。 JTC 1, 情報技術、ISO および IEC の国家機関による承認と並行して。

ISO/IEC TR 22250 は、次の部分で構成され、一般的なタイトルは「情報技術 — ドキュメント記述および処理言語 — XML の正規言語記述 (RELAX)」です。

  • Part 1: リラックス コア
  • Part 2: RELAX 名前空間

1 スコープ

このテクニカル レポートは、XML ベースの言語の構文を正式に指定するためのメカニズムを提供します。たとえば、XHTML 1.0 の構文は RELAX で指定できます。

DTD と比較して、RELAX には次の利点があります。

  • - RELAX の仕様は、XML インスタンス (つまり、ドキュメント) 構文を使用します。
  • - RELAX は豊富なデータ型を提供し、
  • - RELAX は名前空間を認識します。

RELAX 仕様は、 RELAX CoreRELAX Namespaceの 2 つの部分で構成されています。テクニカル レポートのこの部分では、単一の XML 名前空間を含むマークアップ言語を記述するために使用できるRELAX Core を提供します。このテクニカル レポートの 2 では、複数のRELAX コアドキュメントで構成される複数の XML 名前空間を含むマークアップ言語を記述するために使用できるRELAX Namespaceを提供しています。

一連の要素を指定すると、 RELAX Coreプロセッサと呼ばれるソフトウェア モジュールがそれをRELAX Coreの仕様と比較し、結果を報告します。 RELAX Coreプロセッサは、ユーザーが直接呼び出すことができます。また、 RELAX Namespaceプロセッサと呼ばれる別のソフトウェア モジュールから呼び出すこともできます。

RELAX は、DTD と組み合わせて使用​​できます。特に、DTD によって宣言された表記法とエンティティーは、RELAX によって制約を受ける可能性があります。

テクニカル レポートのこの部分では、DTD 機能とデータ型に制限されているRELAX Coreのサブセットも示します。このサブセットは実装が非常に簡単で、データ型情報を除いて、このサブセットと XML DTD 間の変換によって情報が失われることはありません。

注 1 XML は WebSGML (ISO 8879 の TC2) のサブセットであるため、RELAX は SGML に適用できます。

注 2 RELAX Core の後継は、OASIS の RELAX NG TC で開発されています。

2 参考文献

  • ISO 8879:1986, 情報処理 - テキストおよびオフィス システム - 標準一般化マークアップ言語 (SGML)
  • ISO 8879:1986, 情報処理 - テキストおよびオフィス システム - 標準一般化マークアップ言語 (SGML)
  • ISO 8879:1986/Cor 2:1999, 情報処理 - テキストおよびオフィス システム - Standard Generalized Markup Languag, 拡張マークアップ言語 (XML) 1., W3C 勧告、 http://www.w3.org/TR/REC-xml, 2000
  • W3, XML の名前空間、W3C 勧告、 http://www.w3.org/TR/REC-xml-names, 1999 年
  • W3, XML 情報セット、W3C 勧告案、 http://www.w3.org/TR/xml-infoset, 2001
  • W3, XML スキーマ2, W3C 勧告、 http://www.w3.org/TR/xmlschema-2, 2001 年
  • IETF (インターネット エンジニアリング タスク フォース) RFC2396: URI (Uniform Resource Identifier): 一般的な構文、1998 年。

3 用語と定義

3.1XML 1.0

テクニカル レポートのこの部分では、XML 1.0 で指定されている次の用語と定義が適用されます。

  • a)開始日
  • b)終了日
  • c)空の要素タグ
  • d)属性
  • e)属性名
  • f)内容
  • g)コンテンツモデル
  • h)属性リスト宣言
  • i) DTD
  • j) XML プロセッサ
  • k)有効性
  • l)プロセッサの検証
  • m)検証していないプロセッサ
  • n)空白
  • o)子供
  • p)パラメータ実体
  • q)マッチ

注 3 XML 1.0 で与えられた意味に加えて、「一致」には別の意味があります (5.8 を参照)

3.2 XML の名前空間

テクニカル レポートのこの部分では、「XML の名前空間」に記載されている次の用語と定義が適用されます。

  • a)名前空間
  • b)名前空間名

3.3 XML スキーマ2

テクニカル レポートのこの部分では、「XML スキーマ2」が適用されます。

  • a)字句表現
  • b)ファセット
  • c)データ型
  • d)組み込みデータ型

3.4 XML情報セット

テクニカル レポートのこの部分では、「XML 情報セット」に記載されている次の用語と定義が適用されます。

  • a)情報セット
  • b)文書情報項目
  • c)要素情報項目
  • d)プロパティ
  • e)コア プロパティ
  • f)スキップされたエンティティ情報項目への参照
  • g)実体情報項目
  • h)表記情報項目

3.5 RELAXコア固有の定義

3.5.1

タグ名

開始タグ、終了タグ、および空要素タグの名前 (ISO 8879 の一般的な識別子)

注記 1:この用語は DOM から採用された。

3.5.2

ヘッジ

要素と文字データの順序付けられたシーケンス

参考文献

[1]W3, XML スキーマ0: プレミア、W3C 勧告、 http://www.w3.org/TR/xmlschema-0, 2001 年
[2]W3, ドキュメント オブジェクト モデル (DOM) レベル 2 コア仕様バージョン 1.0, W3C 勧告、 http://www.w3.org/TR/DOM-Level-2-Core/、2000
[3]村田誠、HOW TO RELAX, http: //www.xml.gr.jp/relax/、2000

Foreword

ISO (the International Organization for Standardization) and IEC (the International Electrotechnical Commission) form the specialized system for worldwide standardization. National bodies that are members of ISO or IEC participate in the development of International Standards through technical committees established by the respective organization to deal with particular fields of technical activity. ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations, governmental and non-governmental, in liaison with ISO and IEC, also take part in the work. In the field of information technology, ISO and IEC have established a joint technical committee, ISO/IEC JTC 1.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, 3.

The main task of the joint technical committee is to prepare International Standards. Draft International Standards adopted by the joint technical committee are circulated to national bodies for voting. Publication as an International Standard requires approval by at least 75 % of the national bodies casting a vote.

In exceptional circumstances, the joint technical committee may propose the publication of a Technical Report of one of the following types:

  • type 1, when the required support cannot be obtained for the publication of an International Standard, despite repeated efforts;
  • type 2, when the subject is still under technical development or where for any other reason there is the future but not immediate possibility of an agreement on an International Standard;
  • type 3, when the joint technical committee has collected data of a different kind from that which is normally published as an International Standard (“state of the art”, for example).

Technical Reports of types 1 and 2 are subject to review within three years of publication, to decide whether they can be transformed into International Standards. Technical Reports of type 3 do not necessarily have to be reviewed until the data they provide are considered to be no longer valid or useful.

Attention is drawn to the possibility that some of the elements of this part of ISO/IEC TR 22250 may be the subject of patent rights. ISO and IEC shall not be held responsible for identifying any or all such patent rights.

ISO/IEC TR 22250-1, which is a Technical Report of type 3, was prepared by JISC (as JIS/TR X 0029) and was adopted, under a special “fast-track procedure”, by Joint Technical Committee ISO/IEC JTC 1, Information technology, in parallel with its approval by national bodies of ISO and IEC.

ISO/IEC TR 22250 consists of the following parts, under the general title Information technology — Document description and processing languages — Regular Language Description for XML (RELAX):

  • Part 1: RELAX Core
  • Part 2: RELAX Namespace

1 Scope

This Technical Report gives mechanisms for formally specifying the syntax of XML-based languages. For example, the syntax of XHTML 1.0 can be specified in RELAX.

Compared with DTDs, RELAX provides the following advantages:

  • - Specification in RELAX uses XML instance (i.e., document) syntax,
  • - RELAX provides rich datatypes, and
  • - RELAX is namespace-aware.

The RELAX specification consists of two parts, RELAX Core and RELAX Namespace. This part of the Technical Report gives RELAX Core, which may be used to describe markup languages containing a single XML namespace. 2 of this Technical Report gives RELAX Namespace, which may be used to describe markup languages containing more than a single XML namespace, consisting of more than one RELAX Core document.

Given a sequence of elements, a software module called the RELAX Core processor compares it against a specification in RELAX Core and reports the result. The RELAX Core processor can be directly invoked by the user, and can also be invoked by another software module called the RELAX Namespace processor.

RELAX may be used in conjunction with DTDs. In particular, notations and entities declared by DTDs can be constrained by RELAX.

This part of the Technical Report also gives a subset of RELAX Core, which is restricted to DTD features plus datatypes. This subset is very easy to implement, and with the exception of datatype information, conversion between this subset and XML DTDs results in no information loss.

NOTE 1 Since XML is a subset of WebSGML (TC2 of ISO 8879), RELAX is applicable to SGML.

NOTE 2 A successor of RELAX Core is being developed at the RELAX NG TC of OASIS.

2 References

  • ISO 8879:1986, Information processing – Text and office systems – Standard Generalized Markup Language (SGML)
  • ISO 8879:1986, Information processing – Text and office systems – Standard Generalized Markup Language (SGML)
  • ISO 8879:1986/Cor 2:1999, Information processing – Text and office systems – Standard Generalized Markup Language (SGML) – Technical Corrigendum 2
  • W3C (World Wide Web Consortium), Extensible Markup Language (XML) 1.0 (Second Edition), W3C Recommendation, http://www.w3.org/TR/REC-xml, 2000
  • W3C (World Wide Web Consortium), Name Spaces in XML, W3C Recommendation, http://www.w3.org/TR/REC-xml-names, 1999
  • W3C (World Wide Web Consortium), XML Information Set, W3C Proposed Recommendation, http://www.w3.org/TR/xml-infoset, 2001
  • W3C (World Wide Web Consortium), XML Schema 2, W3C Recommendation, http://www.w3.org/TR/xmlschema-2, 2001
  • IETF (Internet Engineering Task Force). RFC2396: Uniform Resource Identifiers (URI): Generic Syntax, 1998.

3 Terms and definitions

3.1 XML 1.0

For the purposes of this part of the Technical Report, the following terms and definitions given in XML 1.0 apply.

  • a) start tag
  • b) end tag
  • c) empty-element tag
  • d) attribute
  • e) attribute name
  • f) content
  • g) content model
  • h) attribute-list declaration
  • i) DTD
  • j) XML processor
  • k) validity
  • l) validating processor
  • m) non-validating processor
  • n) whitespace
  • o) child
  • p) parameter entity
  • q) match

NOTE 3 On top of those meanings given in XML 1.0, “match” has another meaning (see 5.8).

3.2 Name Spaces in XML

For the purposes of this part of the Technical Report, the following terms and definitions given in “Name Spaces in XML” apply.

  • a) namespace
  • b) namespace name

3.3 XML Schema 2

For the purposes of this part of the Technical Report, the following terms and definitions given in"XML Schema 2" apply.

  • a) lexical representation
  • b) facet
  • c) datatype
  • d) built-in datatype

3.4 XML Information Set

For the purposes of this part of the Technical Report, the following terms and definitions given in “XML Information Set” apply.

  • a) information set
  • b) document information item
  • c) element information item
  • d) property
  • e) core property
  • f) reference to skipped entity information item
  • g) entity information item
  • h) notation information item

3.5 Definitions specific to RELAX Core

3.5.1

tag name

names in start tags, end tags, and empty-element tags (generic identifiers in ISO 8879)

Note 1 to entry: This term is adopted from DOM.

3.5.2

hedge

ordered sequences of elements and character data

Bibliography

[1]W3C (World Wide Web Consortium), XML Schema 0: Premier, W3C Recommendation, http://www.w3.org/TR/xmlschema-0, 2001
[2]W3C (World Wide Web Consortium), Document Object Model (DOM) Level 2 Core Specification Version 1.0, W3C Recommendation, http://www.w3.org/TR/DOM-Level-2-Core/, 2000
[3]MURATA Makoto, HOW TO RELAX, http://www.xml.gr.jp/relax/, 2000