JIS X 7201:2005 ニュース用マーク付け言語(NewsML) | ページ 9

                                                                                             39
X 7201 : 2005
5.7.3 BasisForChoice BasisForChoiceの構成要素は,NewsComponent又はContentItemにある情報を識別
するXPathパターン又は要素型名であって,同等のNewsComponent又はContentItemを選択する際の基礎
として用いられる。XPathパターンが“.”(ピリオド)で始まっている場合には,XPathの“ルート”を表
し,NewsComponent又はContentItem自体に相当する。XPathパターンを等価の組合せの中で順番に,個々
のNewsComponent又はContentItemに適用することによって,システムは,項目間の選択を行う基礎とな
るデータを抽出することができる。XPathパターンに適合するものが,“ルート”で始まる部分木に多数存
在する場合には,文書の順番で最初に適合したものだけが重要である。任意選択のRank属性によって,
配信社が異なったBasisForChoiceを付加した場合には,数値によって重要度に優先順位を付けることがで
きる。この場合,数値が小さいほど重要度が高くなる。
NewsML DTDの対応部分を次に示す。
<!ELEMENT BasisForChoice (#PCDATA)>
<!ATTLIST BasisForChoice %localid;
Rank CDATA #IMPLIED >
次のNewsML文書の実例では,内部NewsComponent(この場合,円グラフ又は棒グラフ)の役割(Role)
を示している。それらは,NewsComponent間の選択の基礎として示されている。BasisForChoice内の“./”
は,そのパスのルートの下位要素を示すXPath構文であって,選択肢となる個々のNewsComponentを示す。
NewsML文書の実例を次に示す。
<NewsComponent EquivalentsList="yes" Essential="yes">
<Role FormalName="GRAPH"/>
<BasisForChoice>./Role</BasisForChoice>
<NewsComponent>
<Role FormalName="PIE CHART"/>
<ContentItem>...</ContentItem>
</NewsComponent>
<NewsComponent>
<Role FormalName="BAR CHART"/>
<ContentItem>...</ContentItem>
</NewsComponent>
</NewsComponent>
次のNewsML文書の実例では,PixelWidthという値のFormalName属性をもつProperty要素のValue属
性が,ContentItem間の選択の基礎となることを示すために,更に複雑なXPath表現を用いている。
NewsML文書の実例を次に示す。
例1
<Catalog>
<Resource Duid="resource1">
<Urn>urn:newsml:mydomain.com:20010101:Characteristics:3</Urn>
<Url>www.mydomain.com/vocabs/characteristics.xml</Url>
<DefaultVocabularyFor Context="Property"/>
</Resource>

――――― [JIS X 7201 pdf 41] ―――――

40
X 7201 : 2005
</Catalog>
...
<NewsComponent EquivalentsList="yes">
<BasisForChoice>.//Property[@FormalName="PixelWidth"]/@Value</BasisForChoice>
<ContentItem Href="pictures/4769w336.jpg">
<MimeType FormalName="image/jpeg"/>
<Characteristics>
<SizeInBytes>22999</SizeInBytes>
<Property FormalName="PixelWidth" Value="336"/>
<Property FormalName="PixelHeight" Value="224"/>
</Characteristics>
</ContentItem>
<ContentItem Href="pictures/4769w170.jpg">
<MimeType FormalName="image/jpeg"/>
<Characteristics>
<SizeInBytes>8449</SizeInBytes>
<Property FormalName="PixelWidth" Value="170"/>
<Property FormalName="PixelHeight" Value="224"/>
</Characteristics>
</ContentItem>
</NewsComponent>
例2
次のNewsComponentについて見てみたい。
<NewsComponent EquivalentsList= "yes">
<BasisForChoice>@xml:lang</BasisForChoice>
<NewsComponent xml:lang= "en-US">
···
</NewsComponent>
<NewsComponent xml:lang= "fr-FR">
···
</NewsComponent>
</NewsComponent>
上の例で,外側のNewsComponentは,互いに等価である二つの子NewsComponentをもち,BasisForChoice
は,xml:lang属性とする。このBasisForChoiceは,xml:lang属性を探す際に,それぞれの子NewsComponent
の“子”の軸(axis)を利用しなければならないことを示している。このことによって,xml:langがそれぞ
れの子NewsComponent直下の子として存在するため,この例は,正しい例だといえる。上記の
BasisForChoiceの構造は,次のものと等しいことに注意すべきである。
<BasisForChoice>./@xml:lang</BasisForChoice>
両方のケースにおいて,子NewsComponentの子軸が探されることを示している。

――――― [JIS X 7201 pdf 42] ―――――

                                                                                             41
X 7201 : 2005
例3
<NewsComponent EquivalentsList= "yes">
<BasisForChoice>@xml:lang</BasisForChoice>
<NewsComponent>
<NewsComponent xml:lang= "en-US">
···
</NewsComponent>
</NewsComponent>
<NewsComponent>
<NewsComponent xml:lang= "fr-FR">
···
</NewsComponent>
</NewsComponent>
</NewsComponent>
上では,BasisForChoiceは,BasisForChoice要素を含むNewsComponentのそれぞれの子NewsComponent
の“子”の軸(axis)を使うべきであることを示している。しかし,この例では,それぞれの子NewsComponent
は,その直下の子として,xml:lang属性をもっていない。これでは,BasisForChoice要素は正しく構成され
ない。この例でxml:lang属性は,子NewsComponentの子孫として現れている。したがって,BasisForChoice
は,次のように構成されなければならない。
<BasisForChoice>.//@xml:lang</BasisForChoice>
“.//”は,子NewsComponentの子孫軸を探さなければいけないことを示す。
5.7.4 NewsComponentの他の下位要素 NewsComponentは,任意選択のNewsLines,
AdministrativeMetadata,RightsMetadata及びDescriptiveMetadataの各要素を含むことができる。これらの要
素の機能は,この規格の5.9 メタデータに記載している。また,NewsComponentは,NewsML規定に定
義されていない,利用者が定義する幾つかのメタデータを含むMetadata要素を幾つ含んでもよい。

5.8 ContentItemの構造

 ContentItemは,人への公開を意図した表現内容(テキスト,画像,動画,音
声など)を伝える,又は識別するためのニュースオブジェクトとする。NewsMLは,メディアに依存しな
い記述言語であることが特徴で,あらゆる人の感覚(視覚,聴覚,触覚又はこれらの組合せを含む。)に対
して,あらゆるメディアを通じた表現が可能である。ContentItemに格納するテキストの推奨フォーマット
は,IPTC-NAA NITFとする。
ContentItemは,ある素材データをDataContent要素の中に含むか,又はContentItem要素のHref属性を
用いて,素材データを指し示して伝えなければならない。素材データを指し示すポインタが使用される場
合でも,NewsML文書は,素材データが直接含まれる場合と全く同じように解釈される。ポインタを使用
する主な理由は,物理的な転送又は蓄積に必要なデータ量を削減すること,整形式(well-formed)XML文
書の中で直接含むことができないデータオブジェクトのフォーマットを操作することにある。
DataContent要素は,符号化方法を示す一つ以上のEncoding要素に包含されることがある。DataContent
要素の素材データが含まれる場合には,整形式XML化を中止したり,NewsML DTDに従うことをやめた
りして,NewsML文書が破綻しないように保証する注意が必要である。この問題が起きないように保証す
る技術的要件は,次のとおりである。

――――― [JIS X 7201 pdf 43] ―――――

42
X 7201 : 2005
・ XMLマーク付けとして判定される文字列をデータに含まないことを保証する。
・ XMLマーク付けとして判定される幾つかの文字列があった場合でも,XML1.0規定にあるように,
特定の文字列“] ] >”をどこにも含まず,CDATAセクションでデータを包含する。
・ データがXML内容で構成され,NewsMLの要素名と同じ名前の要素をもたない場合には,文書
の内部DTDサブセットに使用される要素型を宣言する。
ContentItemの下位要素である任意選択のMediaType,MimeType,Format及びNotationは,それぞれメ
ディア型,MIME型,フォーマット及び記法を表している。その意味及びこれらの要素のFormalName属
性に許可された値は,Vocabulary属性及びScheme属性によって識別される統制語い(彙)によって決定され
る。
ContentItemはまた,その物理的特徴についての情報を提供するCharacteristics要素を含むことができる。
Characteristics要素の目的は,解釈前後のデータを扱うために必要なシステム要件の決定を補助することで
ある。つまり,ファイルサイズで言えば,(ラスタ画像に対しては)縦横のピクセル数,(ビデオクリップ
に対しては)フレーム数,(音声ファイルに対しては)持続時間,(すべての対象に対しては)バイト数を
表現することができる。NewsML1.0版では,特定の要素型として,SizeInBytesだけが特性として規定され
ている。他のすべての特性としては,一般的なProperty要素が使用されている。この一般的な要素の使用
に関する規定については,5.6.11 Propertyの項を参照。
NewsML DTDの対応部分を次に示す。
<!ENTITY % data " (Encoding | DataContent )・">
<!ELEMENT Encoding %data; >
<!ATTLIST Encoding %localid;
Notation CDATA #REQUIRED >
<!ELEMENT DataContent ANY>
<!ATTLIST DataContent %localid; >
<!ELEMENT ContentItem (Comment* , Catalog・ , MediaType・ , Format・ ,
MimeType・ , Notation・ , Characteristics・ , %data; )>
<!ATTLIST ContentItem %localid;
Href CDATA #IMPLIED >
<!ELEMENT MediaType EMPTY>
<!ATTLIST MediaType %localid;
%formalname; >
<!ELEMENT Format EMPTY>
<!ATTLIST Format %localid;
%formalname; >
<!ELEMENT MimeType EMPTY>
<!ATTLIST MimeType %localid;
%formalname; >
<!ELEMENT Notation EMPTY>
<!ATTLIST Notation %localid;
%formalname; >
<!ELEMENT Characteristics (SizeInBytes・ , Property* )>

――――― [JIS X 7201 pdf 44] ―――――

                                                                                             43
X 7201 : 2005
<!ATTLIST Characteristics %localid; >
<!ELEMENT SizeInBytes (#PCDATA )>
<!ATTLIST SizeInBytes %localid; >
次のNewsML文書の実例は,内容を解凍するために,unbinhex(binhexの複合)を行ってから,unzip
を行う必要のある行内データを載せている。
<ContentItem>
<Encoding Notation="binhex">
<Encoding Notation="zip">
<DataContent>A873B6FE ...</DataContent>
</Encoding>
</Encoding>
</ContentItem>
次のNewsML文書の実例は,NewsML1.0の承認に関するIPTC文書の第2版の中でDuidがitem2となる
ContentItemを参照によって再利用するContentItemを示している。このContentItemは,メディア型がText,
フォーマットがTTNITF,MIME型が text/vnd.IPTC.NITFで,記法がNITFとなる。2736バイト長で,
myproperties.xmlで定義されたWordCount特性が450の値をもつ。記法を解するXMLプロセッサでオブジ
ェクトが扱えるように,NewsML文書の内部サブセット内で,NITFの記法が公式に宣言されている。
NewsML文書の実例を次に示す。
<・xml version="1.0" encoding="UTF-8"・>
<!DOCTYPE NewsML PUBLIC "urn:newsml:iptc.org:20001006:NewsMLv1.0.dtd:1"
"http://www.iptc.org/NewsML/NewsMLv1.0.dtd"
[
<!NOTATION NITF PUBLIC "-//IPTC-NAA//DTD NITF-XML 1.0//EN">
]
<NewsML>
<Catalog>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcMediaTypes.xml</Urn>
<DefaultVocabularyFor Scheme="IptcMediaTypes" Context="MediaType"/>
</Resource>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcFormats.xml</Urn>
<DefaultVocabularyFor Scheme="IptcFormats" Context="Format"/>
</Resource>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcMimeTypes.xml</Urn>
<DefaultVocabularyFor Scheme="IptcMimeTypes" Context="MimeType"/>
</Resource>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcNotations.xml</Urn>

――――― [JIS X 7201 pdf 45] ―――――

次のページ PDF 46

JIS X 7201:2005の国際規格 ICS 分類一覧

JIS X 7201:2005の関連規格と引用規格一覧

規格番号
規格名称