14
X 7201 : 2005
NewsML文書の実例を次に示す。
例1
<Catalog>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcConfidence:1</Urn>
<Url>http://www.iptc.org/NewsML/topicsets/iptc-confidence.xml</Url>
<DefaultVocabularyFor Context="@Confidence"/>
</Resource>
<TopicUse Topic="#person1" Context="DescriptiveMetadata"/>
</Catalog>
<TopicSet FormalName="Person">
<Topic Duid="person1">
<TopicType FormalName="Person" Vocabulary="urn:newsml:iptc.org:20001006:IptcTopicTypes:1"
Scheme="IptcTopicTypes"/>
<Description xml:lang="en">David Allen, Managing Director of IPTC</Description>
</Topic>
</TopicSet>
例2
<NewsML>
<Catalog>
<Resource>
<Urn>···</Urn>
<Url>···</Url>
<DefaultVocabularyFor Context=".//MediaType" Scheme= "xyz"/>
</Resource>
···
</NewsML>
Catalogの親であるNewsML要素から,すべてのMediaTypeを探し始めるには,次のようにContextを設
定する。
<DefaultVocabularyFor Context="//MediaType" Scheme= "xyz"/>
NewsMLの定義では,“.// ”は,Catalog要素の親から探すと解釈される。“//”は,XPathの定義として
は,NewsML文書のルート要素からのすべてを意味する。この場合でも,ルートは,Catalog要素の親であ
ることに変わりない。
例3
<NewsML>
<NewsItem>
···
――――― [JIS X 7201 pdf 16] ―――――
15
X 7201 : 2005
<NewsComponent>
<Catalog>
<Resource>
<Urn>···</Urn>
<Url>···</Url>
<DefaultVocabularyFor Context= ".//MediaType" Scheme= "xyz"/>
</Resource>
···
</NewsML>
例3の場合,NewsComponentからMediaTypeを探し始める。これは,ちょうどCatalog要素の親に相当
する。しかし,次のようにContextを設定する場合を考える。
<DefaultVocabularyFor Context= "//MediaType" Scheme= "xyz"/>
この場合,“//”は,“文書の最初であるルートから”を示すから,NewsML要素から探すことになる。
例4
<NewsML>
<NewsItem>
<NewsComponent>
<Catalog>
<Resource>
<Url>http://www.acmenews.com/vocabs/roles.xml</Url>
<DefaultVocabularyFor Context= "//Role"/>
</Resource>
</Catalog>
<Role FormalName= "alpha"/>
</NewsComponent>
<NewsComponent>
<Role FormalName= "beta"/>
</NewsComponent>
</NewsItem>
</NewsML>
この例では,XPath“//Role”は,“alpha”及び“beta”の要素に合致する。これは,両方とも文
書のルートの子孫になることによる。しかし,NewsMLでは,“beta”に対してこの“DefautVocabularyFor”
を適用することはできない。これは,“Catalog”が先祖要素内に現れていないことによる。言い換えると,
XPathの適用範囲は,先祖木内になる。つまり,XPathがどのように書かれていようとも,それ以上に広げ
ることは,許されない。
――――― [JIS X 7201 pdf 17] ―――――
16
X 7201 : 2005
5.3 TopicSet
TopicSetは,Topic要素を含む。これら(Topic要素)は,実世界事情(トピック)への参
照となる。これらは,人,場所,会社又はある種の重要性をもつその他のものであってよい。さらに,こ
れらは,NewsML文書にあるニュース内容又はメタデータの中で,参照されるか又は関連しているかのい
ずれかとする。
一つのTopicは,一つ以上のFormalName下位要素及び一つ以上のDescription下位要素の両方,又はそ
れらのどちらかをもってよい。その記述は,それがどの個別のものかについて識別できるように意図され
る。FormalName要素 は,特定の命名方式に属することを示すために,Scheme属性をもつことができる。
同じScheme属性を伴う同じFormalNameをもった二つのTopicが,同じTopicSetに存在するのは,誤りと
する。したがって,統制語い(彙)としてTopicSetを使うことは,可能であって,すべての与えられた形式
名の意味を確かめることができる。
Topic要素は,Details属性も,もつことができる。Details属性は,URL又はURNの形であって,その
トピックに関する追加情報へのポインタとなる。Topic要素は,そのトピックの特性のための値を提供す
る一つ以上のProperty下位要素をもつこともできる。Topic及びTopicSetは,追加的に,自然言語で非形式
的な追加情報を与えるCommentをもつことができる。
追加のTopicは,TopicSetRef下位要素を使用することによって,あるTopicSetに参照として含まれるこ
とができる。TopicSetRef要素のTopicSet属性は,参照によって現在のTopicSetの中へ含まれるTopicをも
つ,あるTopicSetへのポインタとする。このポインタは,内部又は外部のTopicSetを識別するhttp URL又
はNewsML URNであるか,#記号の後に現在の文書中にあるTopicSetのDuid属性値を続けたものから成
る素片識別子であるかのいずれかとする。
参照によって含まれるTopicの一つが,既にそのTopicSetに含まれるTopicと同じFormalName及び
Schemeをもつ場合,それら両方は,同じ実世界のものを参照する,ということを意味する。したがって,
これら二つのTopic 要素は,統合されるとみなす。Topicの統合は,システムによって物理的に実行され
る必要はない。しかし,データの意味は,統合が実際に実行された場合と全く同じとする。
すべてのTopicは,そのTopicがどのような型であるかを表す一つ以上のTopicType下位要素をもつ。ト
ピックの型は,TopicType要素のFormalName属性で命名される。TopicType要素のVocabulary属性は,そ
のFormalNameの意味を定義する統制語い(彙)へのポインタとする。Scheme属性は,存在する場合には,
語い(彙)内のどの命名方式がこの形式名に当てはまるかを識別する。
NewsML DTDの対応部分を次に示す。
<!ENTITY % formalname " FormalName CDATA #REQUIRED
Vocabulary CDATA #IMPLIED
Scheme CDATA #IMPLIED" >
<!ELEMENT TopicSet (Comment* , Catalog・ , TopicSetRef* , Topic*)>
<!ATTLIST TopicSet %localid;
%formalname; >
<!ELEMENT TopicSetRef (Comment*)>
<!ATTLIST TopicSetRef %localid;
TopicSet CDATA #IMPLIED >
<!ELEMENT Topic (Comment* , Catalog・ , TopicType+ , FormalName* , Description* , Property*)>
<!ATTLIST Topic %localid;
Details CDATA #IMPLIED >
――――― [JIS X 7201 pdf 18] ―――――
17
X 7201 : 2005
<!ELEMENT TopicType EMPTY >
<!ATTLIST TopicType %localid;
%formalname; >
<!ELEMENT FormalName (#PCDATA) >
<!ATTLIST FormalName %localid;
Scheme CDATA #IMPLIED >
<!ELEMENT Description (#PCDATA) >
<!ATTLIST Description %localid;
xml:lang CDATA #IMPLIED
Variant CDATA #IMPLIED >
次のNewsML文書の実例では,TopicSetが,Event(事象),Person(人物)及びCompany(会社)とい
う三つの型のTopicをもつ。これらのTopicTypeは,すべてIPTC Topic Types語い(彙)から引き出される形
式名によって識別される。このIPTC Topic Types語い(彙)は,Catalogの中で,TopicType要素のための既定
語い(彙)と宣言される。
最初のTopicは,Event(事象)の中で,英語で“Iran-Iraq war(イラン・イラク戦争)”と書かれている。
2番目のTopicは,“Tony Blair(トニー・ブレア)”と記述されたPerson(人物)についてである。その
Description要素値に関連付けられた特定の言語はない。さらに,このPerson(人物)についてのDetails属
性を,外部ファイル“whoswho.xml”の中でtonyblairとしおり付けされた場所で見つけることができる。
後の二つのTopicは,Company(会社)についてであって,より形式的に識別されている。それらは,
それぞれCompany Name(会社名)という特定のVariant属性を伴ったDescriptionをもつ。さらに,それぞ
れが,二つのFormalNameをもち,そのうちの一つはRIC命名方式に,他の一つはNASDAQ命名方式に
属している。
NewsML文書の実例を次に示す。
<・xml version="1.0"・>
<!DOCTYPE NewsML PUBLIC "urn:newsml:iptc.org:20001006:NewsMLv1.0:1"
"http://www.iptc.org/NewsML/DTD/NewsMLv1.0.dtd">
<NewsML>
<Catalog>
<Resource>
<Urn>urn:newsml:iptc.org:20001006:IptcTopicTypes:1</Urn>
<Url>http://www.iptc.org/NewsML/topicsets/iptc-topictypes.xml</Url>
<DefaultVocabularyFor Context="TopicType"/>
</Resource>
</Catalog>
<TopicSet FormalName= "Event">
<Topic Duid="event1">
<TopicType FormalName="Event"/>
<Description xml:lang="en-GB">Iran-Iraq war</Description>
</Topic>
<Topic Duid="person1" Details="whoswho.xml#tonyblair">
――――― [JIS X 7201 pdf 19] ―――――
18
X 7201 : 2005
<TopicType FormalName="Person"/>
<Description>Tony Blair</Description>
</Topic>
<Topic Duid="company1">
<TopicType FormalName="Company"/>
<FormalName Scheme="RIC">DELL.O</FormalName>
<FormalName Scheme="NASDAQ">DELL</FormalName>
<Description Variant="Company Name">Dell Computer</Description>
</Topic>
<Topic Duid="company2">
<TopicType FormalName="Company"/>
<FormalName Scheme="RIC">RTRSY.O</FormalName>
<FormalName Scheme="NASDAQ">RTRSY</FormalName>
<Description Variant="Company Name">Reuters</Description>
</Topic>
</TopicSet>
...
</NewsML>
次のNewsML文書の実例では,IPTC SubjectCodeの語い(彙)が,TopicSet内のTopicSetRef要素を通じた
参照によって含まれる。一つの追加のTopic要素も,与えられる。これは,IPTC topic types命名方式によ
って定義される“SubjectMatter”のTopicTypeをもつ。その追加のTopicには,“Building Design”という短
い英語の記述及び“The art and science of designing buildings”という詳細な英語記述がある。さらに,それ
には,二つのFormalNameが与えられている。IptcSubjectCodes命名方式では,そのFormalNameは“01002000”
であって,myscheme命名方式では,そのFormalNameは“BDES”になる。このことは,myscheme命名方
式でのFormalName“BDES”へのどんな参照も,IPTC SubjectCode語い(彙)で“01002000”と名付けられ
たものと同じものを参照することを意味する。
NewsML文書の実例を次に示す。
<TopicSet Duid="mysubjects" FormalName="SubjectMatter">
<TopicSetRef TopicSet="urn:newsml:iptc.org:iptc:20001006:IptcSubjectCodes"/>
<Topic Duid="mysubject1">
<TopicType FormalName="SubjectMatter"
Vocabulary="urn:iptc:20001006:IptcTopicTypes"Scheme="IptcTopicTypes"/>
<FormalName Scheme="myscheme">BDES</FormalName>
<FormalName Scheme="IptcSubjectCodes">01002000</FormalName>
<Description xml:lang="en-GB" Variant="ShortDesc">Building Design</Description>
<Description xml:lang="en-GB" Variant="FullDesc">The art and science of designingbuildings</Description>
</Topic>
</TopicSet>
システムが,実際にIPTC SubjectCodeの語い(彙)にアクセスし,システム内に局所的に含まれる(一つ
以上の)TopicとIPTCの(一つ以上の)Topicとを統合する場合,結果として,次のNewsML文書の実例
――――― [JIS X 7201 pdf 20] ―――――
次のページ PDF 21
JIS X 7201:2005の国際規格 ICS 分類一覧
- 35 : 情報技術.事務機械 > 35.060 : 情報技術に使用される言語
JIS X 7201:2005の関連規格と引用規格一覧
- 規格番号
- 規格名称