この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序章
このドキュメントの目的は、「オフィス機器」の現在の状況の概要を提供し、将来の方向性を特定し、オントロジーの形式で用語を標準化することでオフィス オートメーションの強力なフレームワークを提供する方法を示すことです。
歴史的に「オフィス機器」は、今日よりも明確に定義されていました。 「オフィス」を構成するものの概念が変わりつつあり、人々は、従来オフィスに関連付けられていたタスクを実行するために特定の場所に行く必要がなくなりました。これらのタスクには、ドキュメントの作成またはコピー、参考書の読み取り、プレゼンテーション資料の準備などのアクティビティが含まれ、図 1 に示すように、さまざまな環境で実行できるようになりました。
図 1 —オフィスを構成するものの概念は急速に変化しています
オフィス ユーザーが従来利用していたツールと機器のセットも拡張され、現在ではオンライン ドキュメントの作成と共有、高品質のカラー ディスプレイ、デジタル プロジェクション機器、ビデオ通信などが含まれています。実際、従来「オフィス」に関連付けられていた作業を可能にするために使用される、新しいクラスの機器が毎年導入されているようです。
その結果、オフィス、個人、産業、および商業文書の間に明確な境界線がなくなりました。これは、これらすべての分野で同じデザイン ツールと複製装置の多くが使用されているためです。たとえば、Microsoft Publisher, Adobe InDesign, Microsoft Word を使用して、会社のパンフレット、個人文書、製品ハンドブックを作成しています。
高速インターネットの出現により、「オフィス ワーカー」が同じ場所にいる必要がなくなり、多くの場合、企業は多くの異なる場所からメンバーが働くバーチャル オフィスを運営しています。これをサポートするために、ドキュメントは、たとえばドキュメント管理システムを使用して中央リポジトリで利用可能になり、ユーザーが必要な権限を持っている限り、任意の場所で表示、変更、および印刷できます。
将来のオフィス標準の要件を検討する際には、これらの最近の開発を検討し、ユーザーが将来できることを期待することについても検討することが重要です。同じ範囲のシステムとサポートするソフトウェアがいくつかの異なる目的に使用されているという事実を考えると、これらの標準の範囲も考慮する必要があります。 1 つのオプションは、ビジネス アイデアを伝達するために使用される一連のツール、特にドキュメントの作成、表示、印刷、コピー、配布、およびアーカイブに焦点を当てることです。
2001 年 5 月の Scientific American の記事[4]で、Tim Berners-Lee は「セマンティック ウェブ」と呼ばれる概念を提案しました。彼は、構造化されたメタデータ (たとえば、その種類、作成者、使用目的など) によって情報を識別できるようなインターネットの発展を想定していました。この記事の著者は、重要なテクノロジーのうち 3 つがすでに導入されていることを確認しています。eXtensible Markup Language (XML) [26] 、Resource Description Framework (RDF) [5] 、および Uniform Resource Indicators (URI) [27]です。最も単純な形式の XML では、<name> や <country> などのタグと、<John Smith> や <China> などの関連する値を作成でき、これらのデータ名と値を使用して Web ページに注釈を付けることができます.これらのページを読んでいる人が理解できる場合もありますが、一般的には機械が意味を理解することはできません。ただし、その意味は RDF を使用して表現できます。RDF は、機械によって明確に解析できる方法で特定の物のプロパティを記述できるようにするメカニズムを提供します。たとえば、<名前> <居住者> <国> は、初歩的な文の主語、動詞、および目的語に似た構造を持っています。主語と目的語は、URI を使用して正確に定義できます。注意して URI を使用して、主語と目的語の間の関係 (動詞) を定義することもできます。著者は、このモデルを使用して、Web データを機械で解釈できるようにすることができることを観察しました。これは非常に強力な概念であり、多少の変更を加えるだけで、モノのインターネット (または Web) (IoT) の基本原則の 1 つになります。
IoT の基本的な概念は、すべてのインターネット オブジェクトが、IP アドレス、URL, URI, バーコード、RFID タグなどの一意の識別子を持っているということです。 「モノ」には、デバイス、Web ページ、通信リンク、RFID タグやバーコードが付いたアイテムなど、物理的オブジェクトと抽象的なオブジェクトの両方を含む、あらゆる種類の一意に識別可能なオブジェクトが含まれます。適切なインフラストラクチャと認証が存在する場合、デバイスは他のデバイスと直接通信できます。たとえば、ホーム セキュリティ システムは侵入者を検出し、この情報を携帯電話に渡して家の所有者に警告することができます (デバイス間)同様に、デバイスは Web ページからデータを取得できます。たとえば、携帯電話で東京の天気予報を検索したり、Springer が発行したカラー マネージメントに関する書籍のリストを検索したりできます。正確な色再現の必要性を考えると、デジタル プリンターは現在の構成 (用紙、インク セット、解像度など) に適した ICC プロファイルを見つけることができます。このドキュメントでは、適切な ICC プロファイルの識別を実際の例として使用しています。
将来のオフィスで使用される機器が、ユーザーの介入を最小限に抑えて効果的に通信できるようにすることは、そのようなすべての機器のメーカーの目標の 1 つです。この種のコミュニケーションの重要な前提条件は、何らかの形式の標準化された語彙またはオントロジーを使用して、インターネット リソースを明確に識別できることです[10] 。
オントロジーの開発のために提案されたメカニズムの 1 つは RDF であり、その最新バージョンは 2014 年 2 月 25 日に W3C によって公開されました[5] 。 RDF の詳細とそれがサポートされる方法は複雑であり、付録 A は原則の概要を提供します。特に標準述語の登録の詳細を調査するには、さらなる調査が必要です。
RDF 対応ドキュメントの利点の 1 つは、検索エンジンが特定の種類の Web リソースを発見し、セットを閲覧したい人にとって便利な方法でこれらを並べ替えることができるため、より有用な検索結果を提供できることです。
基本的な RDF 構文に加えて、物事のタイプとそれらの間の関係を標準化する必要があります。 W3C は、Web オントロジー言語 (OWL) [27]の使用を推奨しています。これは、特定のドメインの RDF と組み合わせて使用できる基本的なクラス、プロパティ、個体、およびデータ値を定義するためのフレームワークを提供します。ごく最近 (2017 年 7 月)、W3C はデータ検証に必要な制約を提供する Shapes Constraints Language (SHACL) を導入しました。 OWL は分類タスク (「開かれた世界」での推論) 用に設計されていますが、SHACL は従来のスキーマ言語と同様の方法で (「閉じた世界」での) データ検証をカバーしています。
おそらく、例を見てオントロジーを定義する方法を理解するのが最も簡単でしょう。ここでは、BBC 番組のオントロジー[17]が選択されており、これの非常に高レベルの概要が図 2 に示されています。
最初の観察は、このオントロジーが他の多くのものの上に構築されているということです:
- 音楽オントロジー[18]は、音楽 (つまり、アーティスト、アルバム、およびトラック) を「コンポジション」、「MusicArtist」、「AudioFile」などの観点から説明するための主要な概念とプロパティを提供します。このオントロジーは独自に開発され、他のオントロジーで広く使用されています。
- FOAF (Friend Of A Friend の頭字語) [19]は、人、その活動、および他の人や物との関係を記述する機械可読なオントロジーです。
- SKOS (Simple Knowledge Organization System) は、プログラムのトピックなど、より抽象的な概念を定義するために使用されます。
- イベントオントロジーは、イベントが開催された場所と時期、および参加者を記述します。
これらのオントロジーは、他のオントロジーの上に構築されます。 BBC オントロジーは、Linked Open Vocabularies ウェブサイト[15]から調べることができる、接続されたオントロジーの大規模なウェブの一部です。 BBC Programs オントロジーは、'Broadcast'、'FM'、'Format'、'Genre' などの特定のクラスを定義します。
図 2 —オントロジーの例
同様に、オフィス機器、オフィス文書、インターネット リソースなどのオントロジーを構築することも可能です。具体的な例を示すために、ICC プロファイルを自動的に識別するタスクが選択されています。この例では、オフィス デバイスの 1 つの側面 (色の忠実度を実現する側面) のみを扱いますが、標準化されたメタデータを実際に使用する方法を示すには十分に複雑です。
これらすべてのソリューションが有用であるためには、ある種のドメイン固有のオントロジーが必要です。 ICC プロファイルの識別の例がこのドキュメントで使用されていますが、これはより広範なオントロジーの一部と見なされるべきです。たとえば、画像処理と印刷のオントロジー、またはオフィス アクター、ツール、およびリソースのオントロジーです。 ICC プロファイル メタデータには、他の領域に共通する側面があります。たとえば、カラー イメージング デバイス、印刷基材、印刷インクの識別、および著作権保持者、作成者、および所有者の識別などのその他のより抽象的なメタデータです。これは重要な考慮事項であり、そのようなメタデータがすでに明確に定義されている場合、これは参照によって組み込まれるべきであり、新しいオントロジーによって再定義されるべきではありません。オフィス機器のグループと密接に関連するグループがいくつかあり、行われる作業はこれらの他のグループと調整する必要があります。
Introduction
The aim of this document is to provide an overview of the current status of ‘office equipment’, to identify likely future directions and to show how standardisation of terminology in the form of an ontology could provide a strong framework for office automation.
Historically ‘office equipment’ was more clearly defined than it is today. The concept of what constitutes ‘the office’ is changing and people no longer have to go to a particular place to perform tasks traditionally associated with the office. These tasks include activities such as creating or copying documents, reading reference books and preparing presentation materials can now be carried out in many different environments as shown in Figure 1.
Figure 1—Ideas of what constitutes an office are changing rapidly
The set of tools and equipment traditionally available to office users has also expanded and now includes on-line document creation and sharing, high quality colour displays, digital projection equipment, video communication and so on. Indeed there seems to be a new class of equipment, used to enable tasks traditionally associated with ‘the office’, introduced each year.
Consequently, there is no longer a clear boundary between office, personal, industrial and commercial documents as many of the same design tools and reproduction equipment are used across all of these sectors. For example, Microsoft Publisher, Adobe InDesign and Microsoft Word are used to create company brochures, personal documents and product handbooks.
With the advent of high-speed internet, there is no longer a need for ‘office workers’ to be in the same location and, in many cases, companies operate a virtual office with members working from many different locations. To support this, documents are made available in a central repository, for example using a document management system, and can be viewed, modified and printed at any location as long as the user has the required rights.
When considering requirements for future office standards it is important to consider these recent developments and also to think about what users will expect to be able to do in future. Given the fact that the same range of systems and supporting software are used for several different purposes, the scope of these standards should also be considered. One option would be to focus on the set of tools used to communicate business ideas, particularly the creation, display, printing, copying, distribution and archival of documents.
In a Scientific American article in May 2001[4], Tim Berners-Lee proposed a concept that he referred to as ‘the Semantic Web’. He envisaged the development of the internet in such a way that information could be identified by structured metadata, for example its type, creator, intended use and so on. In this article the authors observe that three of the important technologies are already in place: eXtensible Markup Language (XML)[26], the Resource Description Framework (RDF)[5] and Uniform Resource Indicators (URIs)[27]. In its simplest form, XML allows the creation of tags such as <name> and <country> and associated values such as <John Smith> and <China> and these data names and values can be used to annotate web pages. While in some cases these can be understood by a person reading these pages, the meaning cannot generally be understood by a machine. The meaning, however, can be expressed using RDF which provides a mechanism to allow properties of particular things to be described in a way whereby they can be parsed unambiguously by machines. For example <name> <is a resident of> <country>, has a structure rather like the subject, verb and object of an elementary sentence. The subject and object can be defined precisely using URIs and with care URIs can also be used to define the relationship (the verb) between the subject and object. The authors observed that this model can be used to allow web data to be interpreted by machines. This is a very powerful concept and with only minor modifications is one of the basic principles for the Internet (or web) of Things (IoT).
The basic concept of the IoT is that all internet objects have a unique identifier such as an IP address, URL, URI, barcode or RFID tag. ‘Things’ include any kind of uniquely identifiable object including both physical and abstract objects such as a device, web page, communications link or an item with an RFID tag or barcode. Where suitable infrastructure and authentication exists, devices can communicate directly with other devices, for example a home security system can detect an intruder and pass this information to a mobile telephone to alert the home owner (device-to-device). Similarly, devices can obtain data from web pages, for example a mobile phone can find the weather forecast in Tokyo or a list of books published by Springer on colour management. Thinking about the needs for accurate colour reproduction, a digital printer can find a suitable ICC profile for its current configuration (paper, ink set, resolution etc.). This document uses identification of a suitable ICC profile as a practical example.
Ensuring that equipment used in the office of the future can communicate effectively with minimal user intervention is one of the goals of manufacturers of all such equipment. An important prerequisite to this kind of communication is the ability to be able to identify internet resources clearly using some form of standardised vocabulary or ontology[10].
One of the mechanisms proposed for the development of ontologies is RDF, the latest version of which was published by W3C on 25th February 2014[5]. Details of RDF and the way in which it is supported is complex and Annex A provides an overview of the principles. Further research is needed, particularly to investigate details of registration of standard predicates.
One benefit of RDF-enabled documents is that search engines can provide more useful search results as they can discover web resources of particular types and order these in a way that is useful to someone who wishes to browse the set.
In addition to the basic RDF syntax there is a need to standardise the types of things and the relationships between them. The W3C recommends the use of Web Ontology Language (OWL)[27] which provides the framework to define basic classes, properties, individuals, and data values which can be used in conjunction with RDF for a given domain. More recently (July 2017) W3C introduced the Shapes Constraints Language (SHACL) which provides constraints necessary for data validation. OWL is designed for classification tasks (inferencing in an ‘open world’), while SHACL covers data validation (in a ‘closed world’) in a similar way to that of traditional schema languages.
Perhaps it is easiest to understand how an ontology can be defined by looking at an example. Here, the ontology of BBC programmes[17] has been selected and a very high-level overview of this is shown in Figure 2.
The first observation is that this ontology is built on a number of others:
- The Music Ontology[18] provides main concepts and properties for describing music (i.e. artists, albums and tracks) in terms of, for example a 'Composition','MusicArtist', 'AudioFile' and so on. This ontology was developed independently and is widely used by other ontologies.
- FOAF (an acronym of Friend Of A Friend)[19] is a machine-readable ontology describing people, their activities and their relations to other people and objects.
- SKOS (Simple Knowledge Organisation System) is used to define some of the more abstract concepts such as topics of a program.
- Event ontology describes where and when the event was held and who the participants were.
These ontologies in turn build on other ontologies. The BBC ontology is part of a large web of connected ontologies which can be explored from the Linked Open Vocabularies website[15]. The BBC Programmes ontology defines specific classes such as ‘Broadcast’, ‘FM’, ‘Format’, ‘Genre’ and so on.
Figure 2—An example of an ontology
In a similar way, it would be possible to build an ontology for office equipment, office documents, internet resources and so on. In order to provide a concrete example, the task of automatically identifying ICC profiles has been selected. This example addresses only one aspect of office devices (that of achieving colour fidelity) but is sufficiently complex to show how standardised metadata can be used in practice.
For all of these solutions to be useful, some kind of domain-specific ontology is needed. An example of the identification of ICC profiles is used in this document but this should be seen as part of a broader ontology, for example an imaging and print ontology or an office actors, tools and resources ontology. There are aspects of ICC profile metadata that are common to other areas, for example identification of colour imaging devices, print substrates, printing inks and other more abstract metadata such as identification of the copyright holder, creator and owner. This is an important consideration and where such metadata is already well defined, this should be incorporated by reference and not redefined by any new ontology. There are a number of groups closely related to that of office equipment and any work done should be coordinated with these other groups.