ISO/IEC TS 22424-2:2020 デジタルパブリッシング— EPUB3保存—パート2:メタデータ要件 | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

導入

この文書は、長期保存に必要または推奨されるメタデータ要素 (識別子など) と、EPUB 出版物および関連メタデータをパッケージ化する方法を指定することにより、EPUB 出版物の長期保存を容易にします。 EPUB バージョン 3 および 3.0.1 が対象となります。必要に応じて、該当する EPUB バージョンを指定します。

一般に長期保存には次の 2 つのことが必要です。

  • EPUB 出版物などのオブジェクトを保存に適したものにする (使用すべき機能と避けるべき機能を含む)
  • オブジェクト (およびそれに関連するメタデータ) を、オブジェクトの他のバージョンや他のドキュメントなどの追加データとともに Open Archival Information System (OAIS) の送信情報パッケージ (SIP) にパッケージ化します。

ISO/IEC TS 22424-1 は、EPUB ドキュメントのアーカイブ可能性に重点を置いています。

この文書の背景は、ISO/IEC TS 22424-1 で説明されているオープン アーカイブ情報システムに基づいています。

送信情報パッケージ (SIP) が形成されるときは、必須の保存メタデータがパッケージ内に存在する必要があります。プロデューサーとアーカイブの間で交わされた合意に応じて、メタデータ要素はコンテナ ドキュメントまたは EPUB 出版物自体、あるいはその両方に保存されます。通常、投稿契約で EPUB 出版物へのメタデータの埋め込みが許可されていない限り、アーカイブはコンテナ内のすべての関連メタデータを見つけることを期待します。

この文書では、将来の EPUB 標準の現行に変更を加える必要はありません。ただし、アーカイブに送信するために EPUB 出版物を作成または変更する場合、使用すべき EPUB 機能と避けるべき EPUB 機能がいくつかあります。 ISO/IEC TS 22424-1 では、EPUB 形式をどのように適用するかについて説明しています。この文書は、EPUB 出版物とその METS エンコーディングの長期保存に必要な必須および推奨されるメタデータ要素に焦点を当てています。 ISO/IEC TS 22424-1 は METS の使用を推奨していますが、他のコンテナ規格も許可しています。この文書では、SIP における保存メタデータとその METS エンコーディングに焦点を当てます。これらの文書の将来の版では、BITS (Book Interchange Tag Suite) 1などの他のエンコーディングが指定される可能性があります。

ドキュメントへのアクセスを保証するために、OAIS アーカイブは、一般的に使用されているレンダリング ツールで元の形式がサポートされなくなった場合に、ドキュメントを新しいファイル形式に移行することがあります。移行するドキュメントが古い EPUB 形式の電子書籍である場合、より新しいバージョンの EPUB に移行するか、少なくとも原則として別の電子書籍形式に移行できます。

一般に、現在の形式と新しい形式に互換性があり、効率的で信頼性の高い移行ツールが利用できる場合、別のファイル形式への移行は簡単です。ターゲット形式が現在の形式のより新しいバージョンである場合、互換性は問題になりません。ただし、形式が豊富な場合、移行ツールはリソースのすべてのプロパティを表示できない可能性があります。

このドキュメントは EPUB バージョン 3 および 3.0.1 に適用されます。以前のバージョン (EPUB 2 および 2.0.1) は対象外です。バージョン 3.1 の実装は存在しないため、このドキュメントでも取り上げません。 EPUB 3.2 は 2019 年 5 月に公開されました2 。これは、このドキュメントの次の版で考慮される予定です。

このドキュメントでは、EPUB バージョン間の移行、または EPUB から他の電子書籍形式への移行に関連する問題については説明しません。他の形式への移行には損失が生じることがよくあります。他の電子書籍形式ではサポートされていない EPUB 機能があり、またその逆も同様であるため、これは電子書籍形式にも当てはまります。さらに、同じ機能がサポートされている場合でも、技術的な実装に互換性がない場合があります。たとえば、固定レイアウトを使用する EPUB 3 出版物を Amazon の KF8 形式に移行する場合、固定レイアウトのプロパティを保持するには特別な注意が必要です。これは、この機能の実装方法においてこれらの形式間に大きな技術的な違いがあるためです。

場合によっては、移行をまったく適用できないこともあります。ソース コードにアクセスしてよく理解しなければ、プログラムを移行することはできません。このような場合、長期保存は、担当する OAIS アーカイブがプログラムの元のハードウェア環境またはソフトウェア環境をエミュレートできる場合にのみ可能です。

保存コミュニティ内では、エミュレーションは一部のコンテンツにとって実行可能なオプションであると考えられています。現時点では、エミュレーションが長期的にどのように機能するかについては完全には理解されていませんが、サービスとしてのエミュレーションのアプローチが市場に登場すると、状況が変わる可能性があります。

このドキュメントのメタデータ要件は、ファイル形式の移行に基づいています。エミュレーションについては取り上げていません (エミュレーション関連の保存メタデータの 1 つの例のみが示されています) が、エミュレーションは固定レイアウト EPUB 出版物およびインタラクティブ EPUB 出版物にとって最良の保存方法である可能性があります。エミュレーションベースの保存戦略のための保存メタデータ要件は、このドキュメントの将来のバージョンに追加される可能性があります。

エミュレーションのサポートには、提出契約または関連ドキュメント内の適切なツールに関する情報だけが必要な場合があります。より持続可能なアプローチは、SIP の PREMIS メタデータ レコードの premis:object セクションにエミュレーション環境 (ハードウェアおよび/またはソフトウェア) の記述を含めることです。取り込み中に、この情報はアーカイブ情報パッケージ (AIP) にコピーされます。マイグレーションを使用する場合、AIP 内のドキュメントのバージョンをレンダリングするために必要なハードウェアおよびソフトウェア環境をアクセス環境として個別に指定できます。

移行の野心レベルは異なる場合があります。通常、保存された文書の元の外観と雰囲気を保持することは要求が多すぎると考えられるため、知的コンテンツを保存することが目的です。セマンティクスとレイアウトが相互にリンクされている場合は、元のコンテンツへのエミュレーション ベースのアクセスによるセマンティクスの保存を容易にするために、元の EPUB 出版物も保持することが重要です。

移行には、保存メタデータが必要であり、生成されます。たとえば、アーカイブのスタッフは、移行を実行するためにどのツールを使用できるか、またツールにどのような弱点があるかを把握する必要があります。保存コミュニティの目的は、この情報を PRONOM 3などの形式ライブラリで維持することです。移行後に新しい AIP が作成される場合、パッケージには、移行されたドキュメントの古い表現と新しい表現の両方と、移行イベントとドキュメントのバージョン間で起こり得る差異を説明する保存メタデータが含まれている必要があります4 。アーカイブ ユーザーは、ニーズとアーカイブされたリソースに応じて、本物であるがレンダリングが難しい可能性があるオリジナルのドキュメントと、使いやすいが信頼性が低い移行済みドキュメントの間で選択を行うことができます。実際には、保存された文書の古いバージョンにアクセスするソフトウェアを見つけるのは難しい場合があります。一方、OAIS アーカイブは、より優れたツールを使用できる場合、または移行されたドキュメントに重大な問題がある場合に、元のドキュメントを再度移行できます。

SIP に含める必要があるメタデータ要素は、デジタル保存にアプリオリに不可欠です。たとえば、デジタル署名が存在せず、安全な転送チャネルが使用されていない場合、アーカイブに入る情報が転送中に変更されていないこと、または情報が正しいソースからのものであることを保証することはできません。さらに、データがアーカイブに入る前にすでに改ざんされている場合、その後の保存アクションはすべて無駄になる可能性があります。

この文書は、EPUB 出版物の一般的な適合要件を指定していませんが、EPUB 仕様の使用にいくつかの制限を設ける可能性があります。 EPUB コンテンツ ドキュメント仕様で定められた一般的な適合要件は、SIP の EPUB 出版物にも適用されます。

ISO/IEC TS 22424-1 は、アーカイブ可能な EPUB 出版物に対する一連の要件を定義しています。詳細については、ISO/IEC TS 22424-1 を参照してください。

Introduction

This document facilitates the long-term preservation of EPUB publications by specifying metadata elements which are required or recommended for long-term preservation (such as identifiers) and the ways in which the EPUB publication and related metadata can be packaged. EPUB versions 3 and 3.0.1 are covered; if necessary, the EPUB version applicable is specified.

Long-term preservation in general requires two things:

  • making the object such as EPUB publication fit for preservation – including features to be used and feature to avoid;
  • packaging the object (and any metadata related to it) together with any additional data such as other versions of the object and other documentation into an Open Archival Information System (OAIS) submission information package (SIP).

ISO/IEC TS 22424-1 concentrates on the archivability of EPUB documents.

The background to this document comes from the Open Archival Information System, which is described in ISO/IEC TS 22424-1.

When a submission information package (SIP) is formed, mandatory preservation metadata need to be present in the package. Depending on the agreements made between the producer and the archive, metadata elements are stored either in the container document or the EPUB publication itself, or both. Usually an archive would expect to find all relevant metadata in the container, unless the submission agreement allows embedding of metadata into EPUB publications.

This document does not require any changes to be made to the current of future EPUB standards. However, when an EPUB publication is created or modified for submission to an archive, there are some EPUB features that should be used and others that should be avoided. ISO/IEC TS 22424-1 describes how the EPUB format should be applied. This document concentrates on mandatory and recommended metadata elements needed for the long-term preservation of EPUB publications and their METS encoding. ISO/IEC TS 22424-1 recommends the usage of METS but allows also other container standards; this document concentrates on preservation metadata and its METS encoding in SIPs. Future editions of these documents may specify other encodings such as BITS (Book Interchange Tag Suite) 1 .

In order to guarantee access to documents, OAIS archives may migrate documents into new file formats when the original formats are no longer supported by commonly used rendering tools. If the document to be migrated is an e-book in an outdated EPUB format, migration can be made to a more modern version of EPUB or, at least in principle, to another e-book format.

Generally, migration into another file format should be straightforward if the current and new format are compatible and there are efficient and reliable migration tools available. If the target format is a more modern version of the current format, compatibility should not be a problem. But if a format is rich, migration tools may not be able to render all the properties of a resource.

This document applies to EPUB versions 3 and 3.0.1. Earlier versions (EPUB 2 and 2.0.1) are not covered. Since there are no implementations of version 3.1, it is not covered in this document either. EPUB 3.2 was published in May 2019 2 . It will be taken into account in the next edition of this document.

This document does not cover issues related to migration between EPUB versions or from EPUB to other e-book formats. Migration to other formats is often lossy; this applies to e-book formats as well, since there are EPUB features which are not supported in other e-book formats, and vice versa. Moreover, even if the same feature is supported, technical implementations can be incompatible. For instance, if an EPUB 3 publication using fixed layout is migrated to Amazon’s KF8 format, preserving fixed layout properties requires special attention since there are significant technical differences between these formats in how this feature has been implemented.

Sometimes migration cannot be applied at all; programs cannot be migrated without access to and good understanding of the source code. In such cases long-term preservation is possible only if the OAIS archive responsible is able to emulate either the program’s original hardware or software environment.

Within the preservation community, emulation is considered to be a viable option for some content. For the time being there is no full understanding on how emulation will function in the long-term, but this may change with emulation as a service approach coming to the market.

Metadata requirements in this document are based on the migration of file formats. Emulation is not covered (just a single example of emulation-related preservation metadata is given), although emulation is likely to be the best preservation method for fixed layout EPUB publications and interactive EPUB publications. Preservation metadata requirements for emulation-based preservation strategy may be added into a future version of this document.

Supporting emulation might require just information about appropriate tools in the submission agreement or in the related documentation. A more sustainable approach is to include a description of the emulation environment (hardware and/or software) in the premis:object section of the PREMIS metadata record in the SIP. During ingest this information is copied into the archival information package (AIP). If migration is used, hardware and software environments needed for rendering the versions of the document in the AIP can be specified separately as access environments.

Ambition level of migration may vary. Usually it is to preserve the intellectual content, since retaining also the original look and feel of preserved documents is considered to be too demanding. If semantics and layout are interlinked, it is important to keep also the original EPUB publication in order to facilitate preservation of the semantics via emulation-based access to the original content.

Migration both requires and produces preservation metadata. For instance, staff in the archives has to figure out which tools can be used to carry out the migration, and what weak points they may have. The intention of the preservation community is to maintain this information in format libraries such as PRONOM 3 . When a new AIP is created after a migration, the package should contain both the old and the new representation of the migrated document and preservation metadata describing the migration event and the possible differences between the document versions 4 . Depending on their needs and archived resources archive users can then make a choice between the original, which is authentic but possibly difficult to render, and the migrated document, which should be easy to use but less authentic. In practice, finding access software to outdated versions of preserved documents may be difficult. The OAIS archive, on the other hand, can migrate the original document again when better tools can be used, or if there are significant issues in migrated documents.

Metadata elements that need to be included in SIPs are a priori essential for digital preservation. For instance, if there is no digital signature present and a secure transfer channel has not been used, it is impossible to guarantee the information entering the archive has not changed during transfer or that it is coming from a correct source. Moreover, if the data has already been tampered with before it enters the archive, all subsequent preservation actions may be useless.

This document does not specify generic conformance requirements for EPUB publications, but may make some restrictions to the use of EPUB specifications. The generic conformance requirements made in the EPUB Contents Documents Specification apply to EPUB publications in SIPs as well.

ISO/IEC TS 22424-1 defined a set of requirements for archivable EPUB publications. Please consult ISO/IEC TS 22424-1 for more information.