ISO 28500:2017 情報とドキュメント—WARCファイル形式 | ページ 6

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語、定義および略語

3.1 用語と定義

このドキュメントでは、次の用語と定義が適用されます。

ISO および IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。

3.1.1

WARCレコード

一連のWARCレコードからなるWARCファイルの基本構成要素

3.1.2

WARC レコードコンテンツブロック

ヘッダーに続き、WARC レコードの本体を形成する WARC レコードの一部 (ゼロまたはそれ以上のオクテット)

3.1.3

WARC レコードのペイロード

コンテンツ ブロックの意味のあるサブセットとして参照されるか、WARC レコードに含まれるデータ オブジェクト

3.1.4

WARC レコードのヘッダー

指定されたバージョン番号を持つ WARC フォーマットで開始するレコードを宣言する最初の 1 行と、その後に続く空白行までの名前付きフィールドの行で構成される、WARC レコードの

3.1.5

WARC 名前付きフィールド

名前、コロン、および値で構成される要素のセットで、インデントされた行に長い値が続く

3.1.6

WARC 論理レコード

<segmentation> レコードは複数のセグメントで構成され、それぞれが WARC レコードで表されます

3.2 略語

ABNF拡張バッカス・ナウア形式
アークアーカイブ
CRLFキャリッジ リターン改行
DNSドメインネームシステム
FTPファイル転送プロトコル
HTTPハイパーテキスト トランスポート プロトコル
イアナインターネット割り当て番号機関
IESGインターネットエンジニアリング運営グループ
RFCコメントの要求
UR (I/L/N)均一リソース (識別子/ロケーター/名前)
ウォークウェブアーカイブ

参考文献

1ISO 8601:2004, データ要素と交換フォーマット - 情報交換 - 日付と時刻の表現
2ARCバーナーM.、ケールB. ARC ファイル形式。 1996 年 9 月 15 日。 http://www.archive.org/web/researcher/ArcFileFormat.php で入手可能
3DCMI, DCMI メタデータ用語。入手先: http://dublincore.org/documents/dcmi-terms/
4RFC1950ドイツ語P.、 Gailly J.-L. ZLIB 圧縮データ形式仕様バージョン 3.3 。 1996 年 5 月 (TXT, PS, PDF)入手可能: https://www.ietf.org/rfc/rfc1950.txt
5RFC1951ドイツ語P.デフレート。圧縮データ形式仕様バージョン 1.3 。 1996 年 5 月 (TXT, PS, PDF) https://www.ietf.org/rfc/rfc1951.txt で入手可能
6RFC1952ドイツ語P.GZIP ファイル形式仕様バージョン 4.3 。 1996 年 5 月 (TXT, PS, PDF) https://www.ietf.org/rfc/rfc1952.txt
7RFC2047 Moore K. MIME (多目的インターネット メール拡張) Part 3: 非 ASCII テキストのメッセージ ヘッダー拡張。 1996 年 11 月 (TXT, HTML, XML)入手可能: https://www.ietf.org/rfc/rfc2047.txt
8RFC2048 F reed N, Klensin J, Postel J. Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures . BCP 13, RFC 2048, 1996 年 11 月 (TXT, HTML, XML) https://www.ietf.org/rfc/rfc2048.txt で入手可能
9RFC4501 Josephsson S. Domain Name System Uniform Resource Identifiers . 2006 年 5 月。https: //tools.ietf.org/html/rfc4501 で入手可能
10RFC4648 Josephsson S. Base16, Base32, および Base64 データ エンコーディング。 2006 年 10 月。 https://tools.ietf.org/html/rfc4648 で入手可能
11WARC ファイル形式 (ISO 28500) - 情報、メンテナンス、ドラフト、 http://bibnum.bnf.fr/warc/ で入手可能。

3 Terms, definitions and abbreviated terms

3.1 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

3.1.1

WARC record

basic constituent of a WARC file, consisting of a sequence of WARC records

3.1.2

WARC record content block

part (zero or more octets) of a WARC record that follows the header and that forms the main body of a WARC record

3.1.3

WARC record payload

data object referred to, or contained by a WARC record as a meaningful subset of the content block

3.1.4

WARC record header

beginning of a WARC record, consisting of one first line declaring the record to be in the WARC format with a given version number, followed by lines of named fields up to a blank line

3.1.5

WARC named fields

set of elements consisting of a name, a colon, and a value, with long values continued on indented lines

3.1.6

WARC logical record

<segmentation> record composed of multiple segments, each represented by a WARC record

3.2 Abbreviated terms

ABNFaugmented Backus-Naur form
ARCarchive
CRLFcarriage return line feed
DNSdomain name system
FTPfile transfer protocol
HTTPhypertext transport protocol
IANAInternet Assigned Numbers Authority
IESGInternet Engineering Steering Group
RFCrequest for comments
UR (I/L/N)uniform resource (identifier/locator/name)
WARCweb archive

Bibliography

1ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of dates and times
2ARC Burner M., Kahle B. ARC File Format. 15 September 1996. Available at: http://www.archive.org/web/researcher/ArcFileFormat.php
3DCMI, DCMI Metadata Terms. Available at: http://dublincore.org/documents/dcmi-terms/
4RFC1950 Deutsch P., Gailly J.-L. ZLIB Compressed Data Format Specification version 3.3. May 1996 (TXT, PS, PDF). Available at: https://www.ietf.org/rfc/rfc1950.txt
5RFC1951 Deutsch P. Deflate. Compressed Data Format Specification version 1.3. May 1996 (TXT, PS, PDF). Available at: https://www.ietf.org/rfc/rfc1951.txt
6RFC1952 Deutsch P. GZIP file format specification version 4.3. May 1996 (TXT, PS, PDF). https://www.ietf.org/rfc/rfc1952.txt
7RFC2047 Moore K. MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text. November 1996 (TXT, HTML, XML). Available at: https://www.ietf.org/rfc/rfc2047.txt
8RFC2048 Freed N., Klensin J., Postel J. Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures. BCP 13, RFC 2048, November 1996 (TXT, HTML, XML). Available at: https://www.ietf.org/rfc/rfc2048.txt
9RFC4501 Josefsson S. Domain Name System Uniform Resource Identifiers. May 2006. Available at: https://tools.ietf.org/html/rfc4501
10RFC4648 Josefsson S. The Base16, Base32, and Base64 Data Encodings. October 2006. Available at: https://tools.ietf.org/html/rfc4648
11The WARC File Format (ISO 28500) - Information, Maintenance, Drafts, available at http://bibnum.bnf.fr/warc/ .