この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
3 用語、定義および略語
3.1 用語と定義
このドキュメントでは、次の用語と定義が適用されます。
ISO および IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
3.1.1
WARCレコード
一連のWARCレコードからなるWARCファイルの基本構成要素
3.1.2
WARC レコードコンテンツブロック
ヘッダーに続き、WARC レコードの本体を形成する WARC レコードの一部 (ゼロまたはそれ以上のオクテット)
3.1.3
WARC レコードのペイロード
コンテンツ ブロックの意味のあるサブセットとして参照されるか、WARC レコードに含まれるデータ オブジェクト
3.1.4
WARC レコードのヘッダー
指定されたバージョン番号を持つ WARC フォーマットで開始するレコードを宣言する最初の 1 行と、その後に続く空白行までの名前付きフィールドの行で構成される、WARC レコードの
3.1.5
WARC 名前付きフィールド
名前、コロン、および値で構成される要素のセットで、インデントされた行に長い値が続く
3.1.6
WARC 論理レコード
<segmentation> レコードは複数のセグメントで構成され、それぞれが WARC レコードで表されます
3.2 略語
| ABNF | 拡張バッカス・ナウア形式 |
| アーク | アーカイブ |
| CRLF | キャリッジ リターン改行 |
| DNS | ドメインネームシステム |
| FTP | ファイル転送プロトコル |
| HTTP | ハイパーテキスト トランスポート プロトコル |
| イアナ | インターネット割り当て番号機関 |
| IESG | インターネットエンジニアリング運営グループ |
| RFC | コメントの要求 |
| UR (I/L/N) | 均一リソース (識別子/ロケーター/名前) |
| ウォーク | ウェブアーカイブ |
参考文献
| 1 | ISO 8601:2004, データ要素と交換フォーマット - 情報交換 - 日付と時刻の表現 |
| 2 | ARCバーナーM.、ケールB. ARC ファイル形式。 1996 年 9 月 15 日。 http://www.archive.org/web/researcher/ArcFileFormat.php で入手可能 |
| 3 | DCMI, DCMI メタデータ用語。入手先: http://dublincore.org/documents/dcmi-terms/ |
| 4 | RFC1950ドイツ語P.、 Gailly J.-L. ZLIB 圧縮データ形式仕様バージョン 3.3 。 1996 年 5 月 (TXT, PS, PDF)入手可能: https://www.ietf.org/rfc/rfc1950.txt |
| 5 | RFC1951ドイツ語P.デフレート。圧縮データ形式仕様バージョン 1.3 。 1996 年 5 月 (TXT, PS, PDF) https://www.ietf.org/rfc/rfc1951.txt で入手可能 |
| 6 | RFC1952ドイツ語P.GZIP ファイル形式仕様バージョン 4.3 。 1996 年 5 月 (TXT, PS, PDF) https://www.ietf.org/rfc/rfc1952.txt |
| 7 | RFC2047 Moore K. MIME (多目的インターネット メール拡張) Part 3: 非 ASCII テキストのメッセージ ヘッダー拡張。 1996 年 11 月 (TXT, HTML, XML)入手可能: https://www.ietf.org/rfc/rfc2047.txt |
| 8 | RFC2048 F reed N, Klensin J, Postel J. Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures . BCP 13, RFC 2048, 1996 年 11 月 (TXT, HTML, XML) https://www.ietf.org/rfc/rfc2048.txt で入手可能 |
| 9 | RFC4501 Josephsson S. Domain Name System Uniform Resource Identifiers . 2006 年 5 月。https: //tools.ietf.org/html/rfc4501 で入手可能 |
| 10 | RFC4648 Josephsson S. Base16, Base32, および Base64 データ エンコーディング。 2006 年 10 月。 https://tools.ietf.org/html/rfc4648 で入手可能 |
| 11 | WARC ファイル形式 (ISO 28500) - 情報、メンテナンス、ドラフト、 http://bibnum.bnf.fr/warc/ で入手可能。 |
3 Terms, definitions and abbreviated terms
3.1 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
3.1.1
WARC record
basic constituent of a WARC file, consisting of a sequence of WARC records
3.1.2
WARC record content block
part (zero or more octets) of a WARC record that follows the header and that forms the main body of a WARC record
3.1.3
WARC record payload
data object referred to, or contained by a WARC record as a meaningful subset of the content block
3.1.4
WARC record header
beginning of a WARC record, consisting of one first line declaring the record to be in the WARC format with a given version number, followed by lines of named fields up to a blank line
3.1.5
WARC named fields
set of elements consisting of a name, a colon, and a value, with long values continued on indented lines
3.1.6
WARC logical record
<segmentation> record composed of multiple segments, each represented by a WARC record
3.2 Abbreviated terms
| ABNF | augmented Backus-Naur form |
| ARC | archive |
| CRLF | carriage return line feed |
| DNS | domain name system |
| FTP | file transfer protocol |
| HTTP | hypertext transport protocol |
| IANA | Internet Assigned Numbers Authority |
| IESG | Internet Engineering Steering Group |
| RFC | request for comments |
| UR (I/L/N) | uniform resource (identifier/locator/name) |
| WARC | web archive |
Bibliography
| 1 | ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of dates and times |
| 2 | ARC Burner M., Kahle B. ARC File Format. 15 September 1996. Available at: http://www.archive.org/web/researcher/ArcFileFormat.php |
| 3 | DCMI, DCMI Metadata Terms. Available at: http://dublincore.org/documents/dcmi-terms/ |
| 4 | RFC1950 Deutsch P., Gailly J.-L. ZLIB Compressed Data Format Specification version 3.3. May 1996 (TXT, PS, PDF). Available at: https://www.ietf.org/rfc/rfc1950.txt |
| 5 | RFC1951 Deutsch P. Deflate. Compressed Data Format Specification version 1.3. May 1996 (TXT, PS, PDF). Available at: https://www.ietf.org/rfc/rfc1951.txt |
| 6 | RFC1952 Deutsch P. GZIP file format specification version 4.3. May 1996 (TXT, PS, PDF). https://www.ietf.org/rfc/rfc1952.txt |
| 7 | RFC2047 Moore K. MIME (Multipurpose Internet Mail Extensions) Part Three: Message Header Extensions for Non-ASCII Text. November 1996 (TXT, HTML, XML). Available at: https://www.ietf.org/rfc/rfc2047.txt |
| 8 | RFC2048 Freed N., Klensin J., Postel J. Multipurpose Internet Mail Extensions (MIME) Part Four: Registration Procedures. BCP 13, RFC 2048, November 1996 (TXT, HTML, XML). Available at: https://www.ietf.org/rfc/rfc2048.txt |
| 9 | RFC4501 Josefsson S. Domain Name System Uniform Resource Identifiers. May 2006. Available at: https://tools.ietf.org/html/rfc4501 |
| 10 | RFC4648 Josefsson S. The Base16, Base32, and Base64 Data Encodings. October 2006. Available at: https://tools.ietf.org/html/rfc4648 |
| 11 | The WARC File Format (ISO 28500) - Information, Maintenance, Drafts, available at http://bibnum.bnf.fr/warc/ . |