ISO 24138:2024 情報とドキュメント — 国際標準内容コード (ISCC) | ページ 6

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

3 用語と定義

この文書の目的上、次の用語と定義が適用されます。

ISO と IEC は、標準化に使用する用語データベースを次のアドレスで維持しています。

3.1

少し

コンピュータシステムにおける情報の原子単位

3.2

バイト

8 ビットのシーケンス (3.1)

3.3

かじる

半 バイト (3.2) 、単一の 16 進数で表すことができます

[出典:ISO 20038:2017, 3.12]

3.4

データ

ビットの順序付けされたシーケンス (3.1)

3.5

ファイル

既知の ビット数 (3.1) とファイル名を持つ保存 データ (3.4)

3.6

ストリーム

既知または未知の ビット数 (3.1) で送信中の データ (3.4)

3.7

コンテンツ

ユーザーに価値を提供するために整理された情報

3.8

デジタルコンテンツ

一連のルールに従って構造化された データ (3.4) の形式での コンテンツ (3.7) の表現

3.9

メタデータ

他のデータを定義および説明する データ (3.4)

[出典:ISO 24531:2013, 4.32]

3.10

シードメタデータ

ハッシュ アルゴリズム (3.1) 関数への入力として使用される初期 メタデータ (3.9)

3.11

コンテンツフォーマット

デジタルコンテンツを構造化するために使用される一連のルール (3.8)

3.12

メディアタイプ

参照されるデータの性質を指定する 2 つの部分からなる 識別子 (3.15) (3.4)

[出典:ISO/IEC 19757-4:2006, 3.9]

3.13

デジタル資産

特定の コンテンツ形式 (3.11) に準拠してエンコードされた ファイル (3.5) or ストリーム (3.6)

3.14

指示対象

識別されるオブジェクト

3.15

識別子

指示対象を一意に示す文字のシーケンス (3.14)

3.16

識別子システム

指定されたカテゴリの 指示対象 (3.14) に対する 識別子 (3.15) の提供を可能にするシステム

3.17

コンテンツ識別子

参照対象 (3.14) が 内容 (3.7) is ある 識別子 (3.15 )

3.18

コンテンツ依存の識別子

コンテンツ識別子 (3.18) の データ (3.4) は、 それが識別する デジタル コンテンツ (3.8) に依存します。

3.19

コンテンツ認識システム

デジタル コンテンツ (3.8) を 詳細なレベルで認識することを主な目的とするシステム

3.20

アルゴリズム

指示セット

3.21

ハッシュアルゴリズム

任意長データの入力から固定長 データ (3.4) を生成する決定論的 アルゴリズム (3.20)

3.22

ハッシュダイジェスト

ハッシュ アルゴリズム (3.21) を使用して データ (3.4) を処理した結果

3.23

暗号ハッシュ関数

共通の値にハッシュされる 2 つの異なる値を見つけることが計算上不可能になるように、任意の長さのバイナリ文字列を固定長のバイナリ文字列にマッピングする計算効率の高い関数

3.24

類似性ハッシュ

ハッシュ アルゴリズム (3.21) への入力間の相関関係を保存する ハッシュ ダイジェスト (3.22 )

3.25

コンテンツ定義のチャンク化

CDC

内部特徴に基づいて データ (3.4) を可変長チャンクに分割し、チャンク境界が バイト (3.2) シフトに対してより耐性を持つようにする方法

3.26

俳優

システムと対話する人間または人間以外の (ハードウェアまたはソフトウェア) エンティティ

3.27

マークルツリー

ツリー データ構造。このデータ構造では、すべてのリーフ ノードがデータ要素の ハッシュ ダイジェスト (3.22) でラベル付けされ、すべての非リーフ ノードがその子ノードのラベルのハッシュ ダイジェストでラベル付けされます。

3.28

マークルルート

マークルツリーのルートノード (3.27)

[出典:ISO 22739:2024, 3.57]

3.29

ISCCプロセッサ

デジタル コンテンツの ISCC を生成するアプリケーション (3.8)

3.30

プレーンテキスト

Unicode にトランスコードできる既知のテキスト エンコーディングの データ (3.4)

3.31

空白

フリーテキストのブロック内に埋め込まれた、スペースやタブなどの非表示の書式設定文字

[出典:ISO/IEC/IEEE 31320-2:2012, 3.1.210]

参考文献

1ISO 1668, グラフィック テクノロジー — 拡張可能なメタデータ プラットフォーム (XMP)
2ISO/IEC 19757-4:2006, 情報技術 — ドキュメント スキーマ定義言語 (DSDL) — Part 4: 名前空間ベースの検証ディスパッチ言語 (NVDL)
3ISO 20038:2017, 銀行業務および関連金融サービス — AES を使用したキーラップ
4ISO 22739:2024, ブロックチェーンおよび分散型台帳テクノロジー — 語彙
5ISO 24531:2013, 高度道路交通システム — システム アーキテクチャ、分類法、用語 — ITS 標準、データ レジストリ、およびデータ ディクショナリでの XML の使用
6ISO/IEC/IEEE 31320-2:2012, 情報技術モデリング言語 - Part 2: IDEF1X97 (IDEFobject) の構文とセマンティクス
7IETF, RFC 3986, Uniform Resource Identifier (URI): 一般構文6
8IETF, BCP 47, 言語を識別するためのタグ7
9IETF, RFC 6838, メディアType 仕様と登録手順8
10O'Connor J.、Aumasson JP, Neves S.、Wilcox-O'Hearn Z.、 BLAKE3: 1 つの機能をほぼどこでも。バージョン 20211102173700, 2022 年 7 月にアクセス。 https://github.com/BLAKE3-team/BLAKE3-specs/blob/master/blake3.pdf で入手可能
11コレット、ヤン。 xxHash: 非常に高速なハッシュ アルゴリズム。 2022 年 7 月にアクセス、 https://chan4973.github.io/xxHash/ で入手可能
12IETF, draft-multiformats-multihash-05 — https://datatracker.ietf.org/doc/html/draft-multiformats-multihash-05 で入手可能なマルチハッシュ データ形式
13IETF, draft-multiformats-multibase-06 — https://datatracker.ietf.org/doc/html/draft-multiformats-multibase-06 で入手可能なマルチベース データ形式
14IETF, draft-bhutton-json-schema-01 — JSON スキーマ: JSON ドキュメントを記述するためのメディアType https://datatracker.ietf.org/doc/html/draft-bhutton-json-schema-01 で入手可能

3 Terms and definitions

For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminology databases for use in standardization at the following addresses:

3.1

bit

atomic unit of information in a computer system

3.2

byte

sequence of 8 bits (3.1)

3.3

nibble

half a byte (3.2) , which can be represented by a single hexadecimal digit

[SOURCE:ISO 20038:2017, 3.12]

3.4

data

ordered sequence of bits (3.1)

3.5

file

stored data (3.4) with a known number of bits (3.1) and a filename

3.6

stream

data (3.4) in transit with a known or unknown number of bits (3.1)

3.7

content

information organized to provide value to a user

3.8

digital content

manifestation of content (3.7) in form of data (3.4) structured according to a set of rules

3.9

metadata

data (3.4) that defines and describes other data

[SOURCE:ISO 24531:2013, 4.32]

3.10

seed metadata

initial metadata (3.9) used as input to a hash algorithm (3.1) function

3.11

content format

set of rules used to structure digital content (3.8)

3.12

media type

two-part identifier (3.15) specifying the nature of the referenced data (3.4)

[SOURCE:ISO/IEC 19757-4:2006, 3.9]

3.13

digital asset

file (3.5) or stream (3.6) encoded in conformance with a specific content format (3.11)

3.14

referent

object which is identified

3.15

identifier

sequence of characters that uniquely denotes a referent (3.14)

3.16

identifier system

system to enable the provision of identifiers (3.15) for a given category of referents (3.14)

3.17

content identifier

identifier (3.15) whose referent (3.14) is content (3.7)

3.18

content-dependent identifier

content identifier (3.18) whose data (3.4) depends on the digital content (3.8) that it identifies

3.19

content recognition system

system whose primary purpose is to recognise digital content (3.8) on a granular level

3.20

algorithm

set of instructions

3.21

hash algorithm

deterministic algorithm (3.20) that produces fixed-length data (3.4) from an input of arbitrary-length data

3.22

hash digest

result of processing data (3.4) with a hash algorithm (3.21)

3.23

cryptographic hash function

computationally efficient function mapping binary strings of arbitrary length to binary strings of fixed length, such that it is computationally infeasible to find two distinct values that hash into a common value

3.24

similarity hash

hash digest (3.22) that preserves correlations between inputs to the hash algorithm (3.21)

3.25

content defined chunking

CDC

method to split data (3.4) into variable length chunks based on internal features such that chunk boundaries are more resistant to byte (3.2) shifting

3.26

actor

human or non-human (hardware or software) entity that interacts with a system

3.27

Merkle tree

tree data structure in which every leaf node is labelled with the hash digest (3.22) of a data element and every non-leaf node is labelled with the hash digest of the labels of its child nodes

3.28

Merkle root

root node of a Merkle tree (3.27)

[SOURCE:ISO 22739:2024, 3.57]

3.29

ISCC processor

application that generates ISCCs for digital content (3.8)

3.30

plain text

data (3.4) with a known text encoding that can be transcoded to Unicode

3.31

whitespace

nondisplaying formatting characters such as spaces, tabs, etc., that are embedded within a block of free text

[SOURCE:ISO/IEC/IEEE 31320-2:2012, 3.1.210]

Bibliography

1ISO 16684 (all parts), Graphic technology — Extensible metadata platform (XMP)
2ISO/IEC 19757-4:2006, Information technology — Document Schema Definition Languages (DSDL) — Part 4: Namespace-based Validation Dispatching Language (NVDL)
3ISO 20038:2017, Banking and related financial services — Key wrap using AES
4ISO 22739:2024, Blockchain and distributed ledger technologies — Vocabulary
5ISO 24531:2013, Intelligent transport systems — System architecture, taxonomy and terminology — Using XML in ITS standards, data registries and data dictionaries
6ISO/IEC/IEEE 31320-2:2012, Information technology Modeling Languages — Part 2: Syntax and Semantics for IDEF1X97 (IDEFobject)
7IETF, RFC 3986, Uniform Resource Identifier (URI): Generic Syntax6
8IETF, BCP 47, Tags for Identifying Languages7
9IETF, RFC 6838, Media Type Specifications and Registration Procedures8
10O’Connor J., Aumasson J.P., Neves S., Wilcox-O’Hearn Z., BLAKE3: one function, fast everywhere. Version 20211102173700, accessed July 2022. Available at https://github.com/BLAKE3-team/BLAKE3-specs/blob/master/blake3.pdf
11Collet, Yann. xxHash: Extremely fast hash algorithm. Accessed July 2022, available at https://cyan4973.github.io/xxHash/
12IETF, draft-multiformats-multihash-05 — The Multihash Data Format Available at https://datatracker.ietf.org/doc/html/draft-multiformats-multihash-05
13IETF, draft-multiformats-multibase-06 — The Multibase Data Format Available at https://datatracker.ietf.org/doc/html/draft-multiformats-multibase-06
14IETF, draft-bhutton-json-schema-01 — JSON Schema: A Media Type for Describing JSON Documents Available at https://datatracker.ietf.org/doc/html/draft-bhutton-json-schema-01