この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序文
ISO (国際標準化機構) は、各国の標準化団体 (ISO メンバー団体) の世界的な連合です。国際規格の作成作業は、通常、ISO 技術委員会を通じて行われます。技術委員会が設立された主題に関心のある各会員団体は、その委員会に代表される権利を有します。 ISOと連携して、政府および非政府の国際機関もこの作業に参加しています。 ISO は、電気技術の標準化に関するすべての問題について、国際電気標準会議 (IEC) と緊密に協力しています。
この文書の開発に使用された手順と、今後の維持のために意図された手順は、ISO/IEC 指令で説明されています。 1. 特に、さまざまなタイプの ISO 文書に必要なさまざまな承認基準に注意する必要があります。この文書は、ISO/IEC 指令の編集規則に従って作成されました。 2 ( www.iso.org/directives を参照)
このドキュメントの要素の一部が特許権の対象となる可能性があることに注意してください。 ISO は、そのような特許権の一部または全部を特定する責任を負わないものとします。ドキュメントの開発中に特定された特許権の詳細は、序文および/または受信した特許宣言の ISO リストに記載されます ( www.iso.org/patents を参照)
このドキュメントで使用されている商号は、ユーザーの便宜のために提供された情報であり、保証を構成するものではありません。
規格の自発的な性質の説明、適合性評価に関連する ISO 固有の用語と表現の意味、および技術的貿易障壁 (TBT) における世界貿易機関 (WTO) の原則への ISO の準拠に関する情報については、以下を参照してください。 www.iso.org/iso/foreword.html .
この文書は、技術委員会 ISO/TC 184, 自動化システムおよび統合、小委員会 SC 4, 産業データによって作成されました。
ISO 8000 シリーズのすべての部品のリストは、ISO の Web サイトにあります。
序章
デジタルデータは、次のような組織のパフォーマンスのすべての側面を強化することにより、価値をもたらします。
- 運用の有効性と効率。
- 安全;
- 顧客および一般大衆からの評判。
- 法規制の遵守。
- 消費者のコスト、収益、株価。
パフォーマンスへの影響は、情報の形式化された表現であるデータに由来します。この情報により、組織は信頼できる決定を下すことができます。この意思決定は、人間が直接行うことも、人工知能システムを含む自動化されたデータ処理によって行うこともできます。
デジタル コンピューティングと関連する通信テクノロジが広く採用されることで、組織はデジタル データに依存するようになります。この依存関係は、このデータの品質の欠如による悪影響を増幅します。これらの結果は、組織のパフォーマンスの低下です。
デジタルデータの最大の影響は、データが主題の性質を反映した構造を持ち、データが単に人間が読んで理解できるものではなく、コンピューター処理可能 (機械可読) であることからもたらされます。
ISO 9000 の内容は、品質が絶対的な完璧さの抽象的な概念ではないことを説明しています。品質とは、実際には、特性が要件に適合していることです。したがって、データのどの項目も、ある用途では高品質であっても、要件が異なる別の用途では高品質であるとは言えません。
例 1
会議の開始時刻を保存する場合、宇宙飛行中に推進装置を起動する時刻を制御システムが保存する場合よりも、カレンダー アプリケーションに必要な精度は低くなります。
デジタル データの性質は、各組織が行う特定の決定に関連する要件を確立するための基本です。
例 2
ISO/TS 8000-1 は、データに構文 (形式)、意味 (意味)、実用 (有用性) の特性があることを示しています。
高品質のデータの配信をサポートするために、ISO 8000 シリーズは以下に対応しています。
- データ ガバナンス、データ品質管理、成熟度評価。
例 3
ISO 8000-61 は、データ品質管理のプロセス参照モデルを指定しています。 - データと情報の要件の作成と適用。
例 4
ISO 8000-110 は、マスター データである特性データを交換する方法を指定します。 - データと情報の品質を監視および測定する。
例 5
ISO 8000-8 は、データと情報の品質を測定するためのアプローチを指定しています。 - データの改善、ひいては情報の質の向上。
例 6
このドキュメントでは、データ品質を改善する機会を特定するデータ プロファイリングへのアプローチを指定します。 - データ セット内のコンテンツのタイプに固有の問題。
例 7
ISO/TS 8000-311 は、製品形状データの品質に関する考慮事項に対処する方法を指定しています。
データ品質管理は、情報を提供するためのデータの作成、収集、保存、維持、転送、活用、および提示を含む、データ処理のすべての側面をカバーします。
効果的なデータ品質管理は体系的かつ体系的であり、データ品質の問題の根本原因を理解する必要があります。この理解は、既存の不適合を修正するだけでなく、それらの不適合の将来の再発を防止するソリューションを実装するための基礎でもあります。
例 8
データ セットに「yyyy‑mm‑dd」、「mm‑dd‑yy」、「dd‑mm‑yy」などの複数の形式の日付が含まれている場合、データ クレンジングによって値の一貫性を修正できます。ただし、このようなクレンジングには、あいまいなエントリ (「04‑05‑20」など) を解決するための追加情報が必要であり、不一致の原因となったトレーニングを含むプロセスの問題や人的問題に対処することはできません。
ISO 8000 シリーズのこの全体的な機能への貢献として、このドキュメントでは、実際に使用されているデータに分析手法を適用することを含む、データ プロファイリングへのアプローチを指定します。この分析により、データの構造、列、および関係から構成されるプロファイルが生成されます。プロファイルは、データの新しい明確なルールを確立することにより、データ品質を改善する機会を特定するための基礎を提供します。また、このアプローチは通常、繰り返し適用することでより大きな効果を生み出し、問題を徐々に明らかにします。
組織は、この文書を単独で使用することも、ISO 8000 シリーズの他の部分と組み合わせて使用することもできます。
このドキュメントは、以下に影響を与える活動をサポートしています。
- 1 つまたは複数の情報システム。
- 組織内および外部組織とのデータ フロー。
- データライフサイクルのあらゆる段階。
ISO 8000 シリーズの一部を実装することにより、組織は次の利点を実現します。
- デジタルトランスフォーメーションのための信頼できる基盤を確立する。
- デジタル形式のデータが、組織が価値を提供するために依存する基本的な資産クラスになったことを認識する。
- すべての利害関係者のために、証拠に基づいたデータと情報の信頼性を確保する。
- 知的財産の損失を防ぎ、組織やアプリケーション全体で再利用可能なポータブル データを作成します。
- 元の情報源までデータを追跡できるようにする。
- すべての利害関係者が明示的なデータ要件について共通の理解を持って作業できるようにします。
ISO/TS 8000-1 は、ISO 8000 シリーズの構造と範囲の詳細な説明を提供します。
附属書 A には、オープン情報システムでこのドキュメントを明確に識別する識別子が含まれています。
1 スコープ
このドキュメントでは、データ品質評価を実行するための基盤を生成するためのデータ プロファイリングの手順を指定します。このプロファイリングは、元はテーブルと列の構造にあるデータ セット、またはそのような構造を作成するための変換からの出力であるデータ セットに適用できます。
注記 1データプロファイリングは、すべてのタイプのデータベース技術に適用できます。
以下は、このドキュメントの範囲内です。
- データ要素の概念を決定するために構造分析を実行する。
- 列分析を実行して、データセットに関する統計を含む、関連するデータ要素を特定します。
- 関係分析を実行して、データ セット内の依存関係を特定します。
以下は、このドキュメントの範囲外です。
- データセットからプロファイリングするデータを抽出およびサンプリングする方法。
- データ規則の導出。
- データセットの不適合の程度を測定します。
注記 2 ISO 8000-8 は、データと情報の品質を測定する方法を指定しています。
この文書は、品質管理システム規格と組み合わせて、または独立して使用できます。
2 参考文献
以下のドキュメントは、その内容の一部またはすべてがこのドキュメントの要件を構成するように、テキスト内で参照されています。日付のある参考文献については、引用された版のみが適用されます。日付のない参照については、参照文書の最新版 (修正を含む) が適用されます。
- ISO 8000-2, データ品質 — 2: 語彙
3 用語と定義
このドキュメントの目的のために、ISO 8000-2 に記載されている用語と定義が適用されます。
ISO と IEC は、次のアドレスで標準化に使用する用語データベースを維持しています。
参考文献
| [1] | ISO/TS 8000-1, データ品質 — 概要 |
| [2] | ISO 8000-8, データ品質 — 8: 情報とデータの質: 概念と測定 |
| [3] | ISO 8000-61, データ品質 — 61: データ品質管理: プロセス参照モデル |
| [4] | ISO 8000-110, データ品質 — 110: マスターデータ: 特性データの交換: 構文、セマンティックエンコーディング、およびデータ仕様への準拠 |
| [5] | ISO/TS 8000-311, データ品質 — 311: 形状の製品データ品質の適用に関するガイダンス (PDQ-S) |
| [6] | ISO 9000, 品質管理システム — 基礎と語彙 |
| [7] | ISO/IEC/IEEE 31320-1, 情報技術—モデリング言語— 1: IDEF0 の構文と意味 |
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies (ISO member bodies). The work of preparing International Standards is normally carried out through ISO technical committees. Each member body interested in a subject for which a technical committee has been established has the right to be represented on that committee. International organizations, governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described in the ISO/IEC Directives, 1. In particular, the different approval criteria needed for the different types of ISO documents should be noted. This document was drafted in accordance with the editorial rules of the ISO/IEC Directives, 2 (see www.iso.org/directives ).
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any patent rights identified during the development of the document will be in the Introduction and/or on the ISO list of patent declarations received (see www.iso.org/patents ).
Any trade name used in this document is information given for the convenience of users and does not constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions related to conformity assessment, as well as information about ISO's adherence to the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html .
This document was prepared by Technical Committee ISO/TC 184, Automation systems and integration, Subcommittee SC 4, Industrial data.
A list of all parts in the ISO 8000 series can be found on the ISO website.
Introduction
Digital data delivers value by enhancing all aspects of organizational performance including:
- operational effectiveness and efficiency;
- safety;
- reputation with customers and the wider public;
- compliance with statutory regulations;
- consumer costs, revenues and stock prices.
The influence on performance originates from data being the formalized representation of information; this information enables organizations to make reliable decisions. This decision making can be performed by human beings directly and also by automated data processing including artificial intelligence systems.
Through widespread adoption of digital computing and associated communication technologies, organizations become dependent on digital data. This dependency amplifies the negative consequences of lack of quality in this data. These consequences are the decrease of organizational performance.
The biggest impact of digital data comes from the data having a structure that reflects the nature of the subject matter and from the data also being computer processable (machine readable) rather than just being for a person to read and understand.
The content of ISO 9000 explains that quality is not an abstract concept of absolute perfection. Quality is actually the conformance of characteristics to requirements and, thus, any item of data can be of high quality for one use but not for another use that has differing requirements.
EXAMPLE 1
When storing start times for meetings, a calendar application requires less precision than a control system would for storing the times at which to activate a propulsion unit during a spaceflight.
The nature of digital data is fundamental to establishing requirements that are relevant to the specific decisions that are made by each organization.
EXAMPLE 2
ISO/TS 8000-1 identifies that data has syntactic (format), semantic (meaning) and pragmatic (usefulness) characteristics.
To support the delivery of high‑quality data, the ISO 8000 series addresses:
- data governance, data quality management and maturity assessment;
EXAMPLE 3
ISO 8000-61 specifies a process reference model for data quality management. - creating and applying requirements for data and information;
EXAMPLE 4
ISO 8000-110 specifies how to exchange characteristic data that is master data. - monitoring and measuring data and information quality;
EXAMPLE 5
ISO 8000-8 specifies approaches to measuring data and information quality. - improving data and, consequently, information quality;
EXAMPLE 6
This document specifies an approach to data profiling, which identifies opportunities to improve data quality. - issues that are specific to the type of content in a data set.
EXAMPLE 7
ISO/TS 8000-311 specifies how to address quality considerations for product shape data.
Data quality management covers all aspects of data processing, including creating, collecting, storing, maintaining, transferring, exploiting and presenting data to deliver information.
Effective data quality management is systemic and systematic, requiring an understanding of the root causes of data quality issues. This understanding is the basis for not just correcting existing nonconformities but also implementing solutions that prevent future reoccurrence of those nonconformities.
EXAMPLE 8
If a data set includes dates in multiple formats including “yyyy‑mm‑dd”, “mm‑dd‑yy” and “dd‑mm‑yy”, then data cleansing can correct the consistency of the values. However, such cleansing requires additional information to resolve ambiguous entries (e.g. “04‑05‑20”) and cannot address any process issues and people issues, including training, that have caused the inconsistency.
As a contribution to this overall capability of the ISO 8000 series, this document specifies an approach to data profiling, which involves applying analysis techniques to data in actual use. This analysis generates a profile consisting of the structure, columns and relationships of the data. The profile provides the basis for identifying opportunities to improve data quality by establishing new explicit rules for the data. The approach also typically produces greater effect from repeated application to uncover issues progressively.
Organizations can use this document on its own or in conjunction with other parts of the ISO 8000 series.
This document supports activities that affect:
- one or more information systems;
- data flows within the organization and with external organizations;
- any phase of the data life cycle.
By implementing parts of the ISO 8000 series, an organization achieves the following benefits:
- establishing reliable foundations for digital transformation;
- recognizing how data in digital form has become a fundamental asset class that organizations rely on to deliver value;
- securing evidence‑based trustworthiness of data and information for all stakeholders;
- creating portable data that protects against the loss of intellectual property and that is reusable across the organization and applications;
- achieving traceability of data back to original sources;
- ensuring all stakeholders work with common understanding of explicit data requirements.
ISO/TS 8000-1 provides a detailed explanation of the structure and scope of the ISO 8000 series.
Annex A contains an identifier that unambiguously identifies this document in an open information system.
1 Scope
This document specifies a procedure for data profiling to generate the foundation for performing data quality assessment. This profiling is applicable to data sets that are either originally in a structure of tables and columns or are the output from a transformation to create such a structure.
NOTE 1 Data profiling is applicable to all types of database technology.
The following are within the scope of this document:
- performing structure analysis to determine data element concepts;
- performing column analysis to identify relevant data elements, including statistics about a data set;
- performing relationship analysis to identify dependencies in a data set.
The following are outside the scope of this document:
- methods for extracting and sampling data to be profiled from a data set;
- deriving data rules;
- measuring the extent of nonconformities in a data set.
NOTE 2 ISO 8000-8 specifies approaches to measuring data and information quality.
This document can be used in conjunction with, or independently of, quality management systems standards.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes requirements of this document. For dated references, only the edition cited applies. For undated references, the latest edition of the referenced document (including any amendments) applies.
- ISO 8000-2, Data quality — 2: Vocabulary
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 8000-2 apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
Bibliography
| [1] | ISO/TS 8000-1, Data quality — 1: Overview |
| [2] | ISO 8000-8, Data quality — 8: Information and data quality: Concepts and measuring |
| [3] | ISO 8000-61, Data quality — 61: Data quality management: Process reference model |
| [4] | ISO 8000-110, Data quality — 110: Master data: Exchange of characteristic data: Syntax, semantic encoding, and conformance to data specification |
| [5] | ISO/TS 8000-311, Data quality — 311: Guidance for the application of product data quality for shape (PDQ-S) |
| [6] | ISO 9000, Quality management systems — Fundamentals and vocabulary |
| [7] | ISO/IEC/IEEE 31320-1, Information technology — Modeling Languages — 1: Syntax and Semantics for IDEF0 |