この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
導入
データは分析と機械学習 (ML) の原材料であり、データ品質は関連する分析と ML プロジェクトおよびシステムにとって重要な側面です。 ISO/IEC 5259 シリーズの目的は、分析と ML に使用されるデータの品質を評価および改善するためのツールと方法を提供することです。
ISO/IEC 5259 シリーズのその他の部分には次のものがあります。
- ISO/IEC 5259-2 1は、分析と ML のコンテキストでのデータ品質のレポートに関するデータ品質モデル、データ品質の尺度、およびガイダンスを提供します。 ISO/IEC 5259-2 は、ISO 8000 シリーズ、ISO/IEC 25012, および ISO/IEC 25024 に基づいています。ISO/IEC 5259-2 の目的は、組織がデータ品質目標を達成できるようにすることであり、あらゆるタイプの組織に適用されます。
- ISO/IEC 5259-3 は要件を指定し、分析と ML の分野で使用されるデータの品質を確立、実装、維持し、継続的に改善するためのガイダンスを提供します。ISO/IEC 5259-3 では、詳細なプロセス、方法、測定は定義されていません。むしろ、ISO/IEC 5259-3 の要件を満たすように調整できる参照プロセスおよび方法とともに、品質管理プロセスの要件とガイダンスを定義します。ISO/IEC 5259-3 に定められた要件と推奨事項は一般的なものであり、種類、規模、性質に関係なく、すべての組織に適用されることを目的としています。
- ISO/IEC 5259-4 は、適用する組織の種類、規模、性質に関係なく、分析と ML のトレーニングと評価のデータ品質を確保するための一般的な組織的アプローチを提供します。これには、以下のデータ品質プロセスに関するガイドラインが含まれています。
- トレーニング データのラベル付けのための一般的な組織的アプローチを含む、ML システムのトレーニングに使用されるデータのラベル付けに関する教師付き M
- 教師なし M
- 半教師ありM
- 強化学習。
- 分析。
ISO/IEC 5259-4 は、データの取得とデータの構成、データの前処理、データのラベル付け、評価とデータの使用など、さまざまなソースから得られるトレーニングおよび評価データに適用されます。 ISO/IEC 5259-4 では、特定のサービス、プラットフォーム、ツールは定義されていません。
ISO/IEC 5259-5 2は、分析と機械学習のためのデータ品質ガバナンス フレームワークを提供し、組織の統治機関が、DLC モデル全体にわたって適切な制御を使用して、データ品質対策、管理、および関連プロセスの実装と運用を指示および監督できるようにします。 ISO/IEC 5259-1に準拠。
ISO/IEC TR 5259-6 3では、分析と ML におけるデータ品質の視覚化フレームワークについて説明しています。目的は、関係者が視覚化手法を使用してデータ品質測定の結果にアクセスできるようにすることです。この視覚化フレームワークは、データ品質の目標をサポートします。
Introduction
Data are the raw material for analytics and machine learning (ML) and data quality is a critical aspect for related analytics and ML projects and systems. The aim of the ISO/IEC 5259 series is to provide tools and methods to assess and improve the quality of data used for analytics and ML.
Other parts of the ISO/IEC 5259 series include:
- ISO/IEC 5259-2 1 provides a data quality model, data quality measures and guidance on reporting data quality in the context of analytics and ML. ISO/IEC 5259-2 builds on the ISO 8000 series, ISO/IEC 25012 and ISO/IEC 25024.The aim of ISO/IEC 5259-2 is to enable organizations to achieve their data quality objectives and is applicable to all types of organizations.
- ISO/IEC 5259-3 specifies requirements and provides guidance for establishing, implementing, maintaining and continually improving the quality for data used in the areas of analytics and ML.ISO/IEC 5259-3 does not define detailed processes, methods or measurement. Rather it defines the requirements and guidance for a quality management process along with a reference process and methods that can be tailored to meet the requirements in ISO/IEC 5259-3.The requirements and recommendations set out in ISO/IEC 5259-3 are generic and are intended to be applicable to all organizations, regardless of type, size or nature.
- ISO/IEC 5259-4 provides general common organizational approaches, regardless of type, size or nature of the applying organization, to ensure data quality for training and evaluation in analytics and ML. It includes guidelines on the data quality process for:
- supervised ML with regard to the labelling of data used for training ML systems, including common organizational approaches for training data labelling;
- unsupervised ML;
- semi-supervised ML;
- reinforcement learning;
- analytics.
ISO/IEC 5259-4 is applicable to training and evaluation data that come from different sources, including data acquisition and data composition, data pre-processing, data labelling, evaluation and data use. ISO/IEC 5259-4 does not define specific services, platforms or tools.
ISO/IEC 5259-5 2 provides a data quality governance framework for analytics and machine learning to enable the governing bodies of organization to direct and oversee the implementation and operation of data quality measures, management, and related processes with adequate controls throughout the DLC model according to ISO/IEC 5259-1.
ISO/IEC TR 5259-6 3 describes a visualization framework for data quality in analytics and ML. The aim is to enable stakeholders using visualization methods to access the results of data quality measures. This visualization framework supports data quality goals.