ISO/TS 23471:2022 不確実性の評価のための実験計画 — 不確実性関数を決定するための要因計画の使用 | ページ 3

※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。

序章

このドキュメントは、実験によって測定の不確かさ (JCGM 100 [1] ) を決定するための標準化された単一実験室設計の必要性に応じて作成されました。これは、観測値の標準偏差が一定ではなく、測定量に依存where 、測定の不確実性がトップダウン アプローチから導出されるwhereに適用されます。この必要性は、消費者保護、食品安全、環境分析、医療診断などの分野で表明されています。

不確実性の評価では、通常、ランダムな変動から生じる不確実性と補正に関連する不確実性の定量化とその後の組み合わせが必要です。ランダムな変動は、同じ条件下での特定の実験内で、またはさまざまな条件下で発生する可能性があります。前者の種類の変動は再現性条件下で発生するため、通常、再現性標準偏差または再現性変動係数として特徴付けられます。一定範囲の条件における精度は、一般に中間精度または再現性と呼ばれます (ISO 5725 (すべての部分) [3] )

実験室の分散と再現性の分散を推定するための最も一般的な実験計画は、ISO 5725-2 で説明されている ANOVA 計画です。この設計では、参加している各研究所の再現性条件下で同数の観測が収集されます。 ISO 5725-3 には、実験室因子に加えて他の因子が変化する実験室間研究の代替設計が記載されています。このような研究デザインに基づく不確実性の評価については、ISO 21748 [6]で説明されています。同様ここで, 、観察結果は異なる検査室にグループ化されるのではなく、同じ検査室内の異なる測定条件 (例えば、異なる週または技術者) のグループにグループ化されます。グループ化係数が表す条件。たとえば、テスト結果が再現性のある条件下で週に 1 回得られた場合、分散分析によって週間の変動の影響を推定できます。

ネストされた計画は、ランダムな変動を推定するための最も一般的な計画の 1 つですが、有用な計画のクラスはこれだけではありません。たとえば、3 つの装置、3 つのバッチの試薬、および 3 つのバッチのここで, (SPE) カートリッジを使用して実施された実験を考えてみましょう。実行します。考えられるすべての組み合わせで同じ数の観測値が得られるため、この設計はバランスが取れていると呼ばれ、因子が互いにネストされていないため、因子の機器、試薬、および SPE カートリッジは「交差している」と言われます。このタイプの実験は、ISO/TS 17503 [5]で考慮されており、2 因子交差計画における平均の不確実性評価に使用されます。入れ子計画の場合と同様に、目的は 3 つの因子に対応する分散成分を抽出することです。適切なモデルが利用可能であり、統計文献では変量効果モデルまたは (1 つの因子が固定効果の場合) 混合効果モデルと呼ばれています。このアプローチは、3 つ以上の要因を考慮に入れるように拡張できます。ただし、すべての因子水準の組み合わせが計画に含まれている場合、対応する測定数が非常に多くなる可能性があります。たとえば、それぞれ 3 つの水準を持つ 5 つの因子の場合、すでに 3 5 = 243 の因子水準の組み合わせがあります。実験に 5 つ以上の因子を含める必要がある場合は、水準の数をできるだけ少なくする必要があります (2 つの水準)直交計画を実装することをお勧めします。これにより、因子水準の組み合わせの選択のみが含まれます。

このドキュメントでは、測定値が負でない数値であり、すべての分散成分が 2 つの部分で構成されていると想定しています。分散成分の推定は、いくつかの方法で実現できます。バランスの取れた計画の場合、従来の分散分析から予想される平均二乗を計算するのは簡単です。制限付き (残差とも呼ばれる) 最尤推定 (REML) は、分散成分の推定に広く推奨されており、平衡設計と不平衡設計の両方に適用できます。

Introduction

This document has been elaborated in response to the need for standardized single laboratory designs to determine measurement uncertainty (JCGM 100[1]) by means of experiments. It applies in situations where the standard deviation of the observations is not constant but depends on the measurand and where the measurement uncertainty is derived by a top-down approach. This need has been expressed in such areas as consumer protection, food safety, environmental analytics and medical diagnostics.

Uncertainty evaluation usually requires the quantification and subsequent combination of uncertainties arising from random variation and uncertainties associated with corrections. Random variation may arise within a particular experiment under the same conditions, or across a range of conditions. The former kind of variation occurs under repeatability conditions, hence usually being characterised as repeatability standard deviation or repeatability coefficient of variation; precision across a range of conditions is generally termed intermediate precision or reproducibility (ISO 5725 (all parts) [3]).

The most common experimental design for estimating the laboratory variance and the repeatability variance is the ANOVA design described in ISO 5725-2. In this design, an equal number of observations are collected under repeatability conditions for each participating laboratory. Alternative designs for interlaboratory studies, in which other factors are varied in addition to the laboratory factor, are described in ISO 5725-3. Evaluation of uncertainties based on such a study design is discussed in ISO 21748 [6]. Similarly ここで, the observations are not grouped in different laboratories but in groups of different measurement conditions (e.g. different weeks or technicians) within the same laboratory, the between-group variance component can be considered to represent the uncertainty contribution arising from random variation in the measurement condition which the grouping factor represents. For example, if test results are obtained under repeatability conditions once a week, analysis of variance can provide an estimate of the effect of variation between weeks.

While nested designs are among the most common designs for estimating random variation, they are not the only useful class of design. Consider, for example, an experiment conducted by using three instruments, three batches of reagents and three batches of a solid phase extraction (SPE) cartridges ここで, every possible combination is included in the design for a total 3 × 3 × 3 = 27 runs. As every possible combination has the same number of observations, this design is called balanced, and as factors are not nested within each other, the factors instrument, reagent and SPE cartridge are said to be ‘crossed’. This type of experiment is considered in ISO/TS 17503 [5] for the uncertainty evaluation of the mean in two-factor crossed designs. Just as in the case of the nested design, the aim is to extract the variance components corresponding to the three factors. Suitable models are available and are referred to in the statistical literature as random-effects or (if one factor is a fixed effect) mixed-effects models. This approach can be extended to take more than three factors into account. However, if all factor level combinations are included in the design, the corresponding number of measurements can become very high. For example, for five factors, each with three levels, there are already 35 = 243 factor level combinations. If it is necessary to include five or more factors in the experiment, the number of levels should be as low as possible (two levels), and it is recommended to implement an orthogonal design, whereby only a selection of factor level combinations is included.

It is assumed in this document that the measured values are non-negative numbers and that all variance components consist of two parts: one part which is proportional to the level of the measurand and another which is constant across levels. Estimation of variance components can be achieved by several methods. For balanced designs, computing expected mean squares from classical analysis of variance is straightforward. Restricted (sometimes also called residual) maximum likelihood estimation (REML) is widely recommended for estimation of variance components and is applicable to both balanced and unbalanced designs.