この規格 プレビューページの目次
※一部、英文及び仏文を自動翻訳した日本語訳を使用しています。
序章
ISO/IEC Guide 98-3 (GUM) [1]の採用により、測定結果に不確かさの記述を含める必要性がますます認識されるようになりました。 ISO 17025 [2]などの国際規格に基づく試験所認定により、このプロセスが加速されました。効果的な意思決定には不確かさの記述が必要であることを認識し、国立計量研究所から民間の校正研究所まで、あらゆるタイプの研究所の計量学者は、GUM で与えられた方法を使用して、さまざまなタイプの測定に対する適切な不確かさ評価の開発にかなりの努力を払っています。 .
GUM で概説され普及している手順の強みのいくつかは、不確実性評価への標準化されたアプローチ、統計的 (タイプ A) または非統計的 (タイプ B) のいずれかで評価される不確実性の原因の調整、および報告の強調です。不確実性のすべての原因が考慮されます。測定関数の線形近似に基づく、GUM での不確実性伝搬への主なアプローチは、一般に実行が簡単で、多くの実際的な状況で、より正式に得られた結果と同様の結果が得られます。つまり、採用以来、GUM は不確実性評価に革命をもたらしました。
もちろん、特定のアプリケーションにおける不確実性の評価を改善し、それを拡張して追加の領域をカバーするためには、常に多くの作業が必要になります。そのような他の作業の中で、2000 年から GUM を担当している合同委員会 (JCGM) は、GUM の補足 1, つまり「モンテカルロ法を使用した分布の伝播」(GUMS1 と呼ばれる) を完成させました。 ) [3] . JCGM は、モデリングや任意の数の出力量を持つモデルなどのトピックに関する GUM の他の補足を開発しています。
可能な限り幅広い測定問題に適用する必要があるため、ISO/IEC Guide 99:2007 [4]の測定の不確かさの定義は、「測定量に起因する量の値の分散を特徴付ける非負のパラメーター」として定義されています。 、使用された情報に基づいて」は、比較的概念的なレベル以上で合理的に与えることはできません。その結果、不確かさの評価におけるさまざまな統計量の適切な役割を定義して理解することは、比較的よく理解されている測定アプリケーションであっても、統計学者と計測学者の両方にとって特に関心のあるトピックです。
以前の調査では、計量学的観点からこれらのトピックにアプローチしており、一部の著者は、GUM で指定された手順の統計的特性の特徴付けに焦点を当てています。参考文献 [5] は、これらの手順がベイジアン解釈または頻度論的解釈のいずれとも厳密には一致しないことを示しています。参考文献 [6] では、状況によっては結果をベイジアン解釈とより密接に一致させるために、GUM 手順に若干の変更を加えることが提案されています。参考文献 [7] では、GUMS1 で提案されている不確実性評価の手順と、特定のクラスのモデルに対するベイジアン分析の結果との関係について説明しています。参考文献 [8] では、カバレッジ間隔のさまざまな可能性のある確率論的解釈についても説明し、このクラスのベイジアン分析の事後分布をピアソン分布族の確率分布で近似することを推奨しています。
参考文献 [9] では、評価の不確実性に対する頻度論的 (「従来型」) アプローチとベイジアン アプローチを比較しています。ただし、この研究は、タイプ A の方法を使用してすべての不確実性の原因を評価できる測定システムに限定されています。対照的に、タイプ A とタイプ B の両方の方法を使用して評価された不確かさの原因を持つ測定システムは、このテクニカル レポートで扱われ、GUM の附属書 H の例の 1 つを含むいくつかの例を使用して説明されています。
統計学者は歴史的に、確率論的正当化または解釈を伴う不確実性評価の方法を使用することに重点を置いてきました。彼らの仕事を通じて、多くの場合計測学の外で、不確実性評価に関連する統計的推論のためのいくつかの異なるアプローチが開発されました。このテクニカル レポートでは、統計的観点からの不確実性評価へのこれらのアプローチのいくつかを紹介し、それらを現在計測で使用されている方法、または計測コミュニティ内で開発されている方法に関連付けます。不確実性評価のさまざまな方法が説明される特定の統計的アプローチは、頻度主義、ベイジアン、および基準アプローチであり、さまざまなタイプの量を区別するために必要な表記規則の概要を説明した後にさらに説明します。
Introduction
The adoption of ISO/IEC Guide 98-3 (GUM) [1] has led to an increasing recognition of the need to include uncertainty statements in measurement results. Laboratory accreditation based on International Standards like ISO 17025 [2] has accelerated this process. Recognizing that uncertainty statements are required for effective decision-making, metrologists in laboratories of all types, from National Metrology Institutes to commercial calibration laboratories, are exerting considerable effort on the development of appropriate uncertainty evaluations for different types of measurement using methods given in the GUM.
Some of the strengths of the procedures outlined and popularized in the GUM are its standardized approach to uncertainty evaluation, its accommodation of sources of uncertainty that are evaluated either statistically (Type A) or non-statistically (Type B), and its emphasis on reporting all sources of uncertainty considered. The main approach to uncertainty propagation in the GUM, based on linear approximation of the measurement function, is generally simple to carry out and in many practical situations gives results that are similar to those obtained more formally. In short, since its adoption, the GUM has sparked a revolution in uncertainty evaluation.
Of course, there will always be more work needed to improve the evaluation of uncertainty in particular applications and to extend it to cover additional areas. Among such other work, the Joint Committee for Guides in Metrology (JCGM), responsible for the GUM since the year 2000, has completed Supplement 1 to the GUM, namely, “Propagation of distributions using a Monte Carlo method” (referred to as GUMS1) [3] . The JCGM is developing other supplements to the GUM on topics such as modelling and models with any number of output quantities.
Because it should apply to the widest possible set of measurement problems, the definition of measurement uncertainty in ISO/IEC Guide 99:2007 [4] as a “non-negative parameter characterizing the dispersion of the quantity values being attributed to a measurand, based on the information used” cannot reasonably be given at more than a relatively conceptual level. As a result, defining and understanding the appropriate roles of different statistical quantities in uncertainty evaluation, even for relatively well-understood measurement applications, is a topic of particular interest to both statisticians and metrologists.
Earlier investigations have approached these topics from a metrological point of view, some authors focusing on characterizing statistical properties of the procedures given in the GUM. Reference [5] shows that these procedures are not strictly consistent with either a Bayesian or frequentist interpretation. Reference [6] proposes some minor modifications to the GUM procedures that bring the results into closer agreement with a Bayesian interpretation in some situations. Reference [7] discusses the relationship between procedures for uncertainty evaluation proposed in GUMS1 and the results of a Bayesian analysis for a particular class of models. Reference [8] also discusses different possible probabilistic interpretations of coverage intervals and recommends approximating the posterior distributions for this class of Bayesian analyses by probability distributions from the Pearson family of distributions.
Reference [9] compares frequentist (“conventional”) and Bayesian approaches to uncertainty evaluation. However, the study is limited to measurement systems for which all sources of uncertainty can be evaluated using Type A methods. In contrast, measurement systems with sources of uncertainty evaluated using both Type A and Type B methods are treated in this Technical Report and are illustrated using several examples, including one of the examples from Annex H of the GUM.
Statisticians have historically placed strong emphasis on using methods for uncertainty evaluation that have probabilistic justification or interpretation. Through their work, often outside metrology, several different approaches for statistical inference relevant to uncertainty evaluation have been developed. This Technical Report presents some of those approaches to uncertainty evaluation from a statistical point of view and relates them to the methods that are currently being used in metrology or are being developed within the metrology community. The particular statistical approaches under which different methods for uncertainty evaluation will be described are the frequentist, Bayesian, and fiducial approaches, which are discussed further after outlining the notational conventions needed to distinguish different types of quantities.