JIS Z 8101-1:2015 統計―用語及び記号―第1部:一般統計用語及び確率で用いられる用語 | ページ 2

4
Z 8101-1 : 2015 (ISO 3534-1 : 2006)
対応する。推定量(1.12),統計的検定(1.48)のための検定統計量,又は信頼区間(1.28)
がランダムサンプルから導かれるときは,この定義は,これらの確率変数の実際の観測値で
はなくて,このサンプルを抽象化した確率変数に対応するものとなる。
注記5 無限母集団からのランダムサンプルは,しばしば,標本空間からの繰返し抽出によって生成
され,注記4で述べた定義の解釈を用いれば,独立,同一分布に従う確率変数からなるサン
プルを導く。
1.7
単純ランダムサンプル,単純無作為標本 たんじゅんらんだむさんぷる,たんじゅんむさくいひょうほん
(simple random sample)
<有限母集団>ある与えられた大きさをもつ部分集合が,全て等確率で選ばれるようなランダムサンプ
ル(1.6)。
注記1 この定義は,表現はわずかに異なるが,JIS Z 8101-2による定義と整合する。
注記2 < >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
1.8
統計量 とうけいりょう(statistic)
確率変数(2.10)だけで規定された関数。
注記1 統計量は,1.6の注記4で述べた意味でランダムサンプル(1.6)に含まれる確率変数の関数
である。
注記2 注記1に関連して,[{X1,X2,···,Xn}] が未知の平均(2.35) 及び未知の標準偏差(2.37)
‰ 掉 布(2.50)からのランダムサンプルなら,(X1+X2+···+Xn)/nで表される標本
平均(1.15)は統計量である。一方,[(X1+X2+···+Xn)/n]−μは,母数(2.9)を含むので統
計量ではない。
注記3 ここで与えられた定義は,数理統計学の中に見いだされる取扱いに対応した技術的定義であ
る。英語ではstatistic(統計量)の複数形,すなわちstatisticsは統計学を指すこともあり,そ
の場合はISO/TC 69の国際規格で記載されている解析活動を含む技術的分野を意味する。
1.9
順序統計量 じゅんじょとうけいりょう(order statistic)
確率変数(2.10)を非減少な順序に並べることによって得られる統計量(1.8)。
例 標本の観測値が9,13,7,6,13,7,19,6,10,7であるとする。順序統計量の観測値は,6,6,
7,7,7,9,10,13,13,19となる。これらの値は,X(1) からX(10) までの実現値と考えることが
できる。
注記1 ランダムサンプル(1.6)の観測値(1.4)を [{x1,x2,···,xn}] とし,非減少な順序に並べて
x(1) ≦ ··· ≦ x(k) ≦ ··· ≦ x(n) と表す。そのとき,(x(1),···,x(k),···,x(n)) は順序統計量 (X(1),
···,X(k),···,X(n)) の観測値であり,x(k) はk番目の順序統計量の観測値である。
注記2 実際的観点では,データセットに対して順序統計量を得ることは,注記1で記述したように
形式的にデータをソートすることと同じである。そのとき,データセットをソートすること
によって,この後の幾つかの定義で与えられるように,それ自体が有用な要約統計量になる。
なお,この規格では非減少な又は非増加な順序に並べかえることをソートするという。
注記3 標本の値を非減少な順序に順位付ければ,順序統計量は,その順位に対応する標本の値を意

――――― [JIS Z 8101-1 pdf 6] ―――――

                                                                                              5
Z 8101-1 : 2015 (ISO 3534-1 : 2006)
味する。上に示した例のように,まだ観測されていない確率変数をソートするよりも,観測
された標本の値(確率変数の実現値)をソートするほうが理解しやすい。しかしながら,非
減少な順序に並び替えられたランダムサンプル(1.6)からの確率変数を考慮することは可能
である。例えば,n個の確率変数の最大値はその実現値を得る前に検討可能である。
注記4 個々の順序統計量は,確率変数だけで規定された関数なので統計量である。この関数は,確
率変数を並べ替えた集合における位置又は順位を特定する。
注記5 離散型確率変数及び桁数の少ない実現値の場合には,同じ値をもつデータ(タイデータ)の
取扱いの問題が生じる。“非減少な順序”という言葉は,“上昇順”という言葉よりも,問題
によってはより正確な言い回しとして用いられる。複数個の同じ値のデータは,その個数分
だけ記録に残し,一つの値にまとめてはならないことは重要である。上記の例では,6,6の
二つの実現値が同じ値のデータである。
注記6 順序付けは,確率変数の絶対値に基づくのではなく,符号付きで行う。
注記7 順序統計量の全体の集合は,n次元の確率変数になる。ここで,nは標本における観測値の個
数である。
注記8 n次元の順序統計量の各成分も順序統計量と呼ばれるが,その場合には,標本内の順序を示
す数字を下付の括弧内に表す。
注記9 最小値,最大値,及びサンプルサイズが奇数の場合の標本メディアン(1.13)は,順序統計
量の例である。例えば,サンプルサイズが11のとき,X(1) は最小値,X(11) は最大値であり,
X(6) は標本メディアンである。
1.10
範囲,サンプルレンジ はんい,さんぷるれんじ(sample range)
最大の順序統計量(1.9)から最小の順序統計量を引いた量。
例 1.9の例を引き続き考えると,範囲の観測値は19−6=13である。
注記1 統計的工程管理では,範囲は,時間的に推移する工程のばらつきを監視するためにしばしば
用いられる。特に,サンプルサイズが比較的小さい場合に用いられる。
注記2 統計量であることを強調するときには,標本範囲と呼ぶこともある。
注記3 混乱が生じなければ,サンプルを省略してレンジと呼んでもよい。
1.11
ミッドレンジ,中点値 みっどれんじ,ちゅうてんち(mid-range)
最小及び最大の順序統計量(1.9)の平均(1.15)。
例 1.9に示した例の数値を用いると,ミッドレンジの観測値は, (6+19)/2=12.5である。
注記 ミッドレンジを用いると,小さなデータセットの中心位置を迅速に簡便に評価できる。
1.12
推定量 すいていりょう(estimator)
母集団のパラメータθの推定(1.36)に用いられる統計量(1.8)。
注記1 母集団の平均(2.35)(μと表す。)を推定する標本平均(1.15)は母平均の推定量である。正
規分布(2.50)などのような分布(2.11)に対して母集団の平均μに対する“自然な”推定量
は標本平均である。
注記2 母集団の性質[例えば,1変量分布(2.16)のモード(2.27)など]を推定する際,適切な推

――――― [JIS Z 8101-1 pdf 7] ―――――

6
Z 8101-1 : 2015 (ISO 3534-1 : 2006)
定量は,分布の母数の推定量の関数であったり,ランダムサンプル(1.6)の複雑な関数であ
ったりする。
注記3 “推定量”という言葉は,ここでは広い意味で用いられている。それは,母数の点推定量と
いう意味も,区間推定の意味も含んでおり,更に予測(しばしば予測量と呼ばれることもあ
る。)の意味も含んでいる。推定量は,カーネル推定量及び他の特別な目的をもつ統計量も含
んでいる。より詳細な議論を1.36の注記に示す。
1.13
(標本)メディアン,中央値,中位数 (ひょうほん)めでぃあん,ちゅうおうち,ちゅういすう(sample
median)
サンプルサイズ(JIS Z 8101-2,1.2.26を参照)nが奇数なら,[(n+1)/2] 番目の順序統計量(1.9)。サン
プルサイズnが偶数なら,(n/2) 番目と [(n/2)+1] 番目との順序統計量の和を2で割った量。
例 1.9の例で考えると,8が標本メディアンの実現値である。この場合(サンプルサイズは,偶数の
10)には,5番目及び6番目の値がそれぞれ7及び9なので,それらの平均は8になる。厳密に
は標本メディアンは確率変数として定義されているが,実務上は“標本メディアンは8である”
という形式で報告される。
注記1 サンプルサイズnのランダムサンプル(1.6)に対して,1からnまで非減少な順序で並べら
れた確率変数(2.10)において,サンプルサイズnが奇数なら標本メディアンは, (n+1)/2
番目の確率変数である。また,サンプルサイズnが偶数なら,標本メディアンは, (n/2) 番
目の確率変数と (n/2+1) 番目の確率変数との算術平均である。対応国際規格では,この注記
において“(n/2+1) 番目”を“(n+1)/2番目”と誤記している。
注記2 概念的には,まだ観測されていない確率変数を順番に並べることは不可能と見えるかもしれ
ない。しかし,観測された後に並び替えることまでを織り込んだものが順序統計量であると
理解すればよい。実際,観測値を得たら,値を並び替えて,順序統計量の実現値を得る。こ
れらの実現値がランダムサンプルから構成した順序統計量と解釈できる。
注記3 標本メディアンは,サンプルの半分ずつがそれぞれ上側と下側とにあるという意味で,分布
の中心位置の推定量となる。
注記4 実務上,標本メディアンは,データセットの中の非常に極端な値に影響されにくい推定量を
与えるという意味で有用である。例えば,収入金額のメディアン及び住宅価格のメディアン
は,要約値としてしばしば報告される。
注記5 混乱が生じなければ,“標本”を省略してもよい。
1.14
k次の標本モーメント,k次の標本積率 kじのひょうほんもーめんと,kじのひょうほんせきりつ(sample
moment of order k)
E(X k)
ランダムサンプル(1.6)における確率変数(2.10)のk乗の和を標本(1.3)における観測値の個数で割
った量。
注記1 サンプルサイズがnのランダムサンプル,すなわち,[{X1,X2,···,Xn}] に対して,k次の標
本モーメントE(X k) は,

――――― [JIS Z 8101-1 pdf 8] ―――――

                                                                                              7
Z 8101-1 : 2015 (ISO 3534-1 : 2006)
n
1 k
Xi
ni 1
である。
n
1 k
Xi
n
ここでは,E(X k) と iとを同一視するような記述になっているが,通常の記号法では,
1
前者は期待値をとった後なので定数であり,かつ,後者は確率変数なので,両者の同一視は
できない。したがって,この記号法E(X k) を使用することは避けたほうがよい。
注記2 さらに,この概念を“原点のまわりの”k次の標本モーメントと呼ぶことがある。
注記3 1次の標本モーメントは,次に定義される標本平均(1.15)である。
注記4 定義は任意のkに対して与えられているが,実際上よく用いられるのは,k=1の場合[標本
平均(1.15)],k=2の場合[標本分散(1.16)及び標本標準偏差(1.17)に関連],k=3の場
合[標本ゆがみ(1.20)に関連],及びk=4の場合[標本とがり(1.21)に関連]である。
注記5 E(X k)の“E”は,確率変数Xの“期待値”に由来している。
注記6 “(原点まわりの)標本k次モーメント”とも呼んでもよい。
注記7 混乱が生じなければ,“標本”を省略してもよい。
1.15
(標本)平均,算術平均 (ひょうほん)へいきん,さんじゅつへいきん(sample mean,average,arithmetic
mean)
ランダムサンプル(1.6)における確率変数(2.10)の和を,和をとった個数で割った量。
例 1.9の例を考えると,標本平均の実現値は9.7である。これは,観測値の合計97をそのサンプル
サイズ10で割って求めた値である。
注記1 統計量として考えると,標本平均は,1.8の注記3で述べた意味でランダムサンプルにおける
確率変数の関数である。この意味での推定量と,ランダムサンプルの観測値(1.4)から計算
された標本平均の数値とを区別しなければならない。
注記2 統計量として考えた標本平均は,母集団の平均(2.35)の推定量としてしばしば用いられる。
よく使われる同義語は算術平均である。
注記3 サンプルサイズnのランダムサンプル,すなわち,[{X1,X2,···,Xn}] に対して,標本平均は,
n
1
X Xi
n i1
である。
注記4 標本平均は,1次の標本モーメントと考えることができる。
注記5 サンプルサイズが2のときには,標本平均,標本メディアン(1.13),及びミッドレンジ(1.11)
は一致する。
注記6 混乱が生じなければ,“標本”を省略してもよい。
1.16
(標本)分散,不偏分散 (ひょうほん)ぶんさん,ふへんぶんさん(sample variance)
S2
ランダムサンプル(1.6)における確率変数(2.10)からそれらの標本平均(1.15)を引いた偏差の2乗
和を,サンプルサイズ−1で割った量。

――――― [JIS Z 8101-1 pdf 9] ―――――

8
Z 8101-1 : 2015 (ISO 3534-1 : 2006)
例 1.9の数値例を引き続き考えて計算すると,標本分散は17.57となる。観測された標本平均からの
偏差の2乗和は158.10で,サンプルサイズは10なので,10−1=9となる。158.10を9で割れば
よい。
注記1 統計量(1.8)として考えると,標本分散S2は,ランダムサンプルにおける確率変数の関数で
ある。統計量の意味でのこの推定量(1.12)と,ランダムサンプルの観測値(1.4)から計算
された標本分散の数値とを区別しなければならない。この数値結果は,経験標本分散,又は
観測された標本分散と呼ばれ,普通s 2と表される。
注記2 サンプルサイズnのランダムサンプル,すなわち,[{X1,X2,···,Xn}] に対して,標本平均を
Xと表すとき,標本分散は,次の式による。
n
1
S2 (Xi X) 2
n 1i 1
注記3 標本分散は,標本平均からの確率変数(2.10)の偏差の2乗の“ほとんど”平均である(分
母においてnではなくn−1を用いることだけが異なる。)。n−1を用いることによって,標
本分散は母集団の分散(2.36)の不偏推定量(1.34)となる。これが不偏分散の由来である。
注記4 n−1は,自由度(2.54)として知られている量である。
注記5 標本分散は,中心化標本確率変数の2次の標本モーメントとみなすことができる。対応国際
規格では“中心化標本確率変数”を“標準化標本確率変数(1.19)”と誤記している。この規
格では与えられていないが,“中心化標本確率変数”は“確率変数からその標本平均を引いた
量”と定義される。
注記6 混乱が生じなければ,“標本”を省略してもよい。
1.17
(標本)標準偏差 (ひょうほん)ひょうじゅんへんさ(sample standard deviation)
S
標本分散(1.16)の非負の平方根。
例 1.9の数値例を用いると,標本分散の観測値が17.57なので,標本標準偏差の観測値は4.192とな
る。ここで,データに基づいて途中の桁をより多く保持して計算すると4.191になる。
注記1 実務的には,標本標準偏差は,標準偏差(2.37)を推定するために用いられる。Sは確率変数
(2.10)であり,ランダムサンプル(1.6)からの実現値ではないことを再度強調しておく。
注記2 標本標準偏差は,分布(2.11)のばらつきの指標である。
注記3 混乱が生じなければ,“標本”を省略してもよい。
1.18
(標本)変動係数 (ひょうほん)へんどうけいすう(sample coefficient of variation)
標本標準偏差(1.17)を標本平均(1.15)で割った量。
注記1 変動係数(2.38)と同様,この統計量は,正の値しかとらない母集団のときに用いられる。
変動係数は,通常,パーセントで表示される。ばらつきが平均に比例して増加する場合に,
変動係数は有用である。
注記2 標本変動係数を“相対標準偏差”と呼ぶことは薦められない。
注記3 混乱が生じなければ,“標本”を省略してもよい。

――――― [JIS Z 8101-1 pdf 10] ―――――

次のページ PDF 11

JIS Z 8101-1:2015の引用国際規格 ISO 一覧

  • ISO 3534-1:2006(IDT)

JIS Z 8101-1:2015の国際規格 ICS 分類一覧