カウンタ

COUNTER FROM 2016031872532

日誌

確率論及統計論 >> Article details

2016/04/23

JIS Z 8101-1 : 1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語

Tweet ThisSend to Facebook | by kaizen
「JIS Z 8101-1 : 1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語」は、 ISO 3534-1:1993, Statistics−Vocabulary and symbols−Part1 : Probability and general statistical termsに基づいている。

現在 「JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:一般統計用語及び一確率で用いられる用語」に改訂になっている。順次改訂内容を追記中です。廃止になった用語は<2015廃止>と記載しています。廃止になっても、契約でJIS Z 8101:1999, ISO 3534-1:1993を使う文言があれば、規定の内容は有効です。また、今後の製品・文書であっても、過去の製品・文書を継承したもので、新しい規定に変更する試験が完了していない場合に、古い規定を利用することが可能な場合があるかもしれません。契約者相互でご確認ください。

<>書きでwikiの用語を示す。また、備考はJISでは2以降は番号だけだが、ここでは表記の分かりやすさから備考2,備考3などとしている。数式は順次¥TeX形式に変換中です。今しばらくお待ちください。


1.1 確率  かくりつ probability 

ある試行を同じ条件の下で長く続けたとき,一定の結果が生起する相対頻度の極限値。より一般的にはランダムな事象に割り当てられている [0, 1] の範囲の実数値と定義される。一般に事象 A の確率を Pr (A)で表す。
参考  ある事象が生じるという信念の度合いを表す主観確率という概念も存在する。

1.2 確率変数,変量  かくりつへんすう,へんりょう random variable, variate 

どのような値となるかが,ある確率法則によって決まる変数。確率法則は確率分布で記述される。とることができる値が離散的であるか,連続的であるかによって,それぞれ離散(確率)変数,連続(確率)変数という。離散確率変数で表されるデータを計数値 (discrete variable),連続確率変数で表されるデータを計量値 (continuous variable) という。

1.3 確率分布  かくりつぶんぷ probability distribution (of a random variable) 

確率変数がある値となる確率,又はある集合に属する確率を与える関数。その確率変数が定義されている集合全体に対する確率は 1 である。特に,確率変数 X が x 以下の値となる確率を x の関数とみたものを分布関数 (distribution function) といい,F (x)  =Pr {X≦x}  で表す。
離散変数のとる各値 xiに対し,その確率を確率(質量)関数 (probability mass function)  といい,pi=Pr{X=xi}で表す。
連続変数の場合に,分布関数の微分を確率密度関数  (probability density function)  といい,
( )( )dxxdFxf=で表す。
f (x) dxは確率変数 X が微小区間  (x, x+dx]  に属する確率に相当し,確率要素(又は確率素分)という。

備考  確率変数 X の確率分布が与えられたとき,‘X が確率分布に従う’または‘確率分布に従う変数X’ということがある。

1.4 2次元分布関数,2 変量分布関数  にじげんぶんぷかんすう,にへんりょうぶんぷかんすう bivariate distribution function <同時分布
 
2次元の確率変数  (X, Y)  について,X が x 以下で,かつ Y が y 以下となる確率を与える関数。F (x, y)  =Pr {X≦x,  Y≦y}  で表す。多次元の確率変数 (X, Y, …)  についても同様に
多次元分布関数 (multivariate distribution function) F (x, y,…)  =Pr {X≦x, Y≦y,  …}  が定義される。なお,二つ以上の変数の組の確率分布のことを同時(確率)分布  (joint probability distribution)  という。

参考  二次元分布関数,二変量分布関数と表記してもよい。

1.5 周辺(確率)分布  しゅうへん(かくりつ)ぶんぷ marginal probability distribution 

k次元確率変数の部分集合である k1変数の同時分布。
例えば,3次元の確率変数  (X, Y, Z)  の場合,  (X, Y),(X, Z),  (Y, Z)  に対する三つの 2 次元周辺分布と,X,Y,Z に対する三つの 1 次元周辺分布が存在する。

1.6 条件付き(確率)分布  じょうけんつき(かくりつ)ぶんぷ conditional probability distribution 

k次元確率変数の部分集合である k1変数の,残り k-k1変数をある値に固定したときの確率分布。例えば,2次元確率変数  (X,  Y)  の場合に,Y=y に固定したときの X の条件付き分布と,X=x に固定したときの Yの条件付き分布が存在する。

1.7 独立  どくりつ independence <確率論的独立性
 
確率変数 X と Y が独立であるための必要十分条件は,その同時分布関数が,F (x, y)  =F (x,  ∞)  ・F (∞, y)=G (x)  ・H (y)  と表されることである。ただし,G (x)  =F (x,  ∞)  及び H (y)  =F (∞, y)  は,それぞれ X 及び Y の周辺分布関数である。

備考1.  独立な離散確率変数の場合,同時確率は周辺分布の積 Pr {X=x
i, Y=yi}=Pr {X=xi}・Pr {Y=yi}で表される。独立な連続確率変数の場合,同時密度関数 f (x, y)  は周辺密度関数 g (x),h (y)の積 f (x, y)  =g (x)  ・h (y)  で表される。

備考2.二つの事象は,それらが共に生じる確率が,個々の事象が生じる確率の積に等しいとき独立である。

1.8 母数,パラメータ  ぼすう,ぱらめーた parameter 

(1)母集団分布の族 f  (x;θ1,θ2,…,θp)を考えるとき,その値を指定すれば分布が確定するような定数θ1,θ2,…,θp。例えば,正規分布は平均µと標準偏差σとの二つの母数によって定まり,ポアソン分布は平均µという一つの母数によって定まる。

(2)さらに広義には,確率分布によって定まる数値。この意味では,確率分布のモーメント,すなわち平均,分散,ゆがみ,とがりなどをすべて母数ということができる。母数はサンプルについて定義される同じ名の統計量と区別するための用語である。

1.9 相関  そうかん correlation  <相関係数
二つの確率変数の分布法則の関係。多くの場合,線形関係の程度を指す。

1.10 分位点  ぶんいてん quantile, fractile <分位数
p分位点とは,分布関数が p に一致するか,又は p より小さな値から p より大きな値に飛ぶときの確率変数の値。確率 p を 100p%で表すときは 100pパーセント点  (100p percentile)  という。備考1.  確率変数のある区間内で分布関数が一定値 p となる場合は,その区間内の任意の値が p 分位点とされる。ただし,0≦p≦1である。
2.p=21に対応する確率変数の値をメディアン,中央値  (median)  という。3.p=41および p=43に対応する確率変数の値を四分位点  (quartile)  という。

1.11 モード,最頻値  もーど,さいひんち mode
離散分布の場合は確率変数が,連続分布の場合は密度関数が,最大となる確率変数の値。分布が多峰性の場合は,それぞれの極大値を与える確率変数の値。

1.12 期待値  きたいち expectation

離散分布については,値 xiが出現する確率を pi=Pr {X=xi}とするとき,( )iipxXEå=の値。確率密度関数 f (x)  をもつ連続分布については,( )( )dxxfxXEò=の値。多数回の測定を行い,測定値の平均を求めると,期待値に近い値になる。関数g (X)の期待値E [g (X)]は( )[]( )iipxgXgEå=,又は( )[]( ) ( )dxxfxgXgEò=で与えられる。

備考1.  条件付き分布の期待値を条件付き期待値 (conditional expectation)  という。X,Yの同時分布に関しY=yで与えられたXの条件付き期待値は,yの関数になる。

備考2.確率変数 X の期待値をXの母平均ということもある。

1.13 分散  ぶんさん variance 1.16-2015

確率変数Xからその母平均を引いた変数の二乗の期待値。σ2=V (X)=E [X−E (X)]2である。(ランダムサンプル(1.6)における確率変数(2.10)からそれらの標本平均(1.15)を引いた偏差の2乗和を、サンプルサイズ-1で割った量。)

備考1.  確率変数の従う確率分布の分散ということもある。

備考2. 確率変数Xの分散をXの母分散ということもある。

1.14 標準偏差  ひょうじゅんへんさ standard deviation 1.17-2015

分散の正の平方根。( )XV=σである。(標本分散の非負の平方根)

備考  確率変数 X の標準偏差を X の母標準偏差ということもある。

1.15 変動係数  へんどうけいすう coefficient of variation 1.18-2015

標準偏差を平均値で割ったもの。変動係数はばらつきを相対的に表すもので,通常,変量をとる値が決して負にならない場合に用いる。( )( )µσ=XEXVである。
(標本標準偏差81.17)を標本平均(1.15)で割った量。)

1.16 規準化(確率)変数,標準化(確率)変数  きじゅんか(かくりつ)へんすう,ひょうじゅんか(かくりつ)へんすう standardized random variable

期待値が 0,標準偏差が 1 である確率変数。

備考1.  確率変数 X の期待値がµ,標準偏差がσのとき,  (X−µ) /σがそれに対応する規準化確率変数である。
備考2.確率変数の期待値を 0,標準偏差を 1 にする変換を,規準化あるいは標準化 (standardization) という。

1.17 原点まわりの q 次モーメント  げんてんまわりのきゅーじもーめんと moment of order q about origin

確率変数 X の q 乗の期待値 E (Xq)。

備考  平均は原点まわりの 1 次モーメントである。

1.18  q次中心モーメント  きゅーじちゅうしんもーめんと central moment of order q

確率変数 X の期待値がµのとき,X とµとの差の q 乗の期待値 E (X−µ)q。平均値まわりの q 次モーメントともいう。備考  分散は 2 次中心モーメントである。

1.19 ゆがみ,ひずみ skewness(歪度
確率密度関数または確率関数 f  (x)  のグラフが左右対称でないこと。ゆがみの程度は平均値まわりの 3次モーメントµ3と標準偏差σの 3 乗との比。すなわち,33σµである。

1.20 とがり kurtosis(尖度) 1.21-2015
平均値まわりの 4 次のモーメントµ4と標準偏差σの 4 乗の比,すなわち,44σµである。(ランダムサンプル(1.6)からの標準化標本確率変数(1.19)の4乗の算術平均)

1.21 共分散  きょうぶんさん covariance 1.22-2015 
2次元の確率変数  (X, Y)  について,それぞれの平均からの偏差の積の期待値。Cov (X, Y)  =E [(X−µx) (Y−µY)]である。(対になっているランダムサンプル(1.6)において、それぞれの確率変数82.10)からそれぞれの標本平均(1.15)を引いた偏差の席の和を、サンプルサイズ-1で割った量(サンプルサイズは、対の数))

1.22 相関係数  そうかんけいすう correlation coefficient

2次 元 の 確 率 変 数   (X,  Y)  に つ い て , そ の 共 分 散 と そ れ ぞ れ の 標 準 偏 差 の 積 の 比 ,()()[]YXYXXYYXEσσµµρ−−=である。

備考1.  添字 X,Y は自明なときは省略されることがある。
備考2.相関係数は,−1 以上,1 以下の値となる。
備考3.もし 2 変数が独立なら相関係数は 0 になる。ただし相関係数 0 でも独立であるとは限らない。

1.23 回帰曲線  かいききょくせん regression curve

2次元の確率変数  (X, Y)  について,X=x を与えたときの Y の条件付き期待値を与える関数。Y の X に対する回帰曲線と表現する。

備考1.Y の X に対する回帰曲線が直線であるとき,回帰関係は線形であるといい,回帰直線 (regression line) と呼ぶ。また,この場合を単回帰  (simple linear regression)  と呼ぶことがある。
備考2.3次元の確率変数  (X,  Y,  Z)  について,X=x,Y=y を与えたときの Z の条件付き期待値を Zの X,Y に対する回帰曲面 (regression surface)  という。それが平面であるとき,回帰関係は線形であるといい,回帰平面  (regression plane surface)  と呼ぶ。この概念は 4 変数以上にもそのまま拡張される。

1.24 一様分布  いちようぶんぷ uniform distribution, rectangular distribution

(1)連続分布の場合,その確率密度関数が有限区間 [a, b] で一定の値,区間外で 0 となる分布。
(2)離散分布の場合,n 点で等しい確率 Pr (X=xi)=n1,i=1,2,…,n となる分布。

1.25 正規分布,ガウス分布  せいきぶんぷ,がうすぶんぷ normal distribution, Laplace-Gauss distribution

確率密度関数が\frac1{\sqrt{2\pi\sigma^{2} } }\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right), -∞<x<∞で与えられる連続変数の分布。

備考  正規分布は,平均µと分散σ2によって定まる。記号 N (µ,σ2)で表すことが多い。

1.26 標準正規分布  ひょうじゅんせいきぶんぷ standardized normal distribution, standardized Laplace−Gauss distribution

µ=0,σ2=1 の正規分布。

1.27カイ二乗分布,χ2分布  かいにじょうぶんぷ chi-squared distribution, χ2 distribution

確率密度関数がで与えられる連続変数の分布。パラメータνは整数値であり,自由度という。ガンマ関数Γ  (x)は,---で定義される。x が自然数のとき,Γ (x)=  (x−1) !となる。

備考1.ν個の独立な標準正規分布の二乗和は自由度νのχ2変数となる。
備考2.X=χ2/2の分布はガンマ分布の特別な場合に当たる。
備考3.独立な自由度ν1のχ2変数と自由度ν2のχ2変数との和は,自由度ν1+ν2のχ2変数となる。この性質をχ2分布の加法性という。

1.28 t分布  てぃーぶんぷ t-distribution

確率密度関数が( )( )[]( )()( )∞<<∞−÷÷øöççèæ+÷÷øöççèæΓ+Γ=+tttf,/112/2/11,2/12ννννπννで与えられる連続変数の分布。パラメータν
は整数値であり,自由度という。

備考1.  標準正規分布に従う変数 X と,それと独立なχ2変数を自由度νで除した変数の平方根との比νχ/2 Xは自由度νの t 分布に従う。
備考2.ガンマ関数Γ (x)の定義は,1.27 にある。

1.29  F分布  えふぶんぷ F-distribution

確率密度関数が()()[]() ()( ) ( )()()()∞<+ΓΓ+Γ=+−FFFFf≦0,2/2/2/,;2/2112/2/22/121212121121νννννννννννννννで与えられる連続変数の分布。パラメータν1,ν2は整数値であり,それぞれ分子の自由度,分母の自由度という。備考1.  独立な二つのχ2変数χ12,χ22をそれぞれの自由度で除したものの比222121//νχνχは分子の自由度ν1,分母の自由度ν2の F 分布に従う。2.ガンマ関数Γ (x)
の定義は,1.27 にある。

1.30 対数正規分布  たいすうせいきぶんぷ log-normal distribution

確率密度関数が( )úúûùêêëé÷øöçèæ−−=2log21exp21σµπσxxxfで与えられる連続変数の分布。パラメータµおよびσは,それぞれ logX の平均および標準偏差である。
ここで,log は自然対数(底 e)である。

備考 logX は平均µ,標準偏差σの正規分布に従う。

1.31 指数分布  しすうぶんぷ exponential distribution

確率密度関数がf (x)=λe−λx,x≧0,λ>0で与えられる連続変数の分布。備考  パラメータλの指数分布の期待値がµ=1/λとなることから,確率密度関数を( )µµ/1xexf−=と表現することがある。

1.32 ガンマ分布  がんまぶんぷ gamma distribution

確率密度関数が( )()( )0,0,0,/exp1>>Γ−=−αααmxmxxxfmm≧で与えられる連続変数の分布。

備考1.  m は分布の形状を定める母数で形状母数と呼ばれる。m=1は指数分布,m=ν/2,α=2は自由度νのχ2分布である。
備考2.母数λ=1/αの独立な m 個の指数分布の和は母数  (m,α)のガンマ分布となる。
備考3.ガンマ関数Γ (x)の定義は,1.27 にある。

1.33 ベータ分布  ベータぶんぷ beta distribution

確率密度関数が( )()( ) ( )( )10,111212121≦≦xxxmmmmxgmm−−−ΓΓ+Γ=で与えられる連続変数の分布。ただし,パラメータ m1,m2は正数。

備考1.m1=m2=1のとき区間 [0, 1] の一様分布となる。
備考2.ガンマ関数Γ (x)  の定義は,1.27にある。

1.34 グンベル分布,二重指数分布,タイプ I 極値分布 ぐんべるぶんぷ,にじゅうしすうぶんぷ,たいぷいちきょくちぶんぷ Gumbel distribution, type I extreme value distribution

確率分布関数がF (x)=exp (−e-y), y=  (x−a) /b,  −∞<x<∞で与えられる連続変数の分布。パラメータ a,b は−∞<a<+∞,b>0 の範囲にある。

1.35 フレシェ分布,タイプ II 極値分布  ふれしぇぶんぷ,たいぷにきょくちぶんぷ Fréchet distribution, type II extreme value distribution
確率分布関数がF (x)=exp (−y
-k), x≧α, y=  (x−a) /bで与えられる連続変数の分布。パラメータ a,b,k は−∞<a<+∞,b>0,k>0 の範囲にある。k は分布の形を定める形状母数である。

1.36 ワイブル分布,タイプ III 極値分布 わいぶるぶんぷ,たいぷさんきょくちぶんぷ Weibull distribution, type III extreme vaIue distribution

確率分布関数がF (x)=1−exp (−yk), x≧a, y= (x−a) /bで与えられる連続変数の分布。パラメータ a,b,k は−∞<a<+∞,b>0,k>0 の範囲にある。k は分布の形を定める形状母数である。

備考信頼性用語の定義が別にある。

1.37 2項分布にこうぶんぷ binomial distribution

確率が[]()nxppxnxXxnx,,2,1,0,1PrΛ=−÷÷øöççèæ==−で与えられる離散変数の分布。ただし,パラメータnは自然数,pは0<p<1の範囲にある。

参考 二項分布と表記してもよい。

1.38 負の 2 項分布 ふのにこうぶんぷ negative binomial distribution

確率が[]()nxppxxcxXxc,,2,1,0,11PrΛ=−÷÷øöççèæ−+==で与えられる離散変数の分布。ただし,パラメータcは自然数,pは0<p<1の範囲にある。備考パラメータcが1のときは,特に幾何分布 (geometric distribution) という。

参考負の二項分布と表記してもよい。

1.39 ポアソン分布 ぽあそんぶんぷ Poisson distribution

確率が[]Λ,2,1,0,!Pr===−xexmxXmxで与えられる離散変数の分布。
備考1.ポアソン分布の期待値と分散は等しく,パラメータmに一致する。
備考2.ポアソン分布はパラメータをm=npとすることによって,nが十分大きくpが小さい2項分布の近似に用いることができる。

1.40 超幾何分布 ちょうきかぶんぷ hypergeometric distribution
確率が[],Pr÷÷øöççèæ÷÷øöççèæ−−÷÷øöççèæ==nNxnMNxMxXx=max (0, M−N+n),max (0, M−N+n)+1,…,min (M, n)で与えられる離散変数の分布。ただし,パラメータNは自然数,パラメータMは0またはN以下の自然数,パラメータnはN以下の自然数である。

2.一般統計用語
2.1母集団ぼしゅうだん population 1.1-2015

考察の対象となる特性をもつすべてのものの集団。(検討の対象となるアイテムの全体。)

備考1.確率変数が対象の場合には,母集団の定義のために確率分布を用いる。
備考2.母集団の一部として定義される集団を部分母集団 (subpopulation) という。
備考3.通常サンプルに基づいて処置をとろうとする集団が,そのサンプルによって代表される母集団となる。

2.2 観測値,測定値かんそくち,そくていち observed value 1.4-2015

単一観測の結果得られる特性の値。(サンプルの一つの構成要素のある側面に関して得られた値)

2.3 級 きゅう class 1.55-2015
計量特性の変動の全範囲を順次分割して作る一連の区間。計量特性の場合には,互いに背反なアイテム群で,各群に属するアイテムは何らかの共通属性を持つ。

備考1. 級の上限,下限を級の限界または級の境界  (class limits, class boundaries) と呼ぶ。二つの境界のどちらかが級に属するように想定しておくことが望ましい。可能ならば,境界は観測値と一致しないように定めることが望ましい。
備考2. 計量特性に対する級の上限と下限の算術平均を級の中心  (mid-point of class) と呼ぶ。
備考3. 計量特性に対する級の上限と下限の差を級幅 (class width) と呼ぶ。

2.4 度数分布 どすうぶんぷ frequency distribution 1.60-2015

特性値と,その度数または相対度数との関係を観測したもの。

備考1. 度数 (frequency) とは,一定の事象が起きる回数,または特定の級に入る観測値の個数。
備考2. 相対度数 (relative frequency) とは,度数を全事象数または全観測回数で割ったもの。
備考3. 度数分布は,度数表,棒グラフ,ヒストグラムなどで表す。

2.5累積度数,経験分布関数  るいせきどすう,けいけんぶんぷかんすう cumulative frequency <ヒストグラム>1.63-2015

ある値以下の観測値の度数または相対度数。

備考 級に分割されたデータでは,累積度数は級の境界上でのみ定義される。

2.6 一変量度数分布 いちへんりょうどすうぶんぷ  univariate frequency distribution 2.16-2015 一変量確率分布

単一特性の度数分布。

2.7 ヒストグラム ひすとぐらむ histogram 1.61-2015

計量特性の度数分布のグラフ表示の一つ。測定値の存在する範囲をいくつかの区間に分けた場合,各区間を底辺とし,その区間に属する測定値の度数に比例する面積をもつ長方形を並べた図。

備考1. ヒストグラムで用いられた区間の幅が一定ならば,長方形の高さは各区間に属する値の度数に比例する。したがって,この場合には高さに対して度数の目盛を与えることができる。
備考2. 級の上限を横軸に,累積度数を縦軸にとって打点し,それらの点を結んで得られる折れ線を累積折れ線  (cumulative frequency polygon) という。

2.8 二変量度数分布 にへんりょうどすうぶんぷ bivariate frequency distribution 2.16-2015 多変量確率分布
二つの特性を同時に考え,特性値の対や特性値に関する級の対と,度数または相対度数の関係を観測したもの。

備考 一般に複数の特性を同時に考え,同時に特性の値または級の集合と,度数または相対度数の関係を観測したものを多変量度数分布  (multivariate frequency distribution)という。特性の数がkの場合にはk変量度数分布という。

参考  2変量度数分布と表記してもよい。

2.9 散布図 さんぷず scatter diagram

二つの特性を横軸と縦軸とし,観測値を打点して作るグラフ表示。

備考1. nアイテムに対する散布図はn個の点からなる。
備考2. 散布図は,二つ以上の特性の場合にも拡張できる。

2.10 分割表 ぶんかつひょう  two-way table of frequencies, contingency table <2015廃止>

度数を二つの特性によって分類し,分布を示す表。

備考1. 表の行,列は対応する特性の値または級に対応している。行と列の交わる場所の度数が,値や級の組み合わせが生じる度数に対応する。

備考2. 分割表の度数によって特性間に関連があるか否かを検定することができる。
備考3. 二特性より多い特性に対して分割表を一般化することができる。

2.11 周辺度数分布 しゅうへんどすうぶんぷ marginal frequency distribution <2015廃止>

k変量度数分布に従うk個のうち対象外のk-k1個の特性が任意の値となりえると想定されるときの,k1個の特性が従う度数分布。

備考1.  k=2の場合,例えば,相関表や分割表などにおいては,各行の度数の合計及び各列の度数の合計が,それぞれ周辺度数分布に相当する。
備考2. 例えば,確率変数としてX,Y,Zを想定する場合には,変数の対  (X, Y), (X, Z), (Y, Z)の従う三つの2変数周辺度数分布及びX,Y,Zの従う三つの(1変量)周辺度数分布が考えられる。

2.12 条件付き度数分布じょうけんつきどすうぶんぷ conditional frequency distributionk<2015廃止>

変量度数分布に従うk個のうち対象外のk-k1個の特性が特定の値となるとしたときの,k1個の特性が従う度数分布。

備考  k=2の場合,例えば,相関表や分割表などにおいては,各行の度数及び各列の度数を直接読み取ったもの。特に,相対度数分布は,各行の度数及び各列の度数をその周辺度数で割ったもの。例えば,確率変数としてX,Yを想定する場合には,Y=yのときのXの条件付き度数分布及びX=xのときのYの条件付き度数分布を考えることができる。

2.13(算術)平均,平均値(さんじゅつ)へいきん,へいきんち arithmetic mean, average 1.15-2015/2.35-2015

観測値の総和を観測値の個数で割ったもの。(ランダムサンプル(1.6)における確率変数(2.10)の和を、和をとった個数で割った量)

備考1.平均値という用語は観測値について計算した結果を意味し,x~で表す。母平均を表すときに期待値という用語を用いることが多い。
備考2. 母集団から単純ランダムサンプリングされた標本の平均値は,母平均の不偏推定量である。

2.14 重み付き平均値  おもみつきへいきんち arithmetic weighted mean, weighted average<2015廃止>

観測値に付随する負の値とならない重みと観測値の積を総和したものを,重みの総和で割ったもの。ただし,重みの総和は正であるものとする。

備考 サンプル
  (x1,  x2,…,xn),対応する重み  (ω1,ω2,…,ω3)について,重み付き平均は,nnnxxωωωω++++ΛΛ111として求められる。ただし,nは観測値の個数である。ここで,ωi≧0である。
  
2.15(標本)メディアン,中央値  (ひょうほん)めでぃあん,ちゅうおうち median 1-13-2015 / 2-14-2015

観測値を大きさの順に並べたとき,ちょうどその中央に当たる一つの値(観測値の値が奇数個の場合),又は中央の二つの値の算術平均(測定値の個数が偶数個の場合)。
x~で表すことがある。

2.16 ミッドレンジ,中点値 みっどれんじ,ちゅうてんち  mid-range 1.11-2015

計量的な観測値の最大値と最小値の算術平均。(最小および最大の順序等計量(1.9)の平均(1.15))

2.17 範囲,レンジ はんい,れんじ range 1.10-2015

計量的な観測値の最大値と最小値の差。Rで表す。(最大の順序統計量から最小の順序統計量を引いた量)

2.18 平均偏差 へいきんへんさ mean deviation<2015廃止>

基準値と測定値の差の絶対値の平均値。通常は,基準値として算術平均を用いる。

備考 メディアンを基準値としたとき,平均偏差は最小となる。

2.19 標本分散,不偏分散 ひょうほんぶんさん,ふへんぶんさん variance

各観測値の平均値からの偏差の二乗の和を観測個数から1を引いた数で割ったばらつきの尺度。

備考1.サンプル  (x1, x2,…,xn)については,()å=−−=niixxns12211として求める。ここで,nは観測値の個数である。標本分散はVと表記してもよい。
備考2.標本分散は,母分散の不偏推定量である。
備考3.標本分散は,2次中心モーメントの1−nn倍である。
備考4. 混乱が生じなければ,標本分散を分散と呼んでもよい。

2.20 標本標準偏差 ひょうほんひょうじゅんへんさ standard deviation

標本分散の正の平方根。

備考1. 標本標準偏差は,母標準偏差のかたよりのある推定量となる。
備考2. 混乱が生じなければ,標本標準偏差を標準偏差と呼んでもよい。

2.21 標本変動係数 ひょうほんへんどうけいすう coefficient of variation

標本標準偏差を平均で割ったもの。通常,変量の値が決して負の値にならない場合に用いる。

備考1. 標本変動係数は,ばらつきを相対的に表すもので,百分率で表示することもある。
備考2. 混乱が生じなければ標本変動係数を変動係数と呼んでもよい。また,標本変動係数を相対標準偏差と呼ぶことは薦められない。

2.22 原点まわりの標本 q 次モーメント げんてんまわりのひょうほんきゅーじもーめんと moment of order q about the origin

単一特性の分布からの観測値のq乗の算術平均。

備考1.サンプル  (x1, x2,…,xn)については,å=niqixn11として求める。ここで,nは観測値の個数である。
備考2.原点まわりの標本1次モーメントは,観測値の平均値である。
備考3.
混乱が生じなければ原点まわりの標本q次モーメントを原点まわりのq次モーメントと呼んでもよい。

2.23 標本 q 次中心モーメント  ひょうほんきゅーじちゅうしんもーめんと central moment of order q

単一特性の分布からの観測値とそれらの平均値xとの差のq乗の算術平均。平均値まわりの標本q次モーメントともいう。
備考1.サンプル  (x1,  x2,…,xn)については,()å=−niqixxn11として求める。ここで,nは観測値の個数である。
備考2.標本1次中心モーメントは,常に0となる。
備考3.混乱が生じなければ標本q次中心モーメントをq次中心モーメントと呼んでもよい。

2.24 標本共分散 ひょうほんきょうぶんさん covariance
観測値の対についてそれぞれの平均値からの偏差の積和を観測値の個数から1を引いた値で割ったもの。

備考1.サンプル  (x1,  y1),  (x2,  y2),…,  (xn,  yn)については,()()yyxxnsiniixy−−−=å=111として求める。ここで,nは観測値の個数である。標本共分散はVxyと表記してもよい。
備考2.標本共分散は母共分散の不偏推定量であり,混乱が生じなければ共分散と呼んでもよい。
備考3.一般に,()()yyxxinii−−å=1を積和  (sum of products)という。

2.25 標本相関係数 ひょうほんそうかんけいすう correlation cofficient

二つの特性の標本共分散をそれぞれの特性の標本標準偏差の積で割ったもの。

備考1.サンプル  (x1, y1),  (x2, y2),…,  (xn, yn)については,()()()()ååå===−−−−==niiniiiniiyxxyxyyyxxyyxxsssr12121として求める。ここで,sxyは,XとYの標本共分散,sx,syは,それぞれX,Yの標本標準偏差,nは観測値対の個数である。
備考2.相関係数は対で観測される特性X,Yの直線関係の強さの数値的尺度である。しかし,直線性の検証には,可能な限り散布図にも注意を払うことが望ましい。
備考3.γxyは−1から1までの間にある。値が−1または1のときは2変数の観測値対は直線上に完全に並んでいることを示す。
備考4.混乱が生じなければ,相関係数と呼んでもよい。

2.26 順位相関係数 じゅんいそうかんけいすう rank correlation coefficient<2015廃止>
n個の測定値  (x1, y1),(x2, y2),…,  (xn, yn)をx1,x2,…,xnの中で小さい方から数えた順位s1,s2,…,snとy1,y2,…,ynの中で小さい方から数えた順位t1,t2,…,tnとに置き換えて作った相関係数をいい,()()()()ååå===−−−−niiniiiniittssttss12121として求めるもの。

2.27 統計量とうけいりょう statistic 1.8-2015 

確率変数の標本の関数。(確率変数(2.10)だけで規定された関数。)

備考 確率変数の関数である統計量自体が確率変数であり,標本を取るたびに違った値となると想定される。この関数に従って観測値から得られる統計量の数値は,統計的検定や母平均や母標準偏差といった母集団パラメータの推定に用いられる。

2.28 順序統計量 じゅんじょとうけいりょう order statistic

標本のすべての観測値をその大きさの順に小さい方から並べたもの。また,より一般的にはこの並び替えの関数として求められる統計量すべてを指すこともある。

備考1.順序統計量を,x [1],x [2],…,x [n]で表すことがある。小さい方からk番目の観測値をx [k]で表し,第 k 順序統計量  (kth order statistic) という。2.x [1]は最小値,x [n]は最大値,x [n]−x [1]は範囲である。

2.29 傾向,トレンド  けいこう,とれんど trend (傾向推定

観測値を順に打点したとき,点が順次上昇または下降すること。ただし,偶然誤差や周期変動成分による変動は除く。

2.30 連 れん run<2015廃止>

質的特性の場合には,同じ属性を持つ観測値が引き続いて起きること。計量特性では一連の観測値が単調増加または単調減少することを指し,それぞれ上昇連または下降連と呼ぶ。

備考連の長さと数とによって系列の性質を検定することができる。

2.31 推定 すいてい estimation 

標本が取られた母集団に関する統計モデルとして用いられる確率分布のパラメータに対して,観測値に基づいて値を与える操作。

備考この操作の結果は点推定の場合には単一の数値で,区間推定の場合には区間を用いて表示される。

2.32 推定量 すいていりょう estimator 

母集団のパラメータを推定するのに用いる統計量。

2.33 推定値 すいていち estimate

推定の結果として得られる推定量の実現値。

2.34 サンプリング誤差,標本誤差 さんぷりんぐごさ,ひょうほんごさ sampling error<2015廃止>

サンプリングに起因する推定量の誤差。

2.35 推定量のかたより すいていりょうのかたより bias of estimator 

推定量の期待値と推定したいパラメータの差。

2.36 不偏推定量 ふへんすいていりょう unbiased estimator

推定量のかたよりが0となる推定量。

2.37 標準誤差 ひょうじゅんごさ standard error 

推定量の標準偏差。

2.38 両側信頼区間 りょうがわしんらいくかん two-sided confidence interval 

推定したい母数θに対して二つの統計量T1 (X1, X2,…,Xn),T2 (X1, X2,…,Xn)を定め,Pr(T1≦θ≦T2)が1−α以上となるように構成したT1からT2までの区間。
備考1.  1−αは,1より小さい正数である。
備考2.両側信頼区間の両端T1,T2は確率変数であり,標本によって異なる値となる。
備考3.標本を多数回サンプリングし,毎回両側信頼区間を求めれば,両側信頼区間が母数の真値θを含む相対頻度は1−α以上となることが予想される。

2.39 片側信頼区間 かたがわしんらいくかん one-sided confidence interval

推定したい母数θに対して統計量T (X1, X2,…,Xn)を定め,Pr (T≧θ)[又は,Pr (T≦θ)]が1−α以上となるように構成したT以上(又はT以下)の区間。
備考1.  1−αは,1より小さい正数である。
備考2.片側信頼区間の限界Tは確率変数であり,標本によって異なる値となる。
備考3.標本を多数回サンプリングし,毎回片側信頼区間を求めれば,片側信頼区間が母数の真値θを含む相対頻度は1−α以上となることが予想される。

2.40 信頼率,信頼係数,信頼水準 しんらいりつ,りんらいけいすう,しんらいすいじゅん confidence coefficient, confidence level<2015廃止自明>

両側または片側信頼区間,若しくは統計的許容区間に付随する確率の値1−α。

2.41 信頼限界 しんらいげんかい confidence limit 

両側信頼区間の両端 T1,T2,または片側信頼区間の端点T。

2.42 統計的許容区間 とうけいてききょようくかん statistical tolerance interval

与えられた信頼率で,母集団の定められた割合を含むと主張できる区間。

備考 区間の両端が統計量として定義されているとき,両側統計的許容区間 (two-sided statistical tolerance interval) という。一方,片方の端点が無限大となっているか,又は確率変数の取り得る限界値になっているとき,片側統計的許容区間 (one-sided statistical tolerance interval) という。

2.43 統計的許容限界 とうけいてききょようげんかい statistical tolerance limits 

両側包含区間の上端と下端,または片側許容区間の端点。

備考   許容限界”と混同してはならない。

2.44 分布の適合度 ぶんぷのてきごうど goodness of fit of a distribution<2015廃止>

経験分布(関数)と理論確率分布との合致の度合。このとき,理論分布のパラメータは観測値から推定されることもある。

2.45 外れ値,異常値 はずれち,いじょうち outliers<2015廃止>

観測値の集合のうち,異なった母集団からのもの又は計測の過ちの結果である可能性を示す程度に,他と著しくかけ離れた観測値。

2.46(統計的)仮説 (とうけいてき)かせつ statistical hypothesis  (仮説検定

母数又は確率分布についての宣言。帰無仮説と対立仮説がある。

2.47 帰無仮説 きむかせつ null hypothesis 

“差がない”,“効果がない”というような形の仮説。ゼロ仮説ともいう。通常,H0で表す。

2.48 対立仮説 たいりつかせつ alternative hypothesis

帰無仮説が成り立たないときの状態を記述する仮説。通常,H1で表す。備考帰無仮説H0は検定される宣言であり,対立仮説H1は帰無仮説が棄却されたときに採択される宣言である。例工程平均µを現行のµ0より小さくすることを目的とした改善の効果を確認したいとき,仮説はH0 :µ=µ0, H1 :µ<µ0となる。このとき,対立仮説は積極的に検証したい仮説となる。

2.49(統計的)検定(とうけいてき)けんてい statistical test (仮説検定

帰無仮説を棄却し対立仮説を支持するか,又は帰無仮説を棄却しないかを観測値に基づいて決めるための統計的手続き。その手続きは,帰無仮説が成立しているにもかかわらず棄却する確率がα以下になるように決められる。このαを有意水準という。

備考1.帰無仮説を棄却するか否かの決定は,適切な検定統計量の値に基づいて行われる。
備考2.有意水準αで帰無仮説を棄却に導く統計的検定の結果を,有意水準αで(統計的に)有意である (significant) という。もし,帰無仮説が棄却されなければ,結果は有意ではない。統計的に有意であることは,必ずしも物理的あるいは経済的な重要性があることを意味しない。

2.50 棄却域 ききゃくいき critical region<2015廃止自明>

帰無仮説が棄却される検定統計量の値の集合。

備考1.棄却域は,帰無仮説が正しいとき,帰無仮説が棄却される確率が有意水準αより大きくならないように決定される。
備考2.棄却域の限界値を棄却限界値 (critical value)という。

2.51 第 1 種の誤り だいいっしゅのあやまり error of the first kind

帰無仮説が正しいとき,帰無仮説を棄却する誤り。あわてものの誤りともいう。

備考1.第1種の誤りの確率を危険率と呼んでもよい。
備考2.有意水準αの検定では,第1種の誤りの確率は,α以下となる。

2.52 第 2 種の誤り だいにしゅのあやまり error of the second kind

帰無仮説が正しくないとき,帰無仮説を棄却しない誤り。ぼんやりものの誤りともいう。

備考 第2種の誤りの確率は,通常βで表される。

2.53 有意水準 ゆういすいじゅん significance level (of a test) <有意> 

第1種の誤りの確率の上限値。

2.54 検出力 けんしゅつりょく power of a test 

帰無仮説が正しくないとき,帰無仮説を棄却する確率。すなわち,第2種の誤りをおかさない確率であり,通常1−βで表される。

例 対立仮説の項(2.48)の例において,第2種の誤りは,µがµ0より小さいにもかかわらず,帰無仮説を棄却しないことである。このような誤りの確率はµの真の値に依存する。すなわち,µがµ0より小さければ小さいほど検出力は1に近くなる。

2.55 検出力関数 けんしゅつりょくかんすう power function of a test

仮説があるパラメータで表現されているとき,パラメータの値によって検出力を与える関数。

備考 検出力関数をグラフ表現したものを検出力曲線 (power curve)という。

2.56 片側検定 かたがわけんてい one-sided test <2015廃止自明>

検定統計量が1次元であり,棄却域がある棄却限界値より小さい領域(又は大きい領域)となる検定。

2.57 両側検定 りょうがわけんてい two-sided test <2015廃止自明>

検定統計量が1次元であり,棄却域がある有限区間の両側となる検定。

2.58 分布によらない検定,ノンパラメトリック検定 ぶんぷによらないけんてい,のんぱらめとりっくけんてい distribution-free test <ノンパラメトリック手法><2015廃止>

検定統計量の帰無仮説の下での確率分布が観測値の従う確率分布に依存しない検定。

2.59 自由度 じゅうど degress of freedom

χ2分布,F分布,t分布などのパラメータ<ref>[[JIS Z 8101]]-1 : 1999 [[統計]] − [[用語]]と[[記号]] − 第1部:[[確率]]及び一般統計用語 2.59 自由度, [[日本規格協会]], http://kikakurui.com/z8/Z8101-1-1999-01.html</ref>。

2.60 カイ二乗検定,χ2検定 かいにじょうけんてい chi-squared test ; χ2test<2015廃止>

検定統計量が,帰無仮説の下でχ2分布に従うことを仮定して行う統計的検定。

2.61  t検定,スチューデントの検定てぃーけんてい,すちゅーでんとのけんてい t-test ; Student’s test <2015廃止>

検定統計量が,帰無仮説の下でt分布に従うことを仮定して行う統計的検定。

2.62  F検定 えふけんてい F-test <2015廃止>

検定統計量が,帰無仮説の下でF分布に従うことを仮定して行う統計的検定。

2.63 繰返し くりかえし repetition <循環

同一条件の下,同一母集団を対象とし,同一方法によって複数回の観測を行うこと。

2.64 反復 はんぷく replication<2015廃止繰返しと同義語>

計画で取り上げた一揃いの実験又は調査を,複数回行うこと。

備考 反復は次の意味で繰返しと区別することが望ましい。すなわち,反復は,計画段階で決められた異なった場所または時間で値を求めることを意味する。

2.65 ランダム化,確率化 らんだむか,かくりつか randomization <ランダム> 

集会の要素をランダムな順序に並べる過程。母集団が1からnの自然数から成るとき,n!通りの順序が等しい確率で選ばれるとき,その選ばれた順序はランダムな順序とよばれる。

備考 もし,これらのn個の数をn個の違った対象またはn水準の処理に前もって対応させ,ランダムに抽出した数の順序に並べれば,その順序はランダム化されたという。
07:04 | Impressed! | Voted(0) | Comment(0)