仕事の効率化

エクセルで行う有意差検定【解説付き】

製造業に携わっていると、新しい方法で製造した製品が従来の方法と比較して効果があるのかないのかを統計学的に見極める必要が出てきます。

単純に平均値の比較で効果の有り無しを見極めてもいいのですが、統計学を使うことでより論理的に説明することが出来ます。

この時に使うのが「有意差検定」であり、医学などでも使われる有名な手法です。

「有意差検定」は難しく思われがちですが、エクセルであれば簡単な計算式を使うことで求めることが出来ます。

有意差検定の概要

母集団に対して「仮説(hypothesis)」を設定し、その仮説が正しいのか正しくないのかを統計的手法を用いて判定する方法を「検定」といいます。

今回は、データが計量値の場合の解析方法として、平均値、標準偏差を計算し、正規分布を使用した検定を説明します。

例題を用いて、有意差検定の説明

<例題>
ある工場で製造された製品の収量平均が53.5kg、標準偏差が12.0kgであることが分かっている。今回新しい方法で製造した製品を20ロット無作為抽出で標本調査した結果、収量の平均は60.0kgであった。
この結果では6.5kgの差があるが、新しい製造方法は従来の製造方法と比べて収量に差があるといえるだろうか。

検定とは、標本の平均と母集団の平均との間にある差が誤差であるのか、そうではないのかを判定することです。
ここで、標本の平均値を「標本平均:Xバー(エックスバー)」
母集団の平均値を「母平均:μ(ミュー)」
で表現し、標本調査の結果が母集団の実体に対してどの程度の信頼性をもっているかを統計的手法で検討します。

上記の例題の場合、統計的手法では、検定の基準として「新しい製造方法と従来の製造方法の収量に差はない」とする仮説を設定します。

この「差はない」とする仮説を「帰無仮説」といい、記号H0で表現し、また、「差がある」とする仮説は「対立仮説」といい、記号H1で表現します。つまり、「帰無仮説」が否定されれば、「新しい製造方法と従来の製造方法の収量に差はないとは言えない」と判定します。

このような手法を「仮説検定(hypothesis testing)と言い、設定した仮説が否定されることを「棄却(Reject)」、逆に仮説が否定されないことを「採択(Accept)」と言います。

仮説検定は確率的にめったにおきない値の範囲を「棄却域」として設定しておくことです。また、棄却域以外の範囲を「採択域」として設定します。

例題のような、標本調査の結果から「検定統計量」という値を算出し、その値が下図1に示している棄却域に入っていれば、設定された「差はない」とする仮説の「帰無仮説」は棄却されます。逆に「採択域」に入れば「帰無仮説」は採択されます。

・「帰無仮説」が棄却される:差がある
・「帰無仮説」が採択される:差がない

ここで、図1に示す棄却域に相当する確率を「有意水準(Significant Level)」、または「危険率」といい、α(アルファ)で表現します。

統計学でではこの「有意水準(危険率)」を普通「5%」または「1%」と決めておいて、標本調査から検定統計量を求め、この検定統計量が有意水準によって設定されている棄却域に入るか採択域に入るかによって、設定された帰無仮説の棄却、採択を判定します。

有意水準(危険率)とは、帰無仮説を棄却する基準となる値であり、また、有意水準(危険率)5%ということは、100回のうち5回は判断を誤るかもしれないということになるので、調査対象の種類などによっては1%に設定するなど使い分けが必要になる基準です。

新しい製造方法は従来の製造方法と比べて差がないという仮説を例にして手順を進めます。また、有意水準は5%とします。

【手順1】

帰無仮説H0と対立仮説H1を設定します。

帰無仮説H0:差はない
対立仮説H1:差はある

【手順2】

「検定統計量」μ(ミュー)を求めます。

【手順3】

手順2で求めた検定統計量μ=2.43が採択域に入るか、棄却域に入るかについて判定します。
下図に示す通り、両側検定で有意水準5%の場合、両方の確率をα/2=0.025(片側2.5%づつ)に設定します。

この確率に対応する横軸の値を下表の「標準正規分布表」から求めます。

【表の見方】

標準正規分布表は正規分布の全体の面積を1.0とした時の横軸Z=0からZまでの面積を表しています。
例えば、Z=2.0のときは0.4772となり、斜線の部分の面積が全体の47.72%になることが分かります。
検定の要点としては、検定統計量μの値を棄却域0.025に対応するZの値と比較することになります。

では棄却域を0.025にした場合のZはいくつになるでしょうか。
下図の通り、赤い斜線の面積に対応するZの値を求めれば良いのですから、赤い斜線の面積=0.5(片側半分の面積)-0.025(棄却域)=0.4750
標準正規分布表からこの0.4750をに対応するZの値を求めると、Z=1.96ということが分かります。
また、片側検定の場合はZ=1.64になります。

Z=1.96という値が算出されたので、これを標準正規分布に当てはめると下図のようになります。
標準正規分布は平均値を基準にして左右対称であることから、左右の棄却域の絶対値は同じ値となります。

従って、検定統計量μの絶対値|μ|と先程求めたZの絶対値|Z|の関係は以下のようになります。

<有意水準5%の場合>
 |μ|>=1.96 帰無仮説を棄却
 |μ|<=1.96 帰無仮説を採択

よって、この手順2よりμ=2.43と算出されているので、
2.43>=1.96が成立し、下図に示すように検定統計量2.43は棄却域にはいることから「新しい製造方法は従来の製造方法と比べて差がない」という帰無仮説は棄却される結果となります。

また、問題が「新しい製造方法は従来の製造方法と比べて収量が増加したか(または減少したか)」である場合は片側検定を行います。
片側検定は下図に示すように、右側(または左側)だけで棄却域を設定します。(大きいか、小さいか)

有意水準5%の場合のZは1.64でになりますので、検定統計量μとの関係は以下のようになります。

<有意水準5%の場合>
帰無仮説:差がない
対立仮説(右側):大きい  対立仮説(左側):小さい
右側検定 μ>=1.64 帰無仮説を棄却して、母平均<標本平均と判定
左側検定 μ<=-1.64 帰無仮説を棄却して、母平均>標本平均と判定

例題の場合、μ=2.43なので2.43>=1.64が成立し、帰無仮説が棄却され、「母平均<標本平均」となり、「新しい製造方法は従来の製造方法と比べて収量が増加した」と判定出来ます。

エクセルによる有意差検定の実践問題

上記有意差検定の説明をふまえて、問題を解いていきます。

<実践問題1>

ある工場の装置Aで加工した機械部品の寸法を測定したら、下記表のような結果となった。
この工場の機械部品の平均寸法は、58.0cm、母標準偏差は4.5である。
「装置Aの機械部品の寸法は、工場の平均寸法と比較して差があるか」について検定しなさい。
ただし、分布は正規分布、有意水準は5%で検定すること。

【手順1】

帰無仮説H0と対立仮説H1を設定します。

帰無仮説H0:差はない
対立仮説H1:差はある

【手順2】

「検定統計量」μ(ミュー)を求めます。

ここで、母平均「μ0」、母標準偏差「σ」は問題より既知ですから
μ0=58.0、σ =4.5 となります。

次に標本平均「Xバー」は関数式「=AVERAGE(A8:A22)」をセルに入力し算出します。 Xバー =59.26 となります。

次にデータ数nは関数式「=COUNT(A8:A22)」をセルに入力し算出します。
n =15 となります。

以上のデータを使用し検定統計量μを計算します。

ですので、

μ=(59.26-58)/(4.5/SQRT(15))   ※(SQRT)は平方根を返す引数。

μ =1.08 となります。

【手順3】

問題が「装置Aの機械部品の寸法は、工場の平均寸法と比較して差があるか」なので両側検定を行います。

まず、両側検定の棄却域を求めます。

エクセルでは標準正規分布表を使わなくても棄却域の計算が可能です。

有意水準は0.05(5%)と既知な値ですので、

右側棄却域は関数式「=NORMSINV(1-0.05/2)」をセルに入力し計算します。
右側棄却域=1.96 となります。

次に左側棄却域は関数式「=NORMSINV(0.05/2)」をセルに入力し計算します。
左側棄却域=-1.96 となります。

【検定結果】

検定結果μ=1.08より
1.08=<1.96が成立し、下図に示すように検定統計量1.08が採択域に入ることから帰無仮説は採択され、
装置Aの機械部品の寸法は、工場の平均寸法と比較して差がない」とする帰無仮説を採択する結論となります。

「帰無仮説」が採択される:差がない

<実践問題2>

ある工場の装置Aで加工した機械部品の寸法を測定したら、下記表のような結果となった。この工場の機械部品の平均寸法は、58.0cm、母標準偏差は4.5である。「装置Aの機械部品の寸法は、工場の平均寸法と比較して大きいか」について検定しなさい。
ただし、分布は正規分布、有意水準は5%で検定すること。

【手順1】

帰無仮説H0と対立仮説H1を設定します。

帰無仮説H0:差はない
対立仮説H1:差はある

【手順2】

ここで、母平均「μ0」、母標準偏差「σ」は問題より既知ですから
μ0=58.0、σ =4.5 となります。

次に標本平均「Xバー」は関数式「=AVERAGE(A8:A22)」をセルに入力し算出します。 Xバー =60.31 となります。

次にデータ数nは関数式「=COUNT(A8:A22)」をセルに入力し算出します。
n =15 となります。

以上のデータを使用し検定統計量μを計算します。

ですので、

μ=(60.31-58)/(4.5/SQRT(15))     ※(SQRT)は平方根を返す引数。

μ =1.99となります。

【手順3】

問題が「装置Aの機械部品の寸法は、工場の平均寸法と比較して大きいか」なので片側検定(右)を行います。

まず、片側検定の右側棄却域を求めます。

エクセルでは標準正規分布表を使わなくても棄却域の計算が可能です。

有意水準は0.05(5%)と既知な値です。

右側棄却域は関数式「=NORMSINV(1-0.05)」をセルに入力し計算します。
右側棄却域=1.64となります。

【検定結果】

検定結果μ=1.99より
1.99>=1.64が成立し、下図に示すように検定統計量1.99が棄却域に入ることから帰無仮説は棄却され、
装置Aの機械部品の寸法は、工場の平均寸法と比較して大きい」と判定されます。

「帰無仮説」が棄却される:差がある

合わせて読みたい

>> 転職はまだ早いと思っていても転職サイトに登録するべき5つの理由

こちらの記事もおすすめ!