対応のある2群のt検定

https://gyazo.com/9d7c82a5547945b989ff609f878470e1

対応のある2群とは

前回は独立な2群(対応のない2群)の検定を考えました. 今回は,対応のある2群 の検定に注目します. 対応のある2群 とは,2つの標本に含まれる対象に,何らかの対応関係があることを意味しています. 例えば,下記のように,同じ4人の被験者に対して,2種類の条件下で測定された2群のデータは,「対応のある2群」です.

「独立な2群の検定」には,新しい検定統計量が必要でしたが, 「対応のある2群の検定」では,2群のデータの「変化量」に着目することで, 標準的なt検定の検定統計量を適用することが可能です.

スクリプトの作成

コードを入力し保存するためのスクリプトを作成しましょう. [ファイル]-[新しいスクリプト]をクリックし,Rエディタを表示します. 次に,[ファイル]-[保存]をクリックして,スクリプトを保存します. このとき,ファイル名はchapter12としてください. また,ファイルの保存場所と作業ディレクトリをデスクトップに変更しておきます.

対応のある2群のt検定

それでは,下記の問題について考えていきましょう.

向研究室の学生を対象に実施した情報数学に関するテストの得点はであった. その後,向による熱心な指導を行い,再度,情報数学に関するテストを実施したところ, その得点はとなった. 指導の前後における得点の平均値に有意な差はあるか. (どちらも同じ母集団からランダムサンプリングした標本だろうか).

ここでは,指導の前後という対応関係があることから,得点の 変化量 に注目します. 変化量はで与えられます.

この変化量が,平均, 分散の正規分布に従うと仮定します.

すると,この変化量(標本)の平均の分布は, 平均, 分散の正規分布に従うことになります. これは,「母集団」と「標本平均の分布」の関係ですね.

これを標準化することで,t分布の検定統計量になります. このとき,母集団の標準偏差は未知のため, 代わりに標本の標準偏差を用いることに注意してください.

また,対象が変化量であることから, 帰無仮説はとおくため, 上記の式は下記のようになります. 随分とスッキリした検定統計量になりました.

それでは,検定の手順に従って,上記の問題を解いていきましょう. まずは,帰無仮説対立仮説 を立てます.

次に,検定統計量 と,信頼区間(棄却域) を定めます. 今回は,検定統計量は上記のtスコアとし,信頼度には「95%信頼度(5%棄却域)」を用いることにしましょう.

それでは,検定統計量であるtスコアを計算してみましょう. まずは,標本の平均と 標準偏差を求めます.

x1 <- c(63,75,72,67,71)
x2 <- c(82,70,78,81,79)
d <- x2 - x1
mu <- mean(d)
sigma <- sd(d)

> d
[1] 19 -5  6 14  8
> mu
[1] 8.4
> sigma
[1] 9.071935

上記の計算結果を基ににtスコアを求めます.

n = length(d)
t <- mu / sqrt(sigma^2 / n)
> t
[1] 2.070448

最後に,自由度のt分布を利用して,帰無仮説が採択か棄却かを調べましょう. qt関数を用いると,95%信頼度のとき,t<-2.77,また,t>2.77 が棄却域となることが分かります.

> qt(0.025,4)
[1] -2.776445
> qt(0.975,4)
[1] 2.776445

合わせてt分布をグラフにして確認してみましょう.

> curve(dt(x,4),-3,3)
> abline(v=qt(0.025,4))
> abline(v=qt(0.975,4))

https://gyazo.com/7f6a986e2ff25ce907cea3ede04287f0

上記の結果から,tスコアの2.07は棄却域に含まれないので, 帰無仮説「変化量の母平均は0である」が採択されます. これは,指導の前後の得点には有意な差がないということを意味しています. 明確に指導の効果があったとは言えないということです.悲しいですね.

関数を利用したt検定

上記の検定はt.test関数でも可能です. 引数には「母平均が0である」ことを意味するmu=0を与えます.

> t.test(d,mu=0)

		One Sample t-test

data:  d
t = 2.0704, df = 4, p-value = 0.1072
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 -2.864295 19.664295
sample estimates:
mean of x 
	  8.4 

tスコアが求めた2.07に一致していることが分かります. p値が0.107(10%)であることから,信頼区間に含まれていることが分かります. また,母集団の平均値の信頼区間は -2.86 から 19.66 となっており, 帰無仮説であるが含まれていることが分かります.

課題

指導後の得点が{83,93,75,84,85}だったときのtスコアを求めなさい. また,t検定 を用いて,「95%信頼度(5%棄却域)」のときに, 「帰無仮説:変化量の母平均は0である 」は棄却されるか調べ, そのときの母集団の平均値の信頼区間も求めなさい. ソースはchapter12.Rに記述して提出すること.

参考書籍

愛知県名古屋市にある椙山女学園大学 文化情報学部 向研究室の公式サイトです. 専門は情報科学であり,人工知能やデータベースなどの技術要素を指導しています. この公式サイトでは,授業で使用している教材を公開すると共に, ベールに包まれた女子大教員のミステリアスな日常を4コマ漫画でお伝えしていきます. サイトに関するご意見やご質問はFacebookまたはTwitterでお問い合わせください.