忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。


母平均の信頼区間を求める。母平均0との検定を行う
t.test関数で両方わかって超便利
##データを用意
x <- c(1,2,3,4,5,6,7,8,9)
t.test(x, m=0)
        One Sample t-test
data:  x
t = 5.4772, df = 8, p-value = 0.0005894
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 2.894916 7.105084

sample estimates:
mean of x
        5

##これでいいのだが、信頼区間の覚書
下限値のだけ書いておく
95%信頼区間の加減と上限の絶対値は
x.qt <- abs(qt(0.025, 8))
[1] 2.306004
平均値の標準誤差
x.se <- sqrt(var(x)/length(x))

[1] 0.912871
mean(x)-(x.qt*x.se)
[1] 2.894916

以下、理屈の覚書
ある母集団からサンプリングした標本平均は、平均μ、分散σ2/nの正規分布に従う (これはすなわち標本平均のサンプリング分布のことであり、この分散の平方根は標本平均の標準誤差と同じ)
母集団分散σ2を標本分散 (本当は不偏分散) に置き換えて標準化する
(mean(x) - μ )/ se(x)
とこれが自由度n-1のt分布に従う。
これでqt関数を使用すればt分布の下限と上限がわかり、式を展開すると
下限値はmean(x)-(x.qt*x.se)
上限値はmean(x)+(x.qt*x.se)


母比率の区間推定
100サンプルで40のヒットが出た場合
n <- 100
p <- 40/100

比率の標準誤差
p.se <- sqrt((p*(1-p))/n))


これにqnorm(0.975)をかけ、標本比率にプラスマイナスすれば信頼区間が出る、と教科書には書いてある
p - qnorm(0.975)*p.se
[1] 0.3039818

Rでbinom.test関数を用いると信頼区間が算出され、特定の比率との検定ができる
binom.test(40, 100, 0.5)

        Exact binomial test

data:  40 and 100
number of successes = 40, number of trials = 100, p-value = 0.05689
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.3032948 0.5027908

sample estimates:
probability of success
                   0.4

### この信頼区間は上の計算と一致しない。binom.test関数でどんな計算をしてるかわからないが、たぶんqnorm(0.975) をかけるやりかたはあくまでも正規分布への近似だからじゃないかと思う。
参考: http://oku.edu.mie-u.ac.jp/~okumura/stat/tests_and_CI.html


相関係数の標準誤差
x <- c(1,2,3,4,5,6)
y <- c(2,1,4,3,6,5)
r <- cor(x,y)
cor.se <- (1-r^2)/sqrt(6)
cor.test(x,y)

        Pearson's product-moment correlation

data:  x and y
t = 2.9598, df = 4, p-value = 0.04156
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.05192932 0.98068460

sample estimates:
      cor
0.8285714

相関係数の信頼区間はフィッシャーのz変換とかして面倒だからパスしよう

PR
Comment
Trackback
Trackback URL

Comment form
Title
Color & Icon Vodafone絵文字 i-mode絵文字 Ezweb絵文字  
Comment
Name
Mail
URL
Password
プロフィール
HN:
tao
HP:
性別:
非公開
職業:
会社員
趣味:
アウトドア、自転車、ジョギング、英語学習
自己紹介:
・千葉在住のサラリーマンです。データ分析っぽいことが仕事。
・今年英検1級取得。今はTOEIC高得点を目指して勉強中。
・興味のあることは野球、アウトドア、英語学習、統計、プログラミング、PC関係などなど。
ブログ内検索
freead
順位表
プロ野球データFreak
セリーグ順位表
パリーグ順位表