忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

効果量とは
d family (Cohenのd, f2) とr family (r, eta) がある。
d family は平均値差を標準化したもの、r family は変数間の関連度合いを表したもの
参考:
http://www.ec.kagawa-u.ac.jp/~hori/spss/tokidoki2.html#22
http://home.hiroshima-u.ac.jp/nittono/QA.html#Stat

t検定の効果量
# サンプル
y1 <- c(4, 3, -3, 4, 1, 4, 0, 6, 2, -6, 2, 6, 6, -2, 1, 1, 6, -2, 7, -1) # 男子
y2 <- c(9, 0, 6, 5, 5, 5, 2, 11, 5, 3, 4, 7, 4, 10, -2, 6, 1, 2, 4, 4) # 女子
## 心理統計学の基礎、p. 9 変化量データ。
tres <- t.test(y1, y2, paired=F, var.equal=T)
t.v <- tres$statistic
df <- tres$parameter
tres
        Two Sample t-test

data:  y1 and y2
t = -2.4332, df = 38, p-value = 0.01978
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -4.7632071 -0.4367929
sample estimates:
mean of x mean of y
     1.95      4.55

d family
Cohenのd

平均値差 / sqrt(分散の和/2)
(mean(y1)-mean(y2))/(sqrt((var(y1)+var(y2))/2))
  -0.7694321
## 対応あり、なし、どちらでも同じ (?)
## t値を2倍し、Nの平方根で割るという方法もあるようだが、数値が一致しなくてよくわからない:
2*t.v /sqrt(length(y1)+length(y2))
## これはHedgeのgというらしい。分母を自由度 ( = 38) ではなくNの総計 ( = 40) にするとCohen's dに一致する。分母を自由度にした場合は、効果量の分母で標本分散を使ったときのCohen's dに一致する
2*t.v /sqrt(df)
fv1 <- var(na.omit(y1))*(length(na.omit(y1))-1)/length(na.omit(y1))
fv2 <- var(na.omit(y2))*(length(na.omit(y2))-1)/length(na.omit(y2))
(mean(y1)-mean(y2))/(sqrt((fv1+fv2)/2))
p.rep.t関数で算出されるのは標本の方みたい
## 対応なしで各群の人数が異なる場合は以下を分母にする
s1 <- (var(y1))
s2 <- var(y2)
n1 <- length(y1)
n2 <- length(y2)
sqrt(((n1-1)*s1+(n2-1)*s2)/(n1+n2))

r family
r

sqrt(t.v^2/(t.v^2 + df))
## 群を01としたときの点双列相関係数に等しい
gr <- c(rep(1, 20), rep(0, 20))
y12 <- c(y1, y2)
cor(gr, y12)

PR
Comment
Trackback
Trackback URL

Comment form
Title
Color & Icon Vodafone絵文字 i-mode絵文字 Ezweb絵文字  
Comment
Name
Mail
URL
Password
プロフィール
HN:
tao
HP:
性別:
非公開
職業:
会社員
趣味:
アウトドア、自転車、ジョギング、英語学習
自己紹介:
・千葉在住のサラリーマンです。データ分析っぽいことが仕事。
・今年英検1級取得。今はTOEIC高得点を目指して勉強中。
・興味のあることは野球、アウトドア、英語学習、統計、プログラミング、PC関係などなど。
ブログ内検索
freead
順位表
プロ野球データFreak
セリーグ順位表
パリーグ順位表