忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

確率変数
ある確率で特定の値をとる変数
確率的に変動する変数。逆に言えば、確率的に既定される変数。
あるバッターがある特定の打席でヒットを打つかどうかは打率によって既定される (ように表現されている)
心理学は (大体) 推測統計をするから、どのデータも確率変数
サイコロの1-6はそれぞれ1/6の確率でとる確率変数

確率分布
確率変数がそれぞれどういう値をとるか決める分布。
サイコロの例ではp(x) = P(X=x) = 1/6。1/6という棒グラフが横から6つ並んでいるイメージ
※Σp(x) は常に1になる

確率密度関数 probability density function

サイコロの場合、1-6、それぞれの生起確率は1/6であるが、連続変量の場合、その取りうる値は無限である。この場合、確率密度関数を定義し、ある確率変数が任意の区間に含められる確率を求められるようにしておく
Rで標準正規分布
x <- seq(-3,3,0.01)
curve(dnorm(x,0,1), -3, 3, type="l")

調整平均
(x2+x3+x4...xn-1)/(n-2)
最小値と最大値を省いて平均をとったものが100%調整平均

母数
parameter. 母集団分布の特徴を表す数字。母集団平均、母集団相関とか

標本分布
sampling distribution. 標本の度数分布ではない。間違えそうなのでサンプリング分布と読んでみよう (南風原, 2003)
標本統計量 (観測データの平均とか) の変動を既定する分布
大学生、という母集団から研究のため20人サンプリングして知能検査をする。このときの平均が100だった。もう一回同じ実験をしたら110だった。もう一回やったら95だった...ということを何度もやったとき、平均の変動を決める分布。真ん中に集まってたら変動しないし、広かったら変動しやすいだろう

標準誤差
サンプリング分布の標準偏差。上述の真ん中に集まってたら、とはサンプリング分布の標準偏差が小さい、すなわち標準誤差が小さいという意味で、広かったらとは同様に大きいという意味。
Rでは sqrt(var(as.vector(x))/length(x))

推定量estimatorと推定値estimate
母数の点推定 (母集団の平均はこれだ!) に使う標本統計量。標本平均、標本比率…等
推定量は概念であり、これを適用して実際のデータを収集し求めた値を推定値という
大学生の平均知能指数 (母数) は100人くらい標本をとって平均をとれば推定できる (推定量) だろう。で、実際取ったら平均は108だった (推定値)

標準化
粗点から平均を引いて標準偏差で割る。このときの標準偏差は不偏標準偏差。
あくまでも母集団標準偏差の代わりとして使うから
Rではscale(x)
PR
Comment
Trackback
Trackback URL

Comment form
Title
Color & Icon Vodafone絵文字 i-mode絵文字 Ezweb絵文字  
Comment
Name
Mail
URL
Password
プロフィール
HN:
tao
HP:
性別:
非公開
職業:
会社員
趣味:
アウトドア、自転車、ジョギング、英語学習
自己紹介:
・千葉在住のサラリーマンです。データ分析っぽいことが仕事。
・今年英検1級取得。今はTOEIC高得点を目指して勉強中。
・興味のあることは野球、アウトドア、英語学習、統計、プログラミング、PC関係などなど。
ブログ内検索
freead
順位表
プロ野球データFreak
セリーグ順位表
パリーグ順位表