パルカワ2

PerlとRubyとイチャラブ

Rで相関係数を出してみる。

Xが高い人は、Yも高いか?というの調べたい。Rを使ってやってみる。

相関係数については、以下を見るとどういうものかわかる。
http://www1.tcue.ac.jp/home1/abek/htdocs/stat/corre.html

brew install R

でターミナルから扱えるけど、コピペすると崩れるとかあってつらかったので、GUIを使うことにした。

brew install r-gui

XとYの相関を見るので、XとYのデータが入ったCSVを用意する。

X, Y
1, 1
...

R-guiを起動し、実際に相関係数と図を出してみる。

> data <- read.csv(“filename.csv”, header=TRUE, fileEncoding="UTF-8")
> attach(data)
> cor(X, Y)
[1] 0.8291897  #=> 積率相関係数
> cor.test(X, Y)

	Pearson's product-moment correlation

data:  X and Y
t = 741.6014, df = 249923, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8279607 0.8304106
sample estimates:
      cor 
0.8291897 
> plot(X, Y, xlim=c(0,Xの最大値ぽいの), ylim=c(0, Yの最大値ぽいの))
#=> 図ができる

XとYは、0.829ほげほげで 1にかなり近いので、強い相関があると言える。
図は右肩上がりのものになる。

つまり、Xが高い人はYも高いと言え、Yを高めるにはXを高くしていく施策が有効ではないかと考えられる。