Xが高い人は、Yも高いか?というの調べたい。Rを使ってやってみる。
相関係数については、以下を見るとどういうものかわかる。
http://www1.tcue.ac.jp/home1/abek/htdocs/stat/corre.html
brew install R
でターミナルから扱えるけど、コピペすると崩れるとかあってつらかったので、GUIを使うことにした。
brew install r-gui
XとYの相関を見るので、XとYのデータが入ったCSVを用意する。
X, Y 1, 1 ...
R-guiを起動し、実際に相関係数と図を出してみる。
> data <- read.csv(“filename.csv”, header=TRUE, fileEncoding="UTF-8")
> attach(data)
> cor(X, Y)
[1] 0.8291897 #=> 積率相関係数
> cor.test(X, Y)
Pearson's product-moment correlation
data: X and Y
t = 741.6014, df = 249923, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8279607 0.8304106
sample estimates:
cor
0.8291897
> plot(X, Y, xlim=c(0,Xの最大値ぽいの), ylim=c(0, Yの最大値ぽいの))
#=> 図ができるXとYは、0.829ほげほげで 1にかなり近いので、強い相関があると言える。
図は右肩上がりのものになる。
つまり、Xが高い人はYも高いと言え、Yを高めるにはXを高くしていく施策が有効ではないかと考えられる。