Xが高い人は、Yも高いか?というの調べたい。Rを使ってやってみる。
相関係数については、以下を見るとどういうものかわかる。
http://www1.tcue.ac.jp/home1/abek/htdocs/stat/corre.html
brew install R
でターミナルから扱えるけど、コピペすると崩れるとかあってつらかったので、GUIを使うことにした。
brew install r-gui
XとYの相関を見るので、XとYのデータが入ったCSVを用意する。
X, Y 1, 1 ...
R-guiを起動し、実際に相関係数と図を出してみる。
> data <- read.csv(“filename.csv”, header=TRUE, fileEncoding="UTF-8") > attach(data) > cor(X, Y) [1] 0.8291897 #=> 積率相関係数 > cor.test(X, Y) Pearson's product-moment correlation data: X and Y t = 741.6014, df = 249923, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.8279607 0.8304106 sample estimates: cor 0.8291897 > plot(X, Y, xlim=c(0,Xの最大値ぽいの), ylim=c(0, Yの最大値ぽいの)) #=> 図ができる
XとYは、0.829ほげほげで 1にかなり近いので、強い相関があると言える。
図は右肩上がりのものになる。
つまり、Xが高い人はYも高いと言え、Yを高めるにはXを高くしていく施策が有効ではないかと考えられる。