そもそもあのデータで負の相関ありとは言えないと思います
ということなので、お勉強。ピアソンの積率相関係数の有意性検定。
結婚式と離婚率の関係。今サンプル数が n=10 で相関係数 r=-0.53 なので 検定統計量 t0 = 1.77。Pr{ |t| > t0 } = 0.114686 > 0.05 なので母相関係数が 0 であるという帰無仮説を棄却できない。母相関係数が 0 でないとはいえない。
というわけで、負の相関があるとはいえない。
これは何をいっているかというと、結婚式の費用と離婚率が独立した正規分布に従うとしても、サンプル数が10くらいでは図のような負の相関の分布になる確率を無視できないということ。
でも、結婚式の費用とか離婚率が正規分布に従うとは限らない。その場合は、直線回帰分析を使う。つまり、結婚式の費用と離婚率が y = ax + b + error の関係にあるとして、a と b を推定して検定する。ただし、error は正規分布に従うとする。
結婚式の平均費用と離婚率のグラフから適当に表を作成。data.txt に保存。行頭にスペースを含んではいけない。
x y 1 160 2.5 2 360 1.8 3 240 1.6 4 340 2.1 5 260 2.3 6 270 1.9 7 240 2.1 8 270 1.9 9 290 2.1 10 290 2.1
世界で最も検索しにくい名前をもつソフトのうちの一つである統計処理ソフト R を起動。
$ R
> height <- read.table("data.txt") > attach(height) > plot(x, y) > result <- lm(y ~ x) > abline(result) > summary(result)
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.596542 0.402100 6.457 0.000197 *** x -0.002046 0.001451 -1.410 0.196265
となる。結婚式の費用とか離婚率のグラフを y = -0.002x + 2.597 + error だと推定している。だけど、a の Pr(>|t|) = 0.1963 > 0.05 なのでここでも a が 0 であるという帰無仮説を棄却できない。a が 0 でないとはいえない。
直線回帰分析でも係数が負であるとは言えなかった。
ゲームの展示会なのにコンパニオンなんて必要ないじゃないですか。こんなことしているからゲームが売れなくなるんですよ。プンプン。と怒ってみても説得力がないですね。
その 1。
最近のコメント