なんでn-1なんですか?

統計学の勉強してます。
でも、いきなり勉強がすすまなくなった…。


分散を求める時になんで自由度をn-1で計算するのかが
わからなーい!!


今使ってる「Excelでわかる回帰分析」には、
「分母が標本数であるnではなく、n-1であるのは分散を求める前に平均を求めたことによりデータの情報量が1つ減ると考えられるからです。」
って書いてあるけど、
モヤっとしてて何言ってるかわからん。


買いだめしてた他の参考書をあたっても
自由度はn-1!って何の疑いもなく
書いてあるから謎は深まるばかり…。


そこでネットで「なぜn-1」で検索してみると、
かなりヒットしました!!
同じ疑問を持つ仲間がいたんですね。


教えてgoo!に誰かが投稿していたものを
勝手に引用させてもらうと、

分散の計算では.自由度で割るということが原則です。
ですから.
全数サンプリングの場合には.nで割る。平均値は推定値ではありませんから。
部分サンプリングでは.推定値として1つ「平均値」を使ってしまいましたから.n−1で割る。
重み補正をした場合には.重みに使用した自由度(普通1個)と推定値の「平均値」の合計2個の値を使ってしまいましたから.n−2で割る。
欠点補正をした場合には.1点の補正につき1点の自由度が減少します。2点の欠点がある場合に.2点の補正値を推定して.推定値の平均を1つ.合計3つの値を使ってしまいましたから.n−3で割る。
と考えて行きます。その分散を求めるためにいくつの推定値を使ったか.使った分を除くという考え方に立ちます。

だそうです。


推定値を使った分だけ除くというのはよくわかったけど
なんで除くのかがわからない。
また違う人は

測定点がn個あったとします。これをベクトルで考えると.これから求めようとする値である1点の点はn個の方向へ引っ張られているのです。この数が自由度です。
もし.このn個の中の数の1つを使ってしまったらばどうなるのでしょうか。一つ引っ張る方向が減ります。
世の中にnこしか測定点が存在しない場合には.全体が決まっていますから平均値を求めても自由度は変化しません。しかし.無数の測定が出来る時に平均を求めたらばどうなるのでしょうか。本来無数の点すべてを測定した時に求められる1点の値が分からないから.n個の測定値の算術平均を取って多分全体の点の1点になるであろうと推定して平均としました。つまり.絶対的な値ではなくて想像上の点です。今まであった点に変えてこの点を使いますから.引っ張る方向が一つ減ります。
自由度で割るというのは.このように引っ張る点1点あたりの割合を示しています。

って言ってます。

なんとなくわかったようなわからないような…。

唯一わかったのは、
なんでn-1になるかは数学的に証明することは可能だけど
それを言葉や概念でとらえるのは非常に難しい
ということですね。


これ以上悩んだら日が暮れてしまうので
とりあえず自由度はn-1だ!
って割り切って勉強します。
いつか良い解答とめぐり合えますように。