対数近似

時間の経過とともに被説明変数の伸び率が逓減するような
データの分析を行う時は対数をとるとうまく決定係数を
あげることができます。

例えば、上の図のような、ある事柄を調べるのに
使った時間と、調べることができた割合を
示すカバー率の相関関係を調べる時に、
上の図のデータをそのまま散布図に描くと
下のグラフのようになります。


これをそのまま回帰分析にかけても、対数近似曲線を
ひくのは簡単そうだけど、直線の近似曲線をひくのは
難しそうだというのが一目でわかります。


そこで、時間の対数をとってデータを調整します。
対数近似の処理を行ったデータの散布図は以下のとおりです。


これなら回帰式を作成するのも楽にできそうです。
実際に、対数近似の処理を行わないと決定係数が0.84だったのが、
対数近似の処理を行っただけで0.99にまで改善しました。