先程のエントリにも記載していますが、 「寄与率」は回帰分析にもあり、それを混同していたので、再整理。
寄与率(=決定係数) の定義式
ここで、 は実測値で、 は実測値の総平均。
ここで、 はモデル値(予測値)。
これらを用いて、寄与率(=決定係数)は次のように定義されています。
また、上記の「回帰による平方和」を利用し、次のように表すことが可能です。
寄与率(=決定係数) は、なぜ Rの2乗で表すか?
相関係数であるRと、寄与率(=決定係数)の間に2乗の関係があることが理由のようです。
更に…自由度修正済み寄与率
先程、記載した寄与率は説明変数が増える程、上昇するらしい。 (実際の説明力の有無に関らず、寄与率が増加…)
そこで「自由度」を考慮し修正した「自由度修正済み寄与率」があるらしい。(以下)
ただし、 n=データ数、残差の自由度 = データ数(n) - 説明変数の数 - 1