線形重回帰分析における「変動の分解」

X 1 X 2 ,・・・, X m Y のデータの組が n 個あるとする.

データNo. データ X 1
(説明変数1)
データ X 2
(説明変数2)
・・・ データ X m
(説明変数m)
データ Y
(目的変数)
1 x 11 x 12 ・・・ x 1 m y 1
2 x 21 x 22 ・・・ x 2 m y 2
3 x 31 x 32 ・・・ x 3 m y 3
n x n 1 x n 2 ・・・ x n m y n

このデータから求められる線形重回帰式

y ^ = β 0 + β 1 x 1 + β 2 x 2 + + β m x m   ・・・・・・(1)

β 0 0

で表されるとすると

i = 1 n y i y ¯ 2 = i = 1 n y ^ i y ^ ¯ 2 + i = 1 n e i e ¯ 2   ・・・・・・(2)

備考 x ij 説明変数の実際の値, y i 目的変数の実際の値, y ^ i を予測値(回帰式より求めた値), e i 残差とし.これらの平均値 y ¯ y ^ ¯ e ¯ で表わす.

ただし

y ¯ = 1 n i = 1 n y i ・・・・・・(3)

y ^ ¯ = 1 n i = 1 n y ^ i ・・・・・・(4)

e ¯ = 1 n i = 1 n e i ・・・・・・(5)

y ^ i = β 0 + β 1 x i 1 + β 2 x i 2 + + β m x i m ・・・・・・(6)

残差: e i = y i y ^ i ・・・・・・(7)

備考: y ¯ = y ^ ¯ e ¯ = 0 (証明の(43)(41)を参照のこと)

の関係がある.

i=1 n y i y ¯ 2 全変動(Total Variation),あるいは,全平方和(Total Sum of Squares)(以下,TSSと表記)

i=1 n y ^ i y ^ ¯ 2 回帰変動(Regression Variation),あるいは,回帰平方和(Regression Sum of Squares,あるいは,Sum of Squares due to Regression)(以下,SSRと表記)

i = 1 n e i e ¯ 2 残差変動(Residual Variation),あるいは,残差平方和(Residual Sum of Squares ( RSS),あるいは,Sum of Squared Errors)(以下,SSEと表記)

を用いて(2)を書き替えると

全変動(TSS)=回帰変動(SSR)+残差変動(SSE) ・・・・・・(8)

のような表現もある.(2),(3)の関係を変動の分解という.

■証明

(6)より

y ^ 1 = β 0 + β 1 x 11 + β 2 x 12 + + β m x 1 m y ^ 2 = β 0 + β 1 x 21 + β 2 x 22 + + β m x 2 m y ^ n = β 0 + β 1 x n 1 + β 2 x n 2 + + β m x n m

となる連立方程式が得られる.行列を使って表わすと

y ^ 1 y ^ 2 y ^ n = 1 x 11 x 12 x 1 m 1 x 21 x 22 x 2 m 1 x n 1 x n 2 x n m β 0 β 1 β 2 β m ・・・・・・(9)

となる.

とおくと,(9)は

y ^ = X β   ・・・・・・(13)

のように表せる.

e 1 e 2 e n = e   ・・・・・・(14) y 1 y 2 y n = y   ・・・・・・(15)

とおくと,(7)より

e = y y ^ ・・・・・・(16)

が得られる.

残差平方和 S S E

S S E = i = 1 n e i 2 = i = 1 n y i y i ^ 2 = i = 1 n y i β 0 + β 1 x i1 + β 2 x i2 + + β m x im 2   ・・・・・・(17)

となる.ベクトルを用いて表すと,(15)より

S S E = i = 1 n e i 2 = e 2 = y y ^ 2   ・・・・・・(18)

となる.  (ベクトルの大きさを参照)

回帰式では, S S E が最小(極小)となるとなるように β 0 β 1 β 2 ,・・・, β m が求められている.よって, S S E が極小となるときに成り立つ式

を満たす β 0 β 1 β 2 ,・・・ , β m を求めればよい.

備考:残差平方和の特徴として,極小は存在するが,極大は存在しない.よって,(19),(20),(21),(22)を満たすのは極小のときのみである.

(19)と(18)より

β 0 i = 1 n y i β 0 + β 1 x i1 + β 2 x i2 + + β m x im 2 = 0

i = 1 n β 0 y i β 0 + β 1 x i1 + β 2 x i2 + + β m x im 2 = 0

i = 1 n 2 y i β 0 + β 1 x i1 + β 2 x i2 + + β m x im 1 = 0

i = 1 n y i β 0 + β 1 x i1 + β 2 x i2 + + β m x im = 0   ・・・・・・(23)

が得られる.(23) を以下のように式変形をする.

i = 1 n y i i = 1 n β 0 + β 1 x i1 + β 2 x i2 + + β m x im = 0

i = 1 n y i = i = 1 n β 0 + β 1 x i1 + β 2 x i2 + + β m x im

i = 1 n y i = i = 1 n 1 x i1 x i2 x im β 0 β 1 β 2 β m

i = 1 n y i = i = 1 n 1 x i1 x i2 x im β 0 β 1 β 2 β m

i = 1 n 1 y i = i = 1 n 1 1 x i1 x i2 x im β 0 β 1 β 2 β m   ・・・・・・(24)

(20)と(18)より,同様にして,以下の式が得られる.

i = 1 n x i1 y i = i = 1 n x i1 1 x i1 x i2 x im β 0 β 1 β 2 β m   ・・・・・・(25)

(21)と(18)より,同様にして,以下の式が得られる.

i = 1 n x i2 y i = i = 1 n x i2 1 x i1 x i2 x im β 0 β 1 β 2 β m   ・・・・・・(26)

(22)と(18)より,同様にして,以下の式が得られる.

i = 1 n x im y i = i = 1 n x im 1 x i1 x i2 x im β 0 β 1 β 2 β m   ・・・・・・(27)

行列を用いて,(24),(25),(26),(27)を1つの式にまとめると

i = 1 n 1 y i i = 1 n x i1 y i i = 1 n x i2 y i i = 1 n x im y i = i = 1 n 1 1 x i1 x i2 x im i = 1 n x i1 1 x i1 x i2 x im i = 1 n x i2 1 x i1 x i2 x im i = 1 n x im 1 x i1 x i2 x im β 0 β 1 β 2 β m

1 1 1 x 11 x 21 x n 1 x 12 x 22 x n 2 x 1 m x 2 m x n m y 1 y 2 y n

= 1 1 1 x 11 x 21 x n 1 x 12 x 22 x n 2 x 1 m x 2 m x n m 1 x 11 x 12 x 1 m 1 x 21 x 22 x 2 m 1 x n 1 x n 2 x n m β 0 β 1 β 2 β m

X t y = X t X β   ・・・・・・(28)

となる.この式をさらに変形をする.

X t y X t X β = 0

X t y X β = 0

(13)を代入する.

X t y y ^ = 0

(16)を用いると

X t e = 0   ・・・・・・(29)

が得られる. X の各列を

とおくと,(29)より

の関係が得られる.

y ^ x 0 x 1 x 2 ,・・・, x m を使って表わすと

y ^ = β 0 x 0 + β 1 x 1 + β 2 x 2 + + β m x m   ・・・・・・(38)

となる.

(38)を用いて,以下のような計算をする.

y ^ t e = β 0 x 0 + β 1 x 1 + β 2 x 2 + + β m x m t e

この転置行列の性質を用いると

y ^ t e = β 0 x 0 t + β 1 x 1 t + β 2 x 2 t + + β m x m t e

この転置行列の性質を用いると

y ^ t e = β 0 x t 0 + β 1 x t 1 + β 2 x t 2 + + β m x t m e

この行列の性質を使うと

y ^ t e = β 0 x t 0 e + β 1 x t 1 e + β 2 x t 2 e + + β m x t m e

(34),(35),(36),(37)より

y ^ e = 0 ・・・・・・(39)

( y ^ t e = y ^ e 関しては,内積を参照)

の関係が成り立っている.

y 2 の計算をすると

y 2 = y y   (ベクトルの大きさと内積の関係を参照)

(15)の関係を用いると

= y ^ + e y ^ + e

内積の計算の基本則を用いると

= y ^ + e y ^ + y ^ + e e

= y ^ y ^ + e y ^ + + y ^ e + e e

= y ^ 2 + e 2 ・・・・・・(40)

となる.

(34)を以下のように式変形をする.

x t 0 e = 0

1 1 1 e 1 e 2 e n = 0

e 1 + e 2 + + e n = 0

1 n e 1 + e 2 + + e n = 0

1 n i = 1 n e i = 0

e ¯ = 0 ・・・・・・(41)

すなわち,残差の平均 e ¯ は0となる.

(7)を用いて以下の計算をする.

1 n i = 1 n e i = 1 n i = 1 n y i y ^ i

1 n i = 1 n e i = 1 n i = 1 n y i 1 n i = 1 n y ^ i

(3),(4),(5)より

e ¯ = y ¯ y ^ ¯ ・・・・・・(42)

(41),(42)より

y ¯ = y ^ ¯ ・・・・・・(43)

の関係が得られる.

全変動 i = 1 n y i y ¯ 2 の計算を以下のように進める.

i = 1 n y i y ¯ 2 = y y ¯ 2

= y y ¯ y y ¯

y ¯ = y ¯ y ¯ y ¯ = y ¯ 1 1 1 = y ¯ x 0 ・・・・・・(44) とおくと

= y y ¯ x 0 y y ¯ x 0

= y ^ + e y ¯ x 0 y ^ + e y ¯ x 0

= y ^ + e y ¯ x 0 y ^ + y ^ + e y ¯ x 0 e y ^ + e y ¯ x 0 y ¯ x 0

= y ^ y ^ + e y ^ y ¯ x 0 y ^ + y ^ e + e e y ¯ x 0 e y ¯ y ^ x 0 y ¯ e y ^ + y ¯ 2 x 0 x 0

(34)から(38)を適用すると

x 0 e= x t 0 e=0

e y ^ =e β 0 x 0 + β 1 x 1 + β 2 x 2 ++ β m x m

=e β 0 x 0 +e β 0 x 1 +e β 0 x 2 ++e β m x m

= β 0 e x 0 + β 1 e x 1 + β 2 e x 2 ++ β m e x m

= β 0 x 0 e + β 1 x 1 e + β 2 x 2 e ++ β m x m e

= β 0 x t 0 e + β 1 x t 1 e + β 2 x t 2 e ++ β m x t m e

=0

同様にして

y ^ e=0

= y ^ y ^ 2 y ¯ x 0 y ^ + y ¯ 2 x 0 x 0 + e e

= y ^ y ¯ x 0 y ^ y ¯ x 0 + e e

(43)(41)を用いると以下のように式変形できる.

= y ^ y ^ ¯ x 0 y ^ y ^ ¯ x 0 + e e ¯ x 0 e e ¯ x 0

y ^ ¯ e ¯ を次のように定義する.

= y ^ y ^ ¯ y ^ y ^ ¯ + e e ¯ e e ¯

= y ^ y ^ ¯ 2 + e e ¯ 2

= i = 1 n y ^ i y ¯ 2 + i = 1 n e i e ¯ 2

以上より,(2)が証明された.

 

ホーム>>カテゴリー分類>>確率>>統計>>線形重回帰分析における「変動の分解」

 最終更新日: 2026年6月17日