Processing math: 100%
関連するページを見るにはこのグラフ図を利用してください.

相関係数の式の導出

変量 xy の相関係数は

r=σxyσxσy

σxy=1nni=1(xiˉx)(yiˉy) xy共分散

σx=1nni=1(xiˉx)2 x標準偏差

σy=1nni=1(xiˉx)2 y標準偏差

である.

■相関係数の式の導出

2種類の変量の間の関係を示す相関図において,点がある直線の近くに集まるとき,2種類の変量の間には相関があるという.

2種類の変量 xy標準化した

ui=xiˉxσxvi=yiˉyσy

の相関の程度を以下のようにして調べることにする.標準化するのは数式の取り扱いを簡単なするためである.2種類の変量 ui , vi の相関図の点は, v=au+b で表される直線の近くに集まる傾向があると仮定する.この直線と,実際の変量との差の2乗和 Δ2

Δ2=ni=1d2i=ni=1{vi(aui+b)}2

を計算してみる.(参考:最小ニ乗法)

Δ2 の値が大きいと多くの変量が直線から離れており相関が弱く, Δ2 の値が小さいと変量が直線の近くに集まっており相関が強いと判断できる.

Δ2=ni=1d2i=ni=1{vi(aui+b)}2

=ni=1{v2i2vi(aui+b)+(aui+b)2}

=ni=1(v2i2uivia2vib+u2ia2+2uiab+b2)

=ni=1v2i2(ni=1uivi)a2(ni=1vi)b +(ni=1u2i)a2 +2(ni=1ui)ab +(ni=11)b2

=n2(ni=1uivi)a0+na2+0+nb2

∵  ni=1ui=0ni=1vi=0ni=1u2i=1ni=1v2i=1

=na22(ni=1uivi)a+nb2+n

ab の2次関数となっている.この関数を a , b の順に平方完成する.

=n{a1nni=1uivi}2+nb2+n1n(ni=1uivi)2

=n{a1nni=1uivi}2+nb2 +n{1(1nni=1uivi)2}

Δ2

a=1nni=1uivib=0

のとき最小となり,最小値 Δ2min

n{1(1nni=1uivi)2}

となる.

この時,原点を通る直線 v=(1nni=1uivi)u の回りに最も集まっているといえる.

最小値は, 1nni=1uivi の値に依存しており, 1nni=1uivi=±1 のとき,最小値は 0 となり,すべての変量が直線 v=(1nni=1uivi)u 上に存在することになる.

この 1nni=1uivi の値を相関係数 r と定義している.この相関係数を, xy を使って表すと

r=1nni=1uivi =1nni=1xiˉxσxyiˉyσy =1nni=1(xiˉx)(yiˉy)σxσy =σxyσxσy

ここで, 1nni=1(xiˉx)(yiˉy)=σxy 共分散と定義している.

となり冒頭の式になる.

●最小値 Δ2min について考えてみる

Δ20 より

n{1(1nni=1uivi)2}0

n{(1nni=1uivi)21}0

n{(1nni=1uivi)1}{(1nni=1uivi)+1}0

よって

11nni=1uivi1   1r1

Δ2min の最大値は n で最小値は 0 となる.

 

ホーム>>カテゴリー分類>>確率統計>>相関係数

最終更新日: 2025年2月5日

[ページトップ]

金沢工業大学

利用規約

google translate (English version)