応用分野: 検定回帰分析

相関係数の式の導出

変量 xy の相関係数は

r=σxyσxσy

σxy=1ni=1n(xix¯)(yiy¯) xy共分散

σx=1ni=1nxix¯2 x標準偏差

σy=1ni=1nxix¯2 y標準偏差

である.

■相関係数の式の導出

2種類の変量の間の関係を示す相関図において,点がある直線の近くに集まるとき,2種類の変量の間には相関があるという.

2種類の変量xy標準化した

ui=xix¯σxvi=yiy¯σy

の相関の程度を以下のようにして調べることにする.標準化するのは数式の取り扱いを簡単なするためである.2種類の変量ui ,viの相関図の点は,v=au+b で表される直線の近くに集まる傾向があると仮定する.この直線と,実際の変量との差の2乗和Δ2

Δ2=i=1ndi2=i=1n{vi(aui+b)}2

を計算してみる.

Δ2の値が大きいと多くの変量が直線から離れており相関が弱く,Δ2の値が小さいと変量が直線の近くに集まっており相関が強いと判断できる.

Δ2=i=1ndi2=i=1n{vi(aui+b)}2

=i=1n{vi22vi(aui+b)+(aui+b)2}

=i=1n(vi22uivia2vib+ui2a2+2uiab+b2)

=i=1nvi22(i=1nuivi)a2(i=1nvi)b+(i=1nui2)a2+2(i=1nui)ab+(i=1n1)b2

ab の2次関数となっている.この関数をa,bの順に平方完成する.

=n2(i=1nuivi)a0+na2+0+nb2

∵ i=1nui=0i=1nvi=0i=1nui2=1i=1nvi2=1

=n{a1ni=1nuivi}2+nb2+n1n(i=1nuivi)2

=n{a1ni=1nuivi}2+msup +n{1(1ni=1nuivi)2}

Δ2

a=1ni=1nuivib=0

のとき最小となり,最小値 Δmin2

n{1(1ni=1nuivi)2}

となる.

この時,原点を通る直線v=(1ni=1nuivi)u の回りに最も集まっているといえる.

最小値は,1ni=1nuivi の値に依存しており,1ni=1nuivi=±1 のとき,最小値は0 となり,すべての変量が直線v=(1ni=1nuivi)u上に存在することになる.

この1ni=1nuiviの値を相関係数 r と定義している.この相関係数を,xy を使って表すと

r=1ni=1nuivi=1ni=1nxix¯σxyiy¯σy=1ni=1nxix¯yiy¯σxσy=σxyσxσy

ここで,1ni=1nxix¯yiy¯=σxy 共分散と定義している.

となり冒頭の式になる.

●最小値Δmin2 について考えてみる

Δ20 より

n{1(1ni=1nuivi)2}0

n{(1ni=1nuivi)21}0

n{(1ni=1nuivi)1}{(1ni=1nuivi)+1}0

よって

11ni=1nuivi1  1r1

Δmin2の最大値はn で最小値は0 となる.

 

ホーム>>カテゴリー分類>>確率分布>>相関係数

最終更新日: 2024年2月16日

[ページトップ]

金沢工業大学

利用規約

google translate (English version)