関連するページを見るにはこの知識グラフを利用してください.
応用分野: 散布図相関係数の式とその意味

相関係数

相関係数とは,2種類のデータが存在したときに,それらのデータの相互間における関連度の強さを示すための値のことを指す.

以下では,相関の種類と強さについて紹介しているとともに,実例を通して相関係数について求めていき,相関の考察をしていく.

相関関係

正の相関 :一方の値が増加傾向にあるとき、もう一方も増加傾向にある関係性

負の相関 :一方の値が増加傾向にあるとき、もう一方の値が減少傾向にある関係性

相関が無い(無相関) :2変量の間に増減の様子が見られない関係性

相関の強さ

散布図におけるデータより、2変量の相関係数 r を算出し、その係数の値の大きさによって相関の強さが変わってくる。※あくまで、強さは一般的な考え方である。

相関係数の算出方法:

r = s x y s x s y    ここを参照

r :相関係数, s x y :共分散 s x : x 標準偏差 s y : y 標準偏差

0.7 | r | 1 かなり強い相関がある

0.4 | r | 0.7 やや相関がある

0.2 | r | 0.4 弱い相関がある

0 | r | 0.2 ほとんど相関無し

例題を用いた解説

データをもとに、実際に相関係数について求めていき、またその相関の強さについて考察してみよう!

@正の相関

以下の表は、生徒の週の学習時間と5科目のテストの成績(点数)である。

A B C D E F G
学習時間(h) 23 17 21 15 18 10 24
成績(点) 455 370 410 350 390 300 470

相関係数 r = 0.98

算出方法に関してはここをクリック!

相関係数の算出:
まず,生徒ごとの週の学習時間と5科目のテストの成績のそれぞれの平均値を算出します.
週の学習時間:

( 23 + 17 + 21 + 15 + 18 + 10 + 24 ) / 7 = 18.28

5科目の成績:

( 455+370+410+350+390+300+470 ) / 7 = 392.14

※ここでは計算しやすくするために,正の整数に四捨五入した値で計算を行います.
次に,求められた平均値をもとに,学習時間と成績の偏差を算出します.以下の表が各値の偏差になります

A B C D E F G
学習時間における偏差 5 -1 3 -3 0 -8 6
成績における偏差 63 -22 18 -42 -2 -92 78
学習時間と成績の偏差の積 315 22 54 126 0 736 468

※偏差の算出方法:各値ー平均値=偏差
そしたら,求められた偏差の値をもとに学習時間と成績のそれぞれの分散と2つのデータの共分散を求めていきます
学習時間の分散( s x 2 ):

{ ( 5 ) 2 + ( 1 ) 2 + ( 3 ) 2 + ( 3 ) 2 + ( 0 ) 2 + ( 8 ) 2 + ( 6 ) 2 } / 7 = 20.57

成績の分散( s y 2 ):

{ ( 63 ) 2 + ( 22 ) 2 + ( 18 ) 2 + ( 42 ) 2 + ( 2 ) 2 + ( 92 ) 2 + ( 78 ) 2 } / 7 = 3013.29

学習時間と成績の共分散( s x y ):

( 315 + 22 + 54 + 126 + 0 + 736 + 468 ) / 7 = 245.86

分散まで求められたら,その値をもとに学習時間と成績の標準偏差を求めていきます.
※標準偏差は分散の値の平方根で求められます
学習時間の標準偏差( s x ):

s x 2 = 21 = 4.58

成績の標準偏差( s y ):

s y 2 = 3013 = 54.89

※標準偏差の算出に当たって,計算をしやすくするため,分散の値を四捨五入して正の整数で計算しています
そしたら,最後に共分散の値と標準偏差の値を用いて相関係数を求めていきます.
相関係数( r ):

s x y s x s y = 245.86 ( 4.58 ) × ( 54.89 ) = 0.98

以上の結果から,生徒の週の学習時間と5科目の成績の間にはかなり強い正の相関関係がある( r = 0.98 )ことが考察できる.

A負の相関

以下の表は、各観測地点ごとの気温と暖房のコスト(1人あたり)である。

A B C D E F G
気温(℃) 1 10 7 14 4 17 20
暖房コスト(円) 10000 7100 7800 6700 9200 6300 6000

相関係数 r = -0.95

算出方法に関してはここをクリック!

相関係数の算出:
まず,各観測地における気温と暖房コスト(1人あたり)のそれぞれの平均値を算出します.
気温:

( 1 + 10 + 7 + 14 + 4 + 17 + 20 ) / 7 = 10.43

暖房コスト:

( 10000 + 7100 + 7800 + 6700 + 9200 + 6300 + 6000 ) / 7 = 7585.71

※ここでは計算しやすくするために,正の整数に四捨五入した値で計算を行います.
次に,求められた平均値をもとに,気温と暖房コストの偏差を算出します.以下の表が各値の偏差になります

A B C D E F G
気温における偏差 -9 0 -3 4 -6 7 10
暖房コストにおける偏差 2414 -486 214 -886 1614 -1286 -1586
気温と暖房コストの偏差の積 -21726 0 -642 -3544 -9684 -9002 -15860

※偏差の算出方法:各値ー平均値=偏差
そしたら,求められた偏差の値をもとに気温と暖房コストのそれぞれの分散と2つのデータの共分散を求めていきます
気温の分散( s x 2 ):

{ ( 9 ) 2 + ( 0 ) 2 + ( 3 ) 2 + ( 4 ) 2 + ( 6 ) 2 + ( 7 ) 2 + ( 10 ) 2 } / 7 = 41.57

暖房コストの分散( s y 2 ):

{ ( 2414 ) 2 + ( 486 ) 2 + ( 214 ) 2 + ( 886 ) 2 + ( 1614 ) 2 + ( 1286 ) 2 + ( 1586 ) 2 } / 7 = 1 , 952 , 653.14

気温と暖房コストの共分散( s x y ):

{ ( 21726 ) + 0 + ( 642 ) + ( 3544 ) + ( 9684 ) + ( 9002 ) + ( 15860 ) } / 7 = 8636.86

分散まで求められたら,その値をもとに気温と暖房コストの標準偏差を求めていきます.
※標準偏差は分散の値の平方根で求められます
気温の標準偏差( s x ):

s x 2 = 42 = 6.48

暖房コストの標準偏差( s y ):

s y 2 = 1952653 = 1397.37

※標準偏差の算出に当たって,計算をしやすくするため,分散の値を四捨五入して正の整数で計算しています
そしたら,最後に共分散の値と標準偏差の値を用いて相関係数を求めていきます.
相関係数( r ):

s x y s x s y = ( 8636.86 ) ( 6.48 ) × ( 1397.37 ) = 0.95

以上の結果から,各観測地における気温と暖房コスト(1人あたり)の間にはかなり強い負の相関関係がある( r = 0.95 )ことが考察できる.

B無相関

以下の表は、生徒の身長(cm)と5科目のテストの成績(点数)である。

A B C D E F G
身長(cm) 160 150 179 165 170 157 173
成績(点) 455 300 410 340 330 360 270

相関係数 r = 0.06

算出方法に関してはここをクリック!

相関係数の算出:
まず,生徒ごとの身長と5科目のテストの成績のそれぞれの平均値を算出します.
生徒の身長:

( 160 + 150 + 179 + 165 + 170 + 157 + 173 ) / 7 = 164.86

5科目の成績:

( 455 + 300 + 410 + 340 + 330 + 360 + 270 ) / 7 = 352.14

※ここでは計算しやすくするために,正の整数に四捨五入した値で計算を行います.
次に,求められた平均値をもとに,学習時間と成績の偏差を算出します.以下の表が各値の偏差になります

A B C D E F G
生徒の身長における偏差 -5 -15 14 0 5 -8 8
成績における偏差 103 -52 58 -12 -22 8 -82
生徒の身長と成績の偏差の積 -515 780 812 0 -110 -64 -656

※偏差の算出方法:各値ー平均値=偏差
そしたら,求められた偏差の値をもとに生徒の身長と成績のそれぞれの分散と2つのデータの共分散を求めていきます
生徒の身長の分散( s x 2 ):

{ ( 5 ) 2 + ( 15 ) 2 + ( 14 ) 2 + ( 0 ) 2 + ( 5 ) 2 + ( 8 ) 2 + ( 8 ) 2 } / 7 = 85.57

成績の分散( s y 2 ):

{ ( 103 ) 2 + ( 52 ) 2 + ( 58 ) 2 + ( 12 ) 2 + ( 22 ) 2 + ( 8 ) 2 + ( 82 ) 2 } / 7 = 3441.86

生徒の身長と成績の共分散( s x y ):

{ ( 515 ) + ( 780 ) + ( 812 ) + 0 + ( 110 ) + ( 64 ) + ( 656 ) } / 7 = 35.29

分散まで求められたら,その値をもとに生徒の身長と成績の標準偏差を求めていきます.
※標準偏差は分散の値の平方根で求められます
生徒の身長の標準偏差( s x ):

s x 2 = 86 = 9.27

成績の標準偏差( s y ):

s y 2 = 3442 = 58.67

※標準偏差の算出に当たって,計算をしやすくするため,分散の値を四捨五入して正の整数で計算しています
そしたら,最後に共分散の値と標準偏差の値を用いて相関係数を求めていきます.
相関係数( r ):

s x y s x s y = 35.29 ( 9.27 ) × ( 58.67 ) = 0.06

以上の結果から,生徒の身長と5科目の成績の間にはほとんど相関がなかった( r = 0.06 )ことが考察できる.

 

ホーム>>カテゴリー分類>>データ分析>>相関係数

最終更新日:2026年3月13日

[ページトップ]

金沢工業大学

利用規約

google translate (English version)