関連するページを見るにはこの知識グラフを利用してください.
応用分野: 相関係数相関係数の式とその意味

共分散(covariance)

共分散とは,2つの変量が平均からのずれ(偏差)に注目したとき,2つの変量が同じ向きに変化するか,反対向きに変化するかを表す量である.変量 X と変量 Y の対なっている n 個のデータ x 1 , y 1 x 2 , y 2 x n , y n x y 平均値 x ¯ x y 平均値 x ¯ とすると共分散 s x y

s x y = 1 n x 1 x ¯ y 1 y ¯ + x 1 x ¯ y 1 y ¯ + + x n x ¯ y n y ¯

によって求められる.

備考:高校では,共分散についても,今あるデータから求めた値であることを表し,母集団全体の量と区別しやすくするために, σ ではなく s を用いることがある.

■解説

解説で使用するデータを下の表に示す.図はデータの散布図(各データに対応する点を描き,点の左下にデータの番号が表示されている)に. M x ¯ , y ¯ = 5 , 4.5 の点を追加し,この点から x 軸, y 軸に平行な直線を点線で描いている.さらに,各点から x ¯ , y ¯ の点から伸びている直線に垂線を下し,直線との交点の右下には交点名が表示されている.

  • データ
    番号
    X Y
    1 1.0 3.7
    2 2.0 1.2
    3 4.0 4.7
    4 6.0 4.4
    5 8.0 7.3
    6 9.0 5.7

以下に表を使った共分散の計算を示す.

データ
番号
X Y x i x ¯ y i y ¯ x i x ¯ y i y ¯
1 1.0 3.5 -4.0 -1.0 4.0
2 2.0 1.5 -3.0 -3.0 9.0
3 4.0 5.1 -1.0 0.6 -0.6
4 6.0 3.9 1.0 -0.6 -0.6
5 8.0 6.3 3.0 1.8 5.4
6 9.0 6.7 4.0 2.2 8.8
平均 5.0 4.5 - - 4.33・・・

x i x ¯ y i y ¯ の絶対値は,点 i ,点 x i ,点 M ,点 y i を結んだ長方形の面積になり,データが図の赤色の領域にあれば正の値,青色の領域にあれば負の値になる.この場合,共分散は約4.33 となった.

共分散の値が

正のとき,データは赤い領域に多く存在することになり,2つの変量が同じ向きに変化する.

負のとき,データは青い領域に多く存在することになり,2つの変量が反対向きに変化する.

傾向がある.

■インターラクティブグラフ

10個のデータ点をドラッグして動かしてください.データの値の変化に応じて変量 X 分散 s x 2 ,変量 Y 分散 s y 2 共分散 s xy 相関係数 r が変化する.

 

ホーム>>カテゴリー別分類>>データ分析>>平均値

最終更新日:2026年3月14日

[ページトップ]

金沢工業大学

利用規約

google translate (English version)