■目標
- 相関係数 r、決定係数 R²、回帰直線(切片 a・傾き b)を正しく計算・解釈できる
- 予測値・残差の意味を理解し、外れ値・単位変換・非線形など1級につながる視点を持つ
【問題1】r・回帰式(計算の基本)
データ(x, y):
(1,3), (2,4), (3,6), (4,8), (5,9)
(1) 相関係数 r
(2) 回帰直線 y=a+b×x(a=切片、b=傾き)
を求めよ。
解答・解説:
n=5
Σx=15、Σy=30、Σx²=55、Σy²=206、Σxy=106
x̄=Σx/n=3、ȳ=Σy/n=6
傾き b =〔n×Σxy-(Σx)(Σy)〕 ÷ 〔n×Σx²-(Σx)²〕
=(5×106-15×30) ÷ (5×55-225)
=(530-450) ÷ (275-225)
=80 ÷ 50 = 1.6
切片 a = ȳ-b×x̄ = 6-1.6×3 = 1.2
回帰式:y=1.2+1.6x
相関 r =〔n×Σxy-(Σx)(Σy)〕 ÷ √{〔n×Σx²-(Σx)²〕×〔n×Σy²-(Σy)²〕}
分子=80
分母=√(50×129.2)=約80.623
r=0.992(非常に強い正の相関)
【問題2】集計値から r を求める
あるデータで、
n=6、Σx=30、Σy=42、Σx²=170、Σy²=308、Σxy=224。
相関係数 r を求めよ。併せて回帰式も求めよ。
解答・解説:
x̄=5、ȳ=7
b =(6×224-30×42) ÷ (6×170-30²)
=(1344-1260) ÷ (1020-900)
=84 ÷ 120 = 0.7
a = 7-0.7×5 = 3.5
→ 回帰式:y=3.5+0.7x
r =〔6×224-30×42〕 ÷ √{(6×170-900)×(6×308-42²)}
=84 ÷ √(120×120) = 0.837(強い正の相関)
(補足)R²=r²=約0.700 → 「yの分散の約70%をxが説明」
【問題3】予測値と残差
問題2で得た回帰式 y=3.5+0.7x を用いる。
x=8 のとき、
(1) 予測値(ŷ)を求めよ
(2) 実測 y=9.5 だった場合の残差 e=y-ŷを求めよ
解答・解説:
(1) ŷ=3.5+0.7×8=9.1
(2) e=9.5-9.1=0.4(予測より+0.4高い)
▶︎残差は「モデルがどれだけ外したか」。残差の系統的な偏りは**モデル不適合(非線形・変動不均一など)**のサイン。
【問題4】決定係数 R² の解釈
問題1の r=0.992 に対して、決定係数 R² を求め、意味を説明せよ。
解答・解説:
R²=r²=(0.992)²=0.985(約98.5%)
→ y の変動の約98.5%が x の直線関係で説明できる、という意味。
(※ 高いR²でも外れ値や外挿には注意)
【問題5】負の相関の計算と解釈
データ(x, y):
(1,9), (2,7), (3,6), (4,4), (5,3)
相関係数 r を求め、関係を説明せよ。
1. 平均を求める
x̄=3 / ȳ=5.8
2. 偏差と積を表にまとめる
xi | yi | xi−x̄ | yi−ȳ | (xi−x̄)(yi−ȳ) | (xi−x̄)² | (yi−ȳ)² |
---|---|---|---|---|---|---|
1 | 9 | −2 | 3.2 | −6.4 | 4 | 10.24 |
2 | 7 | −1 | 1.2 | −1.2 | 1 | 1.44 |
3 | 6 | 0 | 0.2 | 0 | 0 | 0.04 |
4 | 4 | 1 | −1.8 | −1.8 | 1 | 3.24 |
5 | 3 | 2 | −2.8 | −5.6 | 4 | 7.84 |
合計 | Σ(x−x̄)(y−ȳ)=−15.0 | Σ(x−x̄)²=10 | Σ(y−ȳ)²=22.8 |
3. 相関係数を求める
r=Σ(x−x̄)(y−ȳ) ÷ √{ Σ(x−x̄)² × Σ(y−ȳ)² }
=−15 ÷ √(10 × 22.8)
=−15 ÷ √228 ≒ −15 ÷ 15.1 ≒ −0.99