QC検定 計算問題

📈 第4問(レベルアップ):相関係数・回帰分析(10問)

■目標

  • 相関係数 r、決定係数 R²、回帰直線(切片 a・傾き b)を正しく計算・解釈できる
  • 予測値・残差の意味を理解し、外れ値・単位変換・非線形など1級につながる視点を持つ

【問題1】r・回帰式(計算の基本)

データ(x, y):
(1,3), (2,4), (3,6), (4,8), (5,9)

(1) 相関係数 r
(2) 回帰直線 y=a+b×x(a=切片、b=傾き)
を求めよ。

解答・解説:
n=5
Σx=15、Σy=30、Σx²=55、Σy²=206、Σxy=106
x̄=Σx/n=3、ȳ=Σy/n=6

傾き b =〔n×Σxy-(Σx)(Σy)〕 ÷ 〔n×Σx²-(Σx)²〕
=(5×106-15×30) ÷ (5×55-225)
=(530-450) ÷ (275-225)
=80 ÷ 50 = 1.6

切片 a = ȳ-b×x̄ = 6-1.6×3 = 1.2

回帰式:y=1.2+1.6x

相関 r =〔n×Σxy-(Σx)(Σy)〕 ÷ √{〔n×Σx²-(Σx)²〕×〔n×Σy²-(Σy)²〕}
分子=80
分母=√(50×129.2)=約80.623
r=0.992(非常に強い正の相関)


【問題2】集計値から r を求める

あるデータで、
n=6、Σx=30、Σy=42、Σx²=170、Σy²=308、Σxy=224。
相関係数 r を求めよ。併せて回帰式も求めよ。

解答・解説:
x̄=5、ȳ=7

b =(6×224-30×42) ÷ (6×170-30²)
=(1344-1260) ÷ (1020-900)
=84 ÷ 120 = 0.7
a = 7-0.7×5 = 3.5
→ 回帰式:y=3.5+0.7x

r =〔6×224-30×42〕 ÷ √{(6×170-900)×(6×308-42²)}
=84 ÷ √(120×120) = 0.837(強い正の相関)

(補足)R²=r²=約0.700 → 「yの分散の約70%をxが説明」


【問題3】予測値と残差

問題2で得た回帰式 y=3.5+0.7x を用いる。
x=8 のとき、
(1) 予測値(ŷ)を求めよ
(2) 実測 y=9.5 だった場合の残差 e=y-ŷを求めよ

解答・解説:
(1) ŷ=3.5+0.7×8=9.1
(2) e=9.5-9.1=0.4(予測より+0.4高い)

▶︎残差は「モデルがどれだけ外したか」。残差の系統的な偏りは**モデル不適合(非線形・変動不均一など)**のサイン。


【問題4】決定係数 R² の解釈

問題1の r=0.992 に対して、決定係数 R² を求め、意味を説明せよ。

解答・解説:
R²=r²=(0.992)²=0.985(約98.5%)
→ y の変動の約98.5%が x の直線関係で説明できる、という意味。
(※ 高いR²でも外れ値外挿には注意)


【問題5】負の相関の計算と解釈

データ(x, y):
(1,9), (2,7), (3,6), (4,4), (5,3)
相関係数 r を求め、関係を説明せよ。

1. 平均を求める

x̄=3 / ȳ=5.8

2. 偏差と積を表にまとめる

xi yi xi−x̄ yi−ȳ (xi−x̄)(yi−ȳ) (xi−x̄)² (yi−ȳ)²
1 9 −2 3.2 −6.4 4 10.24
2 7 −1 1.2 −1.2 1 1.44
3 6 0 0.2 0 0 0.04
4 4 1 −1.8 −1.8 1 3.24
5 3 2 −2.8 −5.6 4 7.84
合計 Σ(x−x̄)(y−ȳ)=−15.0 Σ(x−x̄)²=10 Σ(y−ȳ)²=22.8

3. 相関係数を求める

r=Σ(x−x̄)(y−ȳ) ÷ √{ Σ(x−x̄)² × Σ(y−ȳ)² }
=−15 ÷ √(10 × 22.8)
=−15 ÷ √228 ≒ −15 ÷ 15.1 ≒ −0.99

解答・解説:
計算より r=-0.993(ほぼ完全な負の相関)
→ xが増えるとyが減る強い直線関係。回帰直線の傾き b はになる。


【問題6】単位変換の影響(1級につながる重要点)

問題1の回帰式:y=1.2+1.6x(x:mm)。
x を cm 表記に変える(x_cm=x÷10)。
新しい式 y=a'+b'×x_cm の a' と b'、および r の変化を述べよ。

解答・解説:
y=1.2+1.6×(10×x_cm)=1.2+(16.0)×x_cm
a'=1.2、b'=16.0、rは不変(0.992のまま)
結論:単位を変えると傾きはスケールに応じて変わるが、相関 r は変わらない(位置とスケールに不変)。


【問題7】外れ値の影響

基準データ: (1,3), (2,5), (3,7), (4,9), (5,11) → ほぼ完全な直線、r=1.000
ここに外れ値 (6,30) を1点追加した。新しい相関 r はどうなるか。
また、この事実から何を学ぶべきか。

解答・解説:
追加後の r ≒ 0.845 に低下。
結論外れ値は相関・回帰に強く影響する。
→ 実務では、残差・プロット・箱ひげ図などで外れ値の確認が必須。
(安易に削除せず、工程上の原因(測定ミス・段取り替え・異物混入 等)を調査)


【問題8】r=0でも関係がないとは限らない(非線形)

データ:x=-2,-1,0,1,2、y=x²。
相関 r を述べ、関係性を説明せよ。

相関係数 r の求め方

  1. 平均を求める
    x̄=(−2−1+0+1+2)/5=0
    ȳ=(4+1+0+1+4)/5=2
  2. 偏差と積を表にまとめる
xi yi xi−x̄ yi−ȳ (xi−x̄)(yi−ȳ)
−2 4 −2 2 −4
−1 1 −1 −1 1
0 0 0 −2 0
1 1 1 −1 −1
2 4 2 2 4
合計 Σ(x−x̄)²=10 Σ(y−ȳ)²=14 Σ(x−x̄)(y−ȳ)=0
  1. 相関係数を求める
    r=Σ(x−x̄)(y−ȳ) ÷ √{ Σ(x−x̄)²・Σ(y−ȳ)² }
    =0 ÷ √(10×14)=0.000

解答・解説:
計算より r=0.000
ただし「関係がない」のではなく、非線形(放物線)のため線形相関が0になっているだけ。
→ 散布図や変換(例:対数・平方根)で形を確認する。


【問題9】標準化回帰(β係数)

問題2のデータ(r=0.837)。
x と y を「平均0・標準偏差1」に標準化して回帰した場合、
回帰直線 y*=A+B×x* の係数 A, B を述べよ。

解答・解説:
標準化すると、切片 A=0、傾き B=r(=0.837)になる。
※ 標準化回帰の傾き(β係数)は相関 r に等しい。
→ スケールの違う変数同士の影響度比較に有用(1級でも頻出)。


【問題10】残差からモデル不適合を見抜く

回帰式 y=3.5+0.7x に対し、次の観測が得られた:
(2,4.2), (4,6.8), (6,8.6), (8,9.8)

(1) 各点の残差 e=y-(3.5+0.7x) を求めよ
(2) 残差の並びから考えられる改善案を述べよ

解答・解説:
予測 ŷ:x=2→4.9、4→6.3、6→7.7、8→9.1
残差 e:-0.7、+0.5、+0.9、+0.7(右に行くほど残差が増える傾向

考察:

  • 傾きが不足/軽い上に凸(非線形)の可能性
  • 改善案:二次項を入れる(y=a+b×x+c×x²)、または対数・平方根など変数変換を検討
  • 測定レンジが広がると分散が増える可能性(分散不均一)にも注意

■この章のまとめ(サイト掲載用)

項目計算・定義ポイント
相関係数 r集計で OK:n, Σx, Σy, Σx², Σy², Σxy から計算-1~+1。単位や原点移動に不変
回帰直線傾き b=〔nΣxy-ΣxΣy〕÷〔nΣx²-(Σx)²〕|切片 a=ȳ-b×x̄予測値 ŷ=a+b×x
決定係数 R²yの分散のうち、xで説明できる割合
残差 ee=y-ŷ系統性があればモデル見直し
外れ値r・b を大きく歪める原因調査が最優先(安易に削除しない)
標準化回帰y*=B×x*(A=0, B=r)影響度比較に有効

💡1級につながる視点

  • 推定の不確かさ:bの標準誤差、t検定、信頼区間
  • 前提チェック:線形性・独立・等分散・正規性(残差解析)
  • 多変量:重回帰・多重共線性・部分相関
  • 変換:対数、Box–Cox、ロバスト回帰(外れ値耐性)

-QC検定, 計算問題
-