■目標
- データの代表値(平均)とばらつき(分散・標準偏差)を正しく求める。
- 母集団と標本の違いを理解する。
- 線形変換・合成分散・CVなど、1級にもつながる思考を身につける。
【問題1】母集団の分散を求める
データ:12, 13, 14, 16, 20 を母集団とみなす。
平均、分散、標準偏差を求めなさい。
解答・解説:
平均 = (12+13+14+16+20) ÷ 5 = 15
分散 = {(12-15)²+(13-15)²+(14-15)²+(16-15)²+(20-15)²} ÷ 5
= (9+4+1+1+25) ÷ 5 = 8
標準偏差 = √8 ≒ 2.83
▶︎平方和の式(Σx²-n×平均²)を使うと手早く計算できます。
【問題2】度数つきデータの平均と分散
値:98, 99, 100, 101, 102
度数:2, 4, 8, 4, 2
このデータを母集団として平均・分散・標準偏差を求めなさい。
解答・解説:
平均 = (98×2+99×4+100×8+101×4+102×2) ÷ 20 = 100
分散 = {2×(98-100)²+4×(99-100)²+8×(100-100)²+4×(101-100)²+2×(102-100)²} ÷ 20
= (8+4+0+4+8) ÷ 20 = 1.2
標準偏差 = √1.2 ≒ 1.10
▶︎分散は「度数×偏差²」の合計を総度数で割る。
【問題3】母分散と標本分散の違い
データ:7, 7, 8, 12, 16
標本として扱うときと母集団として扱うときの分散を比較せよ。
解答・解説:
平均 = 10
平方和 = (7-10)²+(7-10)²+(8-10)²+(12-10)²+(16-10)²
= 9+9+4+4+36 = 62
母集団分散 = 62 ÷ 5 = 12.4
標本分散 = 62 ÷ (5-1) = 15.5
標本分散は「n-1」で割る(不偏分散)。
▶︎これは母分散の過小評価を防ぐための補正。
【問題4】線形変換の効果
平均=50、標準偏差=4 のデータ X を
Y = 1.2×X + 3 に変換したとき、Yの平均と標準偏差を求めよ。
解答・解説:
平均(Y)= 1.2×50+3=63
標準偏差(Y)= 1.2×4=4.8
▶︎「足し算」は平均だけ変える、「掛け算」は平均と分散両方を変える。
【問題5】2群の合成分散(母集団)
工程A:n=30、平均100、標準偏差2.0
工程B:n=20、平均104、標準偏差1.0
全体を母集団とみなして、全体平均と分散を求めなさい。
解答・解説:
全体平均 = (30×100+20×104) ÷ (30+20) = 101.6
全体分散 = {30×(2²+(100-101.6)²)+20×(1²+(104-101.6)²)} ÷ 50
= {30×(4+2.56)+20×(1+5.76)} ÷ 50
= (196.8+135.2) ÷ 50 = 6.64
標準偏差 = √6.64 ≒ 2.58
▶︎平均の差があると全体の分散は大きくなる。
(これは分散分析の基本原理)
【問題6】新しいデータを追加したときの更新計算
データ20個の平均=50.0、分散=4.00
新しいデータ56を加えたときの平均と分散を求めなさい。
解答・解説:
新平均 = (20×50+56) ÷ 21 = 50.29
もとの「平均²+分散」= 50²+4=2504
新しいE[X²]=(20×2504+56²) ÷ 21 = 2534.1
分散 = 2534.1-(50.29)²=5.44
標準偏差 = √5.44=2.33
▶︎Excelで更新計算するときは「Welford法」が便利。
【問題7】標準化得点(Z値)
平均=100、標準偏差=2.5
データ95, 97, 103, 106 の z値を求め、異常値を判断せよ。
解答・解説:
z=(x-平均)÷標準偏差
95 → (95-100)/2.5=-2.0
97 → -1.2
103 → +1.2
106 → +2.4
|z|が2を超えるデータ(95,106)は異常とみなされる。
▶︎管理図や外れ値検出の基本。
【問題8】外れ値の影響
データ①:4, 5, 6, 7, 8
データ②:4, 5, 6, 7, 20
両者の平均・標準偏差を比較せよ。
解答・解説:
①平均=6、標準偏差=1.41
②平均=8.4、標準偏差=5.89
▶︎外れ値(20)によって平均も標準偏差も大きく変化する。
→ 平均と分散は外れ値に弱い(ロバスト性が低い)。
【問題9】階級データの近似
階級と度数:
49.5–49.9 → 5個
49.9–50.1 → 18個
50.1–50.3 → 12個
50.3–50.5 → 5個
(中央値:49.7, 50.0, 50.2, 50.4)
解答・解説:
平均=(49.7×5+50.0×18+50.2×12+50.4×5) ÷ 40=50.07
分散={5×(49.7-50.07)²+18×(50.0-50.07)²+12×(50.2-50.07)²+5×(50.4-50.07)²} ÷ 40=0.038
標準偏差=√0.038=0.20
▶︎度数分布の代表値は「中央値」で近似するのが基本。
【問題10】変動係数(CV)
工程A:平均50mm、標準偏差0.25mm
工程B:平均20mm、標準偏差0.15mm
どちらの相対的ばらつきが大きいか?
解答・解説:
CV=標準偏差 ÷ 平均 ×100
工程A:0.25÷50×100=0.50%
工程B:0.15÷20×100=0.75%
→ 工程Bのほうが相対的にばらつきが大きい。
▶︎単位や平均値が違う工程の比較はCV(変動係数)を使う。
■まとめ
- 平均:Σx ÷ n
- 分散(母集団):Σ(x-平均)² ÷ n
- 標本分散:Σ(x-平均)² ÷ (n-1)
- 標準偏差:√分散
- CV:標準偏差 ÷ 平均 ×100