みんなの教科書GitHub

数学B 統計的な推測

答えと解説

答えが合っていても、解説を読んで「なぜそう解くのか」まで確認すると力がつきます。 解説を読んでもわからないときは、AIに質問してみましょう。

1基本

確率変数 XX の確率分布が次で与えられている。
P(X=1)=16P(X=1) = \dfrac{1}{6}P(X=2)=13P(X=2) = \dfrac{1}{3}P(X=3)=12P(X=3) = \dfrac{1}{2}
E(X)E(X)V(X)V(X)σ(X)\sigma(X) を求めよ。

答え

E(X)=73E(X) = \dfrac{7}{3}V(X)=59V(X) = \dfrac{5}{9}σ(X)=53\sigma(X) = \dfrac{\sqrt{5}}{3}

解説

まず確率の合計が 16+13+12=1+2+36=1\dfrac{1}{6} + \dfrac{1}{3} + \dfrac{1}{2} = \dfrac{1+2+3}{6} = 1 となっていることを確認します。

期待値は「値 ×\times 確率」の合計です。

E(X)=116+213+312=16+46+96=146=73E(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{3} + 3 \cdot \frac{1}{2} = \frac{1}{6} + \frac{4}{6} + \frac{9}{6} = \frac{14}{6} = \frac{7}{3}

分散は V(X)=E(X2)(E(X))2V(X) = E(X^2) - \left(E(X)\right)^2 で求めます。まず

E(X2)=1216+2213+3212=16+86+276=366=6E(X^2) = 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{3} + 3^2 \cdot \frac{1}{2} = \frac{1}{6} + \frac{8}{6} + \frac{27}{6} = \frac{36}{6} = 6

よって

V(X)=6(73)2=549499=59V(X) = 6 - \left(\frac{7}{3}\right)^2 = \frac{54}{9} - \frac{49}{9} = \frac{5}{9}

標準偏差は分散の正の平方根なので

σ(X)=59=53\sigma(X) = \sqrt{\frac{5}{9}} = \frac{\sqrt{5}}{3}

分散の計算は E(X2)E(X^2) を先に求める方法が速くて確実です。確率の合計が 11 になるかの確認を習慣にしましょう。

ChatGPTで質問Claudeで質問Geminiで質問
2基本

確率変数 XX について E(X)=5E(X) = 5V(X)=4V(X) = 4 であるとき、Y=3X2Y = 3X - 2 の期待値 E(Y)E(Y)、分散 V(Y)V(Y)、標準偏差 σ(Y)\sigma(Y) を求めよ。

答え

E(Y)=13E(Y) = 13V(Y)=36V(Y) = 36σ(Y)=6\sigma(Y) = 6

解説

aX+baX+b の公式 E(aX+b)=aE(X)+bE(aX+b) = aE(X)+bV(aX+b)=a2V(X)V(aX+b) = a^2 V(X)σ(aX+b)=aσ(X)\sigma(aX+b) = |a|\,\sigma(X) を使います。a=3a = 3b=2b = -2 です。

E(Y)=3E(X)2=352=13E(Y) = 3E(X) - 2 = 3 \cdot 5 - 2 = 13

分散は定数 2-2 の影響を受けず、a2=9a^2 = 9 倍になります。

V(Y)=32V(X)=94=36V(Y) = 3^2 V(X) = 9 \cdot 4 = 36

標準偏差は σ(X)=4=2\sigma(X) = \sqrt{4} = 2 なので

σ(Y)=3σ(X)=32=6\sigma(Y) = |3| \cdot \sigma(X) = 3 \cdot 2 = 6

(σ(Y)=V(Y)=36=6\sigma(Y) = \sqrt{V(Y)} = \sqrt{36} = 6 と一致することも確認できます。)

「期待値には +b+b がつくが、分散・標準偏差には bb が影響しない」「分散は a2a^2 倍、標準偏差は a|a| 倍」という違いを混同しないようにしましょう。

ChatGPTで質問Claudeで質問Geminiで質問
3基本

1個のさいころを 180180 回投げるとき、11 の目が出る回数を XX とする。XX の期待値 E(X)E(X)、分散 V(X)V(X)、標準偏差 σ(X)\sigma(X) を求めよ。

答え

E(X)=30E(X) = 30V(X)=25V(X) = 25σ(X)=5\sigma(X) = 5

解説

各回の試行は独立で、11 の目が出る確率は毎回 16\dfrac{1}{6} なので、XX は二項分布 B(180, 16)B\left(180,\ \dfrac{1}{6}\right) に従います。

二項分布の公式 E(X)=npE(X) = npV(X)=npqV(X) = npq(q=1pq = 1-p)を使います。n=180n = 180p=16p = \dfrac{1}{6}q=56q = \dfrac{5}{6} なので

E(X)=18016=30E(X) = 180 \cdot \frac{1}{6} = 30
V(X)=1801656=3056=25V(X) = 180 \cdot \frac{1}{6} \cdot \frac{5}{6} = 30 \cdot \frac{5}{6} = 25
σ(X)=25=5\sigma(X) = \sqrt{25} = 5

180180 回中、平均 3030 回」は直感どおりの結果です。分散の計算では q=1pq = 1-p を掛け忘れるミスが多いので注意しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
4基本

確率変数 XX が正規分布 N(50, 102)N(50,\ 10^2) に従うとき、P(X60)P(X \ge 60) を求めよ。ただし P(0Z1)=0.3413P(0 \le Z \le 1) = 0.3413 とする。

答え

0.15870.1587

解説

正規分布の確率は、標準化 Z=XmσZ = \dfrac{X - m}{\sigma} で標準正規分布 N(0, 1)N(0,\ 1) に直してから正規分布表の値を使います。

m=50m = 50σ=10\sigma = 10 なので、X=60X = 60 のとき

Z=605010=1Z = \frac{60 - 50}{10} = 1

よって

P(X60)=P(Z1)P(X \ge 60) = P(Z \ge 1)

標準正規分布は 00 について左右対称で、P(Z0)=0.5P(Z \ge 0) = 0.5 です。したがって

P(Z1)=P(Z0)P(0Z1)=0.50.3413=0.1587P(Z \ge 1) = P(Z \ge 0) - P(0 \le Z \le 1) = 0.5 - 0.3413 = 0.1587

正規分布表が与えるのは P(0Zz)P(0 \le Z \le z) の形の確率です。求めたい範囲を図にかいて、0.50.5 との足し引きで組み立てるのが確実です。

ChatGPTで質問Claudeで質問Geminiで質問
5基本

母標準偏差 1616 の母集団から大きさ 6464 の標本を無作為に抽出したところ、標本平均は 120120 であった。母平均 mm に対する信頼度 95%95\% の信頼区間を求めよ。ただし P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 とする。

答え

116.08m123.92116.08 \le m \le 123.92

解説

母平均の 95%95\% 信頼区間の公式

X1.96σnmX+1.96σn\overline{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}} \le m \le \overline{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}

を使います。X=120\overline{X} = 120σ=16\sigma = 16n=64n = 64 です。

まず標本平均の標準偏差を計算します。

σn=1664=168=2\frac{\sigma}{\sqrt{n}} = \frac{16}{\sqrt{64}} = \frac{16}{8} = 2

区間の幅を決める量は

1.962=3.921.96 \cdot 2 = 3.92

よって信頼区間は

1203.92m120+3.92120 - 3.92 \le m \le 120 + 3.92

すなわち 116.08m123.92116.08 \le m \le 123.92 です。

n\sqrt{n} で割るのを忘れて σ\sigma をそのまま使うのが典型的なミスです。「標本平均の散らばりは σn\dfrac{\sigma}{\sqrt{n}}」を必ず思い出しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
6標準

確率変数 XX001122 の値をとり、P(X=0)=aP(X=0) = aP(X=1)=bP(X=1) = bP(X=2)=14P(X=2) = \dfrac{1}{4} である。E(X)=34E(X) = \dfrac{3}{4} のとき、aabb の値と V(X)V(X) を求めよ。

答え

a=12a = \dfrac{1}{2}b=14b = \dfrac{1}{4}V(X)=1116V(X) = \dfrac{11}{16}

解説

確率の合計が 11 であることと、期待値の条件から連立方程式を作ります。

確率の合計より

a+b+14=1a+b=34a + b + \frac{1}{4} = 1 \quad \Longrightarrow \quad a + b = \frac{3}{4}

期待値の定義より

E(X)=0a+1b+214=b+12=34E(X) = 0 \cdot a + 1 \cdot b + 2 \cdot \frac{1}{4} = b + \frac{1}{2} = \frac{3}{4}

これを解くと b=14b = \dfrac{1}{4}。よって a=3414=12a = \dfrac{3}{4} - \dfrac{1}{4} = \dfrac{1}{2}

次に分散を V(X)=E(X2)(E(X))2V(X) = E(X^2) - \left(E(X)\right)^2 で求めます。

E(X2)=0212+1214+2214=14+1=54E(X^2) = 0^2 \cdot \frac{1}{2} + 1^2 \cdot \frac{1}{4} + 2^2 \cdot \frac{1}{4} = \frac{1}{4} + 1 = \frac{5}{4}
V(X)=54(34)2=2016916=1116V(X) = \frac{5}{4} - \left(\frac{3}{4}\right)^2 = \frac{20}{16} - \frac{9}{16} = \frac{11}{16}

未知の確率を含む問題では、「確率の合計 =1=1」が必ず1本目の方程式になります。求めた aabb00 以上 11 以下になっているかも確認しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
7標準

1個のさいころを 44 回投げるとき、33 の倍数の目が出る回数を XX とする。
(1) P(X1)P(X \ge 1) を求めよ。
(2) E(X)E(X)V(X)V(X) を求めよ。

答え

(1) 6581\dfrac{65}{81}
(2) E(X)=43E(X) = \dfrac{4}{3}V(X)=89V(X) = \dfrac{8}{9}

解説

33 の倍数の目は 336622 つなので、11 回の試行で出る確率は p=26=13p = \dfrac{2}{6} = \dfrac{1}{3} です。よって XX は二項分布 B(4, 13)B\left(4,\ \dfrac{1}{3}\right) に従います。

(1) 「少なくとも 11 回」は余事象で計算します。

P(X1)=1P(X=0)P(X \ge 1) = 1 - P(X = 0)

X=0X = 0 となるのは 44 回とも 33 の倍数以外(確率 23\dfrac{2}{3})が出るときなので

P(X=0)=(23)4=1681P(X = 0) = \left(\frac{2}{3}\right)^4 = \frac{16}{81}

よって

P(X1)=11681=6581P(X \ge 1) = 1 - \frac{16}{81} = \frac{65}{81}

(2) 二項分布の公式 E(X)=npE(X) = npV(X)=npqV(X) = npq より

E(X)=413=43,V(X)=41323=89E(X) = 4 \cdot \frac{1}{3} = \frac{4}{3}, \quad V(X) = 4 \cdot \frac{1}{3} \cdot \frac{2}{3} = \frac{8}{9}

「少なくとも 11 回」を見たら余事象、が定石です。P(X=1)+P(X=2)+P(X=1) + P(X=2) + \cdots と直接計算するのに比べて圧倒的に速くなります。

ChatGPTで質問Claudeで質問Geminiで質問
8標準

ある集団の身長 XX(cm)は正規分布 N(170, 62)N(170,\ 6^2) に従うとする。P(164X182)P(164 \le X \le 182) を求めよ。ただし P(0Z1)=0.3413P(0 \le Z \le 1) = 0.3413P(0Z2)=0.4772P(0 \le Z \le 2) = 0.4772 とする。

答え

0.81850.8185

解説

標準化 Z=X1706Z = \dfrac{X - 170}{6} を使って、標準正規分布の確率に直します。

X=164X = 164 のとき

Z=1641706=66=1Z = \frac{164 - 170}{6} = \frac{-6}{6} = -1

X=182X = 182 のとき

Z=1821706=126=2Z = \frac{182 - 170}{6} = \frac{12}{6} = 2

よって

P(164X182)=P(1Z2)P(164 \le X \le 182) = P(-1 \le Z \le 2)

範囲が 00 をまたぐので、00 を境に2つに分けます。左右対称性より P(1Z0)=P(0Z1)P(-1 \le Z \le 0) = P(0 \le Z \le 1) なので

P(1Z2)=P(0Z1)+P(0Z2)=0.3413+0.4772=0.8185P(-1 \le Z \le 2) = P(0 \le Z \le 1) + P(0 \le Z \le 2) = 0.3413 + 0.4772 = 0.8185

負の側の確率は対称性で正の側に折り返して読むのがポイントです。分布の図をかいて、足すのか引くのかを目で確認しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
9標準

1枚の硬貨を 400400 回投げるとき、表が出る回数を XX とする。正規分布による近似を用いて P(X210)P(X \ge 210) を求めよ。ただし P(0Z1)=0.3413P(0 \le Z \le 1) = 0.3413 とする。

答え

0.15870.1587

解説

XX は二項分布 B(400, 12)B\left(400,\ \dfrac{1}{2}\right) に従います。まず期待値と標準偏差を求めます。

E(X)=40012=200E(X) = 400 \cdot \frac{1}{2} = 200
σ(X)=4001212=100=10\sigma(X) = \sqrt{400 \cdot \frac{1}{2} \cdot \frac{1}{2}} = \sqrt{100} = 10

n=400n = 400 は十分大きいので、XX は近似的に正規分布 N(200, 102)N(200,\ 10^2) に従うとみなせます。X=210X = 210 を標準化すると

Z=21020010=1Z = \frac{210 - 200}{10} = 1

よって

P(X210)=P(Z1)=0.5P(0Z1)=0.50.3413=0.1587P(X \ge 210) = P(Z \ge 1) = 0.5 - P(0 \le Z \le 1) = 0.5 - 0.3413 = 0.1587

二項分布のままでは P(X=210)+P(X=211)+P(X=210) + P(X=211) + \cdots と膨大な計算になりますが、正規近似を使えば正規分布表だけで済みます。「nn が大きい二項分布 \to N(np, npq)N(np,\ npq) で近似」という流れをセットで覚えましょう。標準偏差は npqnpq ではなく npq\sqrt{npq} である点に注意してください。

ChatGPTで質問Claudeで質問Geminiで質問
10標準

ある工場で作られる製品の重さの母標準偏差は 1010 g である。製品 100100 個を無作為に抽出して重さを量ったところ、平均は 56.356.3 g であった。この製品の重さの母平均 mm に対する信頼度 95%95\% の信頼区間を求めよ。ただし P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 とする。

答え

54.34m58.2654.34 \le m \le 58.26 (単位: g)

解説

母平均の 95%95\% 信頼区間の公式

X1.96σnmX+1.96σn\overline{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}} \le m \le \overline{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}

を使います。X=56.3\overline{X} = 56.3σ=10\sigma = 10n=100n = 100 です。

標本平均の標準偏差は

σn=10100=1010=1\frac{\sigma}{\sqrt{n}} = \frac{10}{\sqrt{100}} = \frac{10}{10} = 1

よって区間の半分の幅は

1.961=1.961.96 \cdot 1 = 1.96

したがって信頼区間は

56.31.96m56.3+1.9656.3 - 1.96 \le m \le 56.3 + 1.96

すなわち 54.34m58.2654.34 \le m \le 58.26(単位: g)です。

信頼度 95%95\% とは「この区間が母平均を含む確率が 95%95\% になるような作り方をした」という意味で、区間の作り方(抽出のたびに区間は変わる)に対する言葉であることも押さえておきましょう。

ChatGPTで質問Claudeで質問Geminiで質問
11標準

ある町の有権者から 400400 人を無作為に選んで調査したところ、8080 人がある政策に賛成した。この町の有権者全体のうち政策に賛成する人の割合(母比率)pp に対する信頼度 95%95\% の信頼区間を求めよ。ただし P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 とする。

答え

0.1608p0.23920.1608 \le p \le 0.2392

解説

まず標本比率を求めます。

p^=80400=0.2\hat{p} = \frac{80}{400} = 0.2

母比率の 95%95\% 信頼区間の公式

p^1.96p^(1p^)npp^+1.96p^(1p^)n\hat{p} - 1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le p \le \hat{p} + 1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

を使います。根号の中を計算すると

p^(1p^)n=0.2×0.8400=0.16400=0.0004\frac{\hat{p}(1-\hat{p})}{n} = \frac{0.2 \times 0.8}{400} = \frac{0.16}{400} = 0.0004
0.0004=0.02\sqrt{0.0004} = 0.02

よって区間の半分の幅は

1.96×0.02=0.03921.96 \times 0.02 = 0.0392

したがって信頼区間は

0.20.0392p0.2+0.03920.2 - 0.0392 \le p \le 0.2 + 0.0392

すなわち 0.1608p0.23920.1608 \le p \le 0.2392 です。

根号の計算では 0.0004=(0.02)20.0004 = (0.02)^2 のように「22乗の形」を見つけると速く処理できます。p^(1p^)\hat{p}(1-\hat{p})1p^1-\hat{p} を掛け忘れないよう注意しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
12発展

1枚の硬貨を 100100 回投げたところ、表が 6060 回出た。この硬貨は表と裏の出やすさに偏りがあると判断してよいか。有意水準 5%5\% で検定せよ。ただし P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 とする。

答え

帰無仮説は棄却される。この硬貨には偏りがあると判断してよい。

解説

仮説検定の手順にしたがって進めます。

【仮説を立てる】
帰無仮説 H0H_0: 表が出る確率は p=12p = \dfrac{1}{2} である(偏りはない)
対立仮説 H1H_1: p12p \ne \dfrac{1}{2} である(偏りがある)

p12p \ne \dfrac{1}{2}」を疑うので、大きすぎても小さすぎても棄却する両側検定です。

【帰無仮説のもとでの分布】
H0H_0 のもとで、表が出る回数 XX は二項分布 B(100, 12)B\left(100,\ \dfrac{1}{2}\right) に従い

E(X)=10012=50,σ(X)=1001212=25=5E(X) = 100 \cdot \frac{1}{2} = 50, \quad \sigma(X) = \sqrt{100 \cdot \frac{1}{2} \cdot \frac{1}{2}} = \sqrt{25} = 5

n=100n = 100 は十分大きいので、XX は近似的に N(50, 52)N(50,\ 5^2) に従うとみなせます。

【検定統計量の計算】
観察された値 X=60X = 60 を標準化すると

Z=60505=2Z = \frac{60 - 50}{5} = 2

【判断】
P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 より P(Z1.96)=12×0.475=0.05P(|Z| \ge 1.96) = 1 - 2 \times 0.475 = 0.05 なので、有意水準 5%5\% の棄却域は Z1.96|Z| \ge 1.96 です。

Z=21.96|Z| = 2 \ge 1.96 だから、ZZ は棄却域に入ります。よって H0H_0 は棄却され、この硬貨には偏りがあると判断できます。

「偏りがあるか」のように両方向を疑うときは両側検定、「表が出やすいか」のように一方向だけを疑うときは片側検定です。問題文の表現から検定の型を正しく読み取ることが最初の関門です。

ChatGPTで質問Claudeで質問Geminiで質問
13発展

母標準偏差 1515 の母集団から大きさ nn の標本を無作為に抽出し、母平均を信頼度 95%95\% で推定する。信頼区間の幅を 66 以下にするには、nn を少なくともいくらにすればよいか。ただし P(0Z1.96)=0.475P(0 \le Z \le 1.96) = 0.475 とする。

答え

n=97n = 97

解説

母平均の 95%95\% 信頼区間は

X1.96σnmX+1.96σn\overline{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}} \le m \le \overline{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}

なので、その幅(右端から左端までの長さ)は

2×1.96σn2 \times 1.96 \cdot \frac{\sigma}{\sqrt{n}}

です。σ=15\sigma = 15 を代入して、幅が 66 以下になる条件を立てます。

2×1.96×15n62 \times 1.96 \times \frac{15}{\sqrt{n}} \le 6

左辺の定数部分を計算すると 2×1.96×15=58.82 \times 1.96 \times 15 = 58.8 なので

58.8n6\frac{58.8}{\sqrt{n}} \le 6

両辺に n6>0\dfrac{\sqrt{n}}{6} > 0 を掛けて

n58.86=9.8\sqrt{n} \ge \frac{58.8}{6} = 9.8

両辺は正なので 22 乗して

n9.82=96.04n \ge 9.8^2 = 96.04

nn は自然数だから、これを満たす最小の nn

n=97n = 97

「幅」は半分の幅(1.96σ/n1.96 \cdot \sigma/\sqrt{n})の 22 倍であることを見落とすと、答えが大きく変わってしまいます。また、最後は「96.0496.04 以上の最小の自然数」なので切り上げて 9797 とします(9696 では条件を満たしません)。

ChatGPTで質問Claudeで質問Geminiで質問
14発展

ある種苗会社は「この種子の発芽率は 90%90\% である」と宣伝している。この種子 400400 個をまいたところ、発芽したのは 344344 個であった。発芽率は 90%90\% より低いと判断してよいか。有意水準 5%5\% で検定せよ。ただし P(0Z1.64)=0.45P(0 \le Z \le 1.64) = 0.45 とする。

答え

帰無仮説は棄却される。発芽率は 90%90\% より低いと判断してよい。

解説

母比率についての片側検定です。

【仮説を立てる】
帰無仮説 H0H_0: 発芽率は p=0.9p = 0.9 である
対立仮説 H1H_1: p<0.9p < 0.9 である

90%90\% より低いか」だけを疑うので、小さい側だけを棄却域とする片側検定です。

【帰無仮説のもとでの標本比率の分布】
標本比率は

p^=344400=0.86\hat{p} = \frac{344}{400} = 0.86

H0H_0 のもとで、n=400n = 400 は十分大きいので、標本比率 p^\hat{p} は近似的に正規分布

N(0.9, 0.9×0.1400)N\left(0.9,\ \frac{0.9 \times 0.1}{400}\right)

に従います。標準偏差を計算すると

0.9×0.1400=0.09400=0.320=0.015\sqrt{\frac{0.9 \times 0.1}{400}} = \sqrt{\frac{0.09}{400}} = \frac{0.3}{20} = 0.015

【検定統計量の計算】
p^=0.86\hat{p} = 0.86 を標準化すると

Z=0.860.90.015=0.040.015=83=2.66Z = \frac{0.86 - 0.9}{0.015} = \frac{-0.04}{0.015} = -\frac{8}{3} = -2.66\cdots

【判断】
P(0Z1.64)=0.45P(0 \le Z \le 1.64) = 0.45 より P(Z1.64)=0.50.45=0.05P(Z \le -1.64) = 0.5 - 0.45 = 0.05 なので、有意水準 5%5\% の(左側)片側検定の棄却域は Z1.64Z \le -1.64 です。

Z=2.661.64Z = -2.66\cdots \le -1.64 だから、ZZ は棄却域に入ります。よって H0H_0 は棄却され、発芽率は 90%90\% より低いと判断できます。

注意点は2つ。第一に、標準偏差の計算には標本比率 0.860.86 ではなく帰無仮説の値 p=0.9p = 0.9 を使います(検定は「H0H_0 が正しいと仮定した世界」で行うからです)。第二に、片側検定の境界値は 1.961.96 ではなく 1.641.64 です。両側と片側で棄却域の境界が変わることを必ず確認しましょう。

ChatGPTで質問Claudeで質問Geminiで質問