数学B 統計的な推測
答えと解説
答えが合っていても、解説を読んで「なぜそう解くのか」まで確認すると力がつきます。 解説を読んでもわからないときは、AIに質問してみましょう。
確率変数 X の確率分布が次で与えられている。
P(X=1)=61、 P(X=2)=31、 P(X=3)=21
E(X)、V(X)、σ(X) を求めよ。
答え
E(X)=37、 V(X)=95、 σ(X)=35
解説
まず確率の合計が 61+31+21=61+2+3=1 となっていることを確認します。
期待値は「値 × 確率」の合計です。
分散は V(X)=E(X2)−(E(X))2 で求めます。まず
よって
標準偏差は分散の正の平方根なので
分散の計算は E(X2) を先に求める方法が速くて確実です。確率の合計が 1 になるかの確認を習慣にしましょう。
確率変数 X について E(X)=5、V(X)=4 であるとき、Y=3X−2 の期待値 E(Y)、分散 V(Y)、標準偏差 σ(Y) を求めよ。
答え
E(Y)=13、 V(Y)=36、 σ(Y)=6
解説
aX+b の公式 E(aX+b)=aE(X)+b、V(aX+b)=a2V(X)、σ(aX+b)=∣a∣σ(X) を使います。a=3、b=−2 です。
分散は定数 −2 の影響を受けず、a2=9 倍になります。
標準偏差は σ(X)=4=2 なので
(σ(Y)=V(Y)=36=6 と一致することも確認できます。)
「期待値には +b がつくが、分散・標準偏差には b が影響しない」「分散は a2 倍、標準偏差は ∣a∣ 倍」という違いを混同しないようにしましょう。
1個のさいころを 180 回投げるとき、1 の目が出る回数を X とする。X の期待値 E(X)、分散 V(X)、標準偏差 σ(X) を求めよ。
答え
E(X)=30、 V(X)=25、 σ(X)=5
解説
各回の試行は独立で、1 の目が出る確率は毎回 61 なので、X は二項分布 B(180, 61) に従います。
二項分布の公式 E(X)=np、V(X)=npq(q=1−p)を使います。n=180、p=61、q=65 なので
「180 回中、平均 30 回」は直感どおりの結果です。分散の計算では q=1−p を掛け忘れるミスが多いので注意しましょう。
確率変数 X が正規分布 N(50, 102) に従うとき、P(X≥60) を求めよ。ただし P(0≤Z≤1)=0.3413 とする。
答え
0.1587
解説
正規分布の確率は、標準化 Z=σX−m で標準正規分布 N(0, 1) に直してから正規分布表の値を使います。
m=50、σ=10 なので、X=60 のとき
よって
標準正規分布は 0 について左右対称で、P(Z≥0)=0.5 です。したがって
正規分布表が与えるのは P(0≤Z≤z) の形の確率です。求めたい範囲を図にかいて、0.5 との足し引きで組み立てるのが確実です。
母標準偏差 16 の母集団から大きさ 64 の標本を無作為に抽出したところ、標本平均は 120 であった。母平均 m に対する信頼度 95% の信頼区間を求めよ。ただし P(0≤Z≤1.96)=0.475 とする。
答え
116.08≤m≤123.92
解説
母平均の 95% 信頼区間の公式
を使います。X=120、σ=16、n=64 です。
まず標本平均の標準偏差を計算します。
区間の幅を決める量は
よって信頼区間は
すなわち 116.08≤m≤123.92 です。
n で割るのを忘れて σ をそのまま使うのが典型的なミスです。「標本平均の散らばりは nσ」を必ず思い出しましょう。
確率変数 X は 0、1、2 の値をとり、P(X=0)=a、P(X=1)=b、P(X=2)=41 である。E(X)=43 のとき、a、b の値と V(X) を求めよ。
答え
a=21、 b=41、 V(X)=1611
解説
確率の合計が 1 であることと、期待値の条件から連立方程式を作ります。
確率の合計より
期待値の定義より
これを解くと b=41。よって a=43−41=21。
次に分散を V(X)=E(X2)−(E(X))2 で求めます。
未知の確率を含む問題では、「確率の合計 =1」が必ず1本目の方程式になります。求めた a、b が 0 以上 1 以下になっているかも確認しましょう。
1個のさいころを 4 回投げるとき、3 の倍数の目が出る回数を X とする。
(1) P(X≥1) を求めよ。
(2) E(X) と V(X) を求めよ。
答え
(1) 8165
(2) E(X)=34、 V(X)=98
解説
3 の倍数の目は 3 と 6 の 2 つなので、1 回の試行で出る確率は p=62=31 です。よって X は二項分布 B(4, 31) に従います。
(1) 「少なくとも 1 回」は余事象で計算します。
X=0 となるのは 4 回とも 3 の倍数以外(確率 32)が出るときなので
よって
(2) 二項分布の公式 E(X)=np、V(X)=npq より
「少なくとも 1 回」を見たら余事象、が定石です。P(X=1)+P(X=2)+⋯ と直接計算するのに比べて圧倒的に速くなります。
ある集団の身長 X(cm)は正規分布 N(170, 62) に従うとする。P(164≤X≤182) を求めよ。ただし P(0≤Z≤1)=0.3413、P(0≤Z≤2)=0.4772 とする。
答え
0.8185
解説
標準化 Z=6X−170 を使って、標準正規分布の確率に直します。
X=164 のとき
X=182 のとき
よって
範囲が 0 をまたぐので、0 を境に2つに分けます。左右対称性より P(−1≤Z≤0)=P(0≤Z≤1) なので
負の側の確率は対称性で正の側に折り返して読むのがポイントです。分布の図をかいて、足すのか引くのかを目で確認しましょう。
1枚の硬貨を 400 回投げるとき、表が出る回数を X とする。正規分布による近似を用いて P(X≥210) を求めよ。ただし P(0≤Z≤1)=0.3413 とする。
答え
約 0.1587
解説
X は二項分布 B(400, 21) に従います。まず期待値と標準偏差を求めます。
n=400 は十分大きいので、X は近似的に正規分布 N(200, 102) に従うとみなせます。X=210 を標準化すると
よって
二項分布のままでは P(X=210)+P(X=211)+⋯ と膨大な計算になりますが、正規近似を使えば正規分布表だけで済みます。「n が大きい二項分布 → N(np, npq) で近似」という流れをセットで覚えましょう。標準偏差は npq ではなく npq である点に注意してください。
ある工場で作られる製品の重さの母標準偏差は 10 g である。製品 100 個を無作為に抽出して重さを量ったところ、平均は 56.3 g であった。この製品の重さの母平均 m に対する信頼度 95% の信頼区間を求めよ。ただし P(0≤Z≤1.96)=0.475 とする。
答え
54.34≤m≤58.26 (単位: g)
解説
母平均の 95% 信頼区間の公式
を使います。X=56.3、σ=10、n=100 です。
標本平均の標準偏差は
よって区間の半分の幅は
したがって信頼区間は
すなわち 54.34≤m≤58.26(単位: g)です。
信頼度 95% とは「この区間が母平均を含む確率が 95% になるような作り方をした」という意味で、区間の作り方(抽出のたびに区間は変わる)に対する言葉であることも押さえておきましょう。
ある町の有権者から 400 人を無作為に選んで調査したところ、80 人がある政策に賛成した。この町の有権者全体のうち政策に賛成する人の割合(母比率)p に対する信頼度 95% の信頼区間を求めよ。ただし P(0≤Z≤1.96)=0.475 とする。
答え
0.1608≤p≤0.2392
解説
まず標本比率を求めます。
母比率の 95% 信頼区間の公式
を使います。根号の中を計算すると
よって区間の半分の幅は
したがって信頼区間は
すなわち 0.1608≤p≤0.2392 です。
根号の計算では 0.0004=(0.02)2 のように「2乗の形」を見つけると速く処理できます。p^(1−p^) の 1−p^ を掛け忘れないよう注意しましょう。
1枚の硬貨を 100 回投げたところ、表が 60 回出た。この硬貨は表と裏の出やすさに偏りがあると判断してよいか。有意水準 5% で検定せよ。ただし P(0≤Z≤1.96)=0.475 とする。
答え
帰無仮説は棄却される。この硬貨には偏りがあると判断してよい。
解説
仮説検定の手順にしたがって進めます。
【仮説を立てる】
帰無仮説 H0: 表が出る確率は p=21 である(偏りはない)
対立仮説 H1: p=21 である(偏りがある)
「p=21」を疑うので、大きすぎても小さすぎても棄却する両側検定です。
【帰無仮説のもとでの分布】
H0 のもとで、表が出る回数 X は二項分布 B(100, 21) に従い
n=100 は十分大きいので、X は近似的に N(50, 52) に従うとみなせます。
【検定統計量の計算】
観察された値 X=60 を標準化すると
【判断】
P(0≤Z≤1.96)=0.475 より P(∣Z∣≥1.96)=1−2×0.475=0.05 なので、有意水準 5% の棄却域は ∣Z∣≥1.96 です。
∣Z∣=2≥1.96 だから、Z は棄却域に入ります。よって H0 は棄却され、この硬貨には偏りがあると判断できます。
「偏りがあるか」のように両方向を疑うときは両側検定、「表が出やすいか」のように一方向だけを疑うときは片側検定です。問題文の表現から検定の型を正しく読み取ることが最初の関門です。
母標準偏差 15 の母集団から大きさ n の標本を無作為に抽出し、母平均を信頼度 95% で推定する。信頼区間の幅を 6 以下にするには、n を少なくともいくらにすればよいか。ただし P(0≤Z≤1.96)=0.475 とする。
答え
n=97
解説
母平均の 95% 信頼区間は
なので、その幅(右端から左端までの長さ)は
です。σ=15 を代入して、幅が 6 以下になる条件を立てます。
左辺の定数部分を計算すると 2×1.96×15=58.8 なので
両辺に 6n>0 を掛けて
両辺は正なので 2 乗して
n は自然数だから、これを満たす最小の n は
「幅」は半分の幅(1.96⋅σ/n)の 2 倍であることを見落とすと、答えが大きく変わってしまいます。また、最後は「96.04 以上の最小の自然数」なので切り上げて 97 とします(96 では条件を満たしません)。
ある種苗会社は「この種子の発芽率は 90% である」と宣伝している。この種子 400 個をまいたところ、発芽したのは 344 個であった。発芽率は 90% より低いと判断してよいか。有意水準 5% で検定せよ。ただし P(0≤Z≤1.64)=0.45 とする。
答え
帰無仮説は棄却される。発芽率は 90% より低いと判断してよい。
解説
母比率についての片側検定です。
【仮説を立てる】
帰無仮説 H0: 発芽率は p=0.9 である
対立仮説 H1: p<0.9 である
「90% より低いか」だけを疑うので、小さい側だけを棄却域とする片側検定です。
【帰無仮説のもとでの標本比率の分布】
標本比率は
H0 のもとで、n=400 は十分大きいので、標本比率 p^ は近似的に正規分布
に従います。標準偏差を計算すると
【検定統計量の計算】
p^=0.86 を標準化すると
【判断】
P(0≤Z≤1.64)=0.45 より P(Z≤−1.64)=0.5−0.45=0.05 なので、有意水準 5% の(左側)片側検定の棄却域は Z≤−1.64 です。
Z=−2.66⋯≤−1.64 だから、Z は棄却域に入ります。よって H0 は棄却され、発芽率は 90% より低いと判断できます。
注意点は2つ。第一に、標準偏差の計算には標本比率 0.86 ではなく帰無仮説の値 p=0.9 を使います(検定は「H0 が正しいと仮定した世界」で行うからです)。第二に、片側検定の境界値は 1.96 ではなく 1.64 です。両側と片側で棄却域の境界が変わることを必ず確認しましょう。