みんなの教科書GitHub

中3数学8

標本調査

全数調査と標本調査、標本平均を使った母集団の推定を学びます。

全数調査と標本調査

みなさんはテレビ番組の「視聴率」を聞いたことがありますか。視聴率は、日本中のすべての家庭を調べているわけではなく、一部の家庭だけを調べて、そこから全体のようすを推測しています。このように、何かを調べるときには「全部を調べる方法」と「一部だけを調べる方法」の2つがあります。

全数調査と標本調査

調べたい対象のすべてについて調べることを全数調査といいます。国勢調査や学校の健康診断がその例です。

一方、対象の一部を取り出して調べ、そこから全体のようすを推測することを標本調査といいます。視聴率の調査や、工場での製品の品質検査がその例です。

なぜ全数調査をしないで標本調査をするのでしょうか。理由は大きく2つあります。1つ目は、対象の数が非常に多いと、全部を調べるのに時間や費用がかかりすぎるからです。2つ目は、調べること自体で対象がこわれてしまう場合があるからです。たとえば電池の寿命を調べる検査では、調べた電池は使い切ってしまうので、全部を検査したら売る電池がなくなってしまいます。

母集団と標本

標本調査で使う用語を整理しておきましょう。

・母集団 … 調査の対象となるもとの集団全体
・標本 … 調査のために母集団から取り出された一部分
・標本の大きさ … 取り出した標本にふくまれる個数(人数)

母集団から標本を取り出すことを、標本を抽出するといいます。

標本調査で大切なのは、標本が母集団の「縮図」になっていることです。そのためには、かたよりなく、母集団のどの部分も同じ確率で選ばれるように標本を取り出す必要があります。このような取り出し方を無作為に抽出するといいます。

例題 1(調査方法の判断)

次の調査は、全数調査と標本調査のどちらでするのが適切ですか。
(1) ある中学校で行う生徒の視力検査
(2) 缶詰の中身の品質検査

解き方

(1) 視力検査は、生徒一人ひとりの健康にかかわる調査なので、全員について調べる必要があります。また、調べても生徒に害はありません。よって全数調査が適切です。

(2) 缶詰の中身を調べるには缶を開けなければならず、調べた缶詰は売り物になりません。全数調査をすると売る商品がなくなってしまうので、標本調査が適切です。

標本調査の方法

標本を無作為に抽出するには、人の「なんとなく」の判断に頼ってはいけません。人が自由に選ぶと、無意識のうちにかたよりが生まれてしまうからです。そこで、偶然だけで選ばれるしくみを使います。

無作為に抽出する方法

・くじ引きを使う
・乱数さい(各面に 0 から 9 の数字が書かれた正二十面体のさいころ)を使う
・乱数表を使う
・コンピュータや電卓の乱数機能を使う

どの方法も、どの個体も同じ確率で選ばれるようになっています。このように偶然によって得られる数字の並びを乱数といいます。

例題 2(無作為抽出の手順)

ある中学校の生徒480人の中から、20人を無作為に抽出する方法を1つ説明しなさい。

解き方

たとえば次のようにします。

1. 生徒全員に 1 から 480 までの番号をつける。
2. コンピュータの乱数機能で、1 から 480 までの整数の乱数を発生させる。
3. 出た番号の生徒を標本として選ぶ。同じ番号が出たときはその番号を除いて、番号が20個そろうまで続ける。

こうすれば、どの生徒も同じ確率で選ばれるので、無作為に抽出したことになります。「3年生から選ぶ」「先生が選ぶ」などの方法は、かたよりが生まれるので無作為抽出とはいえません。

標本の大きさについても考えてみましょう。袋の中に白と黒の碁石がたくさん入っているとき、5個だけ取り出して調べるのと、50個取り出して調べるのとでは、どちらが袋全体のようすをよく表しているでしょうか。取り出す数が少ないと、たまたま黒ばかり出るようなことが起こりやすくなります。

標本の大きさと標本平均

標本の大きさが大きいほど、標本の傾向(割合や平均)は母集団の傾向に近づきやすくなります。

また、標本の平均値を標本平均といいます。標本を無作為に抽出すれば、標本平均は母集団全体の平均値に近い値になると考えられるので、標本平均を母集団の平均値の代わりに使って推定ができます。

標本調査の利用

標本を無作為に抽出すれば、標本での割合は母集団での割合とほぼ等しいと考えられます。この性質を使うと、母集団の中の数量を推定できます。

母集団の数量の推定

標本調査による推定は、次の考え方で行います。

(母集団での割合) == (標本での割合) とみなす

つまり、母集団の総数を NN、求めたい数量を xx、標本の大きさを nn、標本の中で見つかった数を aa とすると

xN=an\frac{x}{N} = \frac{a}{n}

これを解いて x=N×anx = N \times \dfrac{a}{n} と推定します。結果は「およそ〜」と答えます。

例題 3(割合による推定)

箱の中にペットボトルのキャップが600個入っています。この中から無作為に40個取り出したところ、赤いキャップが10個ありました。箱の中の赤いキャップはおよそ何個と考えられますか。

解き方

標本での赤いキャップの割合は

1040=14\frac{10}{40} = \frac{1}{4}

箱の中(母集団)でも赤いキャップの割合は 14\dfrac{1}{4} とみなせるので、赤いキャップの数は

600×14=150600 \times \frac{1}{4} = 150

よって、およそ150個と考えられます。

次は、母集団の総数そのものを推定する方法です。池の魚のように全部を数えられないものは、「印をつけて返し、あとでもう一度つかまえる」という方法で総数を推定できます。

例題 4(総数の推定)

ある池の魚の総数を調べるために、魚を30匹つかまえて全部に印をつけ、池にもどしました。数日後、無作為に45匹つかまえたところ、印のついた魚が3匹いました。池の魚の総数はおよそ何匹と考えられますか。

解き方

池の魚の総数を xx 匹とします。池全体での印のついた魚の割合は 30x\dfrac{30}{x}、標本での割合は 345\dfrac{3}{45} です。この2つが等しいとみなすと

30x=345\frac{30}{x} = \frac{3}{45}

両辺に 45x45x を掛けて分母をはらうと

30×45=3x30 \times 45 = 3x
1350=3x1350 = 3x
x=450x = 450

よって、池の魚の総数はおよそ450匹と考えられます。検算として、450匹中30匹の割合は 30450=115\dfrac{30}{450} = \dfrac{1}{15}、標本の割合は 345=115\dfrac{3}{45} = \dfrac{1}{15} で一致します。

標本平均を使った推定もできます。たとえば、みかん農園の1500個のみかんから無作為に15個取り出して重さを量ったら、平均が 9292 g だったとします。標本平均は母集団の平均に近いと考えられるので、みかん全体の重さの合計は

1500×92=1380001500 \times 92 = 138000

より、およそ 138000138000 g、つまりおよそ 138138 kg と推定できます。個数が多くて全部量れないものでも、一部の平均から全体を見積もれるのが標本平均の便利なところです。

標本調査の活用と注意点

標本調査の結果が信頼できるのは、標本が無作為に抽出されているときだけです。標本にかたよりがあると、どんなに標本の大きさを大きくしても、正しい推定はできません。

例題 5(かたよりのある標本)

ある中学校で「全校生徒の1日あたりの運動時間」を調べるために、運動部の部活動が終わったあとの体育館にいた生徒50人にアンケートをとりました。この調査方法の問題点を説明しなさい。

解き方

体育館にいた生徒の多くは運動部の生徒だと考えられます。運動部の生徒は全校生徒の平均より運動時間が長い傾向があるので、この50人は母集団(全校生徒)の縮図になっておらず、標本にかたよりがあります。

このまま推定すると、全校生徒の運動時間を実際より長く見積もってしまいます。全校生徒に番号をつけて乱数で選ぶなど、全員が同じ確率で選ばれる方法で標本を抽出し直す必要があります。

よい標本調査のためのチェックポイント

・標本は母集団全体から無作為に抽出されているか
・特定のグループ(場所・時間・答えたい人だけ)にかたよっていないか
・標本の大きさは十分か(小さすぎると偶然の影響が大きい)
・結果はあくまで推定なので、「およそ〜」と幅をもって受け止める

たとえば、駅前で平日の昼間にアンケートをとると、その時間に駅前を通れる人(通勤しない人など)にかたよります。インターネットの投票は「答えたい人だけが答える」ので、意見の強い人にかたよります。標本調査の結果を見るときは、「その標本はどうやって選ばれたのか」を確かめる習慣をつけましょう。標本調査は、正しく使えば少ない手間で全体のようすをつかめる、とても強力な方法です。

この章の内容がむずかしいと感じたら

ChatGPTで質問Claudeで質問Geminiで質問

わからないところは遠慮なくAIに聞こう。Geminiはボタンを押すとプロンプトがコピーされるので、開いたら貼り付けてね。