みんなの教科書GitHub

中1数学7

データの活用

度数分布表とヒストグラム、相対度数、ことがらの起こりやすさを学びます。

度数分布表とヒストグラム

クラスの通学時間やソフトボール投げの記録のように、たくさんの数値が集まったものをデータといいます。データをただ並べただけでは、全体の様子(散らばりぐあい)はつかめません。そこで、データをいくつかの区間に区切って整理します。この区間のことを階級、区間の大きさを階級の幅、それぞれの階級に入るデータの個数を度数といい、整理した表を度数分布表といいます。

たとえば、10人の生徒の通学時間(分)が次のようだったとします。

5, 8, 12, 14, 15, 16, 18, 21, 24, 27

これを階級の幅を5分にして度数分布表に整理すると、次のようになります。

  • 5分以上10分未満 … 度数 2人

  • 10分以上15分未満 … 度数 2人

  • 15分以上20分未満 … 度数 3人

  • 20分以上25分未満 … 度数 2人

  • 25分以上30分未満 … 度数 1人

  • 合計 … 10人

度数分布表の用語

・階級 … データを区切る区間(例: 15分以上20分未満)

・階級の幅 … 区間の大きさ(この表では 5分)

・度数 … その階級に入るデータの個数

・階級値 … 階級の真ん中の値。15分以上20分未満の階級値は

15+202=17.5\frac{15+20}{2} = 17.5

より 17.5分です。

度数分布表を柱状のグラフに表したものをヒストグラムといいます。横軸に階級、縦軸に度数をとり、長方形をすき間なく並べてかきます。棒グラフとちがってすき間をあけないのは、横軸が「区切りのない連続した数値」だからです。さらに、ヒストグラムの各長方形の上の辺の中点(階級値の位置)を順に線分で結ぶと、度数折れ線(度数分布多角形)ができます。度数折れ線は、両端に度数0の階級があると考えて、横軸まで結んでかきます。折れ線にすると、2つのデータの分布の形を重ねて比べやすくなります。

例題 1(度数分布表を読む)

上の通学時間の度数分布表について、次の問いに答えなさい。
(1) 度数がもっとも大きい階級をいいなさい。
(2) 通学時間が20分以上の生徒は何人いますか。

解き方

(1) 度数を順に見ると 2人、2人、3人、2人、1人 なので、もっとも大きいのは 3人 の階級、つまり 15分以上20分未満 の階級です。

(2) 20分以上の階級は「20分以上25分未満」と「25分以上30分未満」の2つです。度数をたすと

2 + 1 = 3

で、3人です。度数分布表では「どの範囲に何人いるか」は分かりますが、一人ひとりの正確な値は分からなくなる、という点もおさえておきましょう。

相対度数と累積度数

「15分以上20分未満の生徒が3人いる」と言われても、全体が10人なのか100人なのかで意味は大きく変わります。そこで、全体に対する割合で度数を表したものが相対度数です。相対度数を使うと、人数(合計の度数)がちがうグループどうしでも分布を比べられるようになります。

相対度数

相対度数 =(その階級の度数)÷(度数の合計)

相対度数はふつう小数で表し、すべての階級の相対度数の合計は必ず 11 になります。

例題 2(相対度数を求める)

前のセクションの通学時間の度数分布表(合計10人)について、各階級の相対度数を求めなさい。

解き方

度数の合計は10人なので、各階級の度数を10でわります。

5分以上10分未満 … 2÷10=0.202 \div 10 = 0.20

10分以上15分未満 … 2÷10=0.202 \div 10 = 0.20

15分以上20分未満 … 3÷10=0.303 \div 10 = 0.30

20分以上25分未満 … 2÷10=0.202 \div 10 = 0.20

25分以上30分未満 … 1÷10=0.101 \div 10 = 0.10

合計は 0.20+0.20+0.30+0.20+0.10=1.000.20+0.20+0.30+0.20+0.10 = 1.00 となり、確かに 11 になっています。相対度数を求めたら、合計が 11 になるか確かめると計算ミスに気づけます。

また、最初の階級からその階級までの度数をすべてたし合わせたものを累積度数といいます。同じように、相対度数をたし合わせたものを累積相対度数といいます。累積度数を見ると、「20分未満の生徒は何人か」のような「〜未満」「〜以下」の人数がひと目で分かります。

例題 3(累積度数)

通学時間の度数分布表(度数は順に 2人、2人、3人、2人、1人)で、15分以上20分未満の階級までの累積度数と累積相対度数を求めなさい。

解き方

累積度数は、最初の階級からその階級までの度数の和です。

2+2+3=72 + 2 + 3 = 7

よって累積度数は 7人。つまり「通学時間が20分未満の生徒は7人」という意味です。

累積相対度数は、相対度数の和で

0.20+0.20+0.30=0.700.20 + 0.20 + 0.30 = 0.70

となります。これは「全体の70%の生徒が20分未満」ということを表します。累積相対度数は、累積度数7を合計10でわって 7÷10=0.707 \div 10 = 0.70 と求めることもできます。

代表値(平均値・中央値・最頻値)と範囲

データ全体の特徴を1つの数値で代表させたものを代表値といいます。代表値には平均値・中央値・最頻値の3つがあり、データの特徴によって使い分けます。また、データの散らばりの大きさを表す値として範囲(レンジ)があります。

代表値と範囲

・平均値 … データの値の合計を、データの個数でわった値

平均値 =(データの値の合計)÷(データの個数)

・中央値(メジアン)… データを大きさの順に並べたときの真ん中の値。データの個数が偶数のときは、真ん中の2つの値の平均をとる

・最頻値(モード)… データの中でもっとも多く出てくる値。度数分布表では、度数がもっとも大きい階級の階級値

・範囲(レンジ)… 散らばりの大きさを表す値

範囲 =(最大値)−(最小値)

例題 4(代表値と範囲を求める)

7人の生徒が1か月に読んだ本の冊数は、次の通りでした。

3, 5, 5, 6, 8, 9, 13

平均値、中央値、最頻値、範囲をそれぞれ求めなさい。

解き方

平均値は、合計をデータの個数7でわります。

3+5+5+6+8+9+13=493+5+5+6+8+9+13 = 49
49÷7=749 \div 7 = 7

よって平均値は 7冊。

中央値は、データはすでに小さい順に並んでいるので、7個の真ん中、つまり4番目の値で 6冊。

最頻値は、もっとも多く出てくる値なので、2回出てくる 5冊。

範囲は、最大値13から最小値3をひいて

133=1013 - 3 = 10

より 10冊です。このように、平均値・中央値・最頻値は同じデータでもちがう値になることがあります。

データの個数が偶数のときの中央値も確認しておきましょう。たとえば 2, 4, 5, 7, 7, 11 という6個のデータでは、真ん中は3番目と4番目の2つになるので、その平均

5+72=6\frac{5+7}{2} = 6

が中央値です。

また、極端に大きい(または小さい)値がまじっているデータでは、平均値はその値に引っぱられて、全体の実感からずれてしまうことがあります。そのようなときは、順番の真ん中で決まる中央値のほうが、データ全体の様子をよく表す代表値になります。どの代表値を使うのがよいかを、目的に合わせて選べるようになることが大切です。

度数分布表しかないとき(もとの一人ひとりの値が分からないとき)は、各階級の値をその階級値で代表させて、平均値のおよその値を求めます。

平均値 =(階級値 × 度数 の合計)÷(度数の合計)

最頻値は、度数がもっとも大きい階級の階級値とします。

ことがらの起こりやすさ

ペットボトルのキャップを投げると、「上向き」になるか「そうでない」かは、投げてみるまで分かりません。このような、結果が偶然に左右されることがらでも、実験を何回もくり返すと「起こりやすさ」に一定の傾向が見えてきます。実際にキャップを投げる実験をして、上向きになった回数を記録すると、たとえば次のようになります。

  • 100回投げたとき … 上向き38回、相対度数 0.38

  • 500回投げたとき … 上向き195回、相対度数 0.39

  • 1000回投げたとき … 上向き392回、相対度数 0.392

  • 2000回投げたとき … 上向き786回、相対度数 0.393

投げる回数が少ないうちは相対度数はばらつきますが、回数を増やしていくと、相対度数はしだいに一定の値(この実験ではおよそ0.39)に近づいていきます。

相対度数と確率

実験の回数を多くしていくと、あることがらの起こる相対度数は、ある一定の値に近づいていきます。この値を、そのことがらの起こる確率とみなすことができます。

相対度数 =(そのことがらが起こった回数)÷(実験の回数)

確率が0.39であるとは、「多数回くり返せば、全体のおよそ39%の割合でそのことがらが起こる」と期待できるという意味です。次の1回で必ず起こるかどうかを言い当てるものではありません。

例題 5(確率を使って予想する)

あるびんの王冠を1000回投げたところ、表向きになったのは380回でした。
(1) 表向きになる相対度数を求めなさい。
(2) この王冠を3000回投げると、表向きはおよそ何回になると考えられますか。

解き方

(1) 相対度数は、起こった回数を実験の回数でわって

380÷1000=0.38380 \div 1000 = 0.38

(2) 1000回という多数回の実験から得られた相対度数0.38を、表向きになる確率とみなします。3000回投げたときに期待される回数は

3000×0.38=11403000 \times 0.38 = 1140

より、およそ1140回と考えられます。「確率 × 回数」で起こる回数のおよその見当がつけられる、というのが確率の使い方の第一歩です。ただし、実際にぴったり1140回になるとは限らないことにも注意しましょう。

この章の内容がむずかしいと感じたら

ChatGPTで質問Claudeで質問Geminiで質問

わからないところは遠慮なくAIに聞こう。Geminiはボタンを押すとプロンプトがコピーされるので、開いたら貼り付けてね。