みんなの教科書GitHub

数学I データの分析

答えと解説

答えが合っていても、解説を読んで「なぜそう解くのか」まで確認すると力がつきます。 解説を読んでもわからないときは、AIに質問してみましょう。

1基本

5人の生徒の小テスト(10点満点)の得点は次の通りであった。
5, 6, 6, 8, 105, \ 6, \ 6, \ 8, \ 10
平均値、中央値、最頻値を求めよ。

答え

平均値 77 点、中央値 66 点、最頻値 66

解説

平均値は「合計 ÷ 個数」です。

xˉ=5+6+6+8+105=355=7\bar{x} = \frac{5+6+6+8+10}{5} = \frac{35}{5} = 7

より 77 点です。データはすでに小さい順に並んでいます。5個(奇数個)なので、中央値はちょうど真ん中の3番目の値で 66 点です。

最頻値は最も多く現れる値です。66 が2回現れ、他はすべて1回なので、最頻値は 66 点です。

中央値を求めるときは、必ずデータが小さい順に並んでいることを確認してから真ん中を探しましょう。並べ替えを忘れるのが最も多いミスです。

ChatGPTで質問Claudeで質問Geminiで質問
2基本

8人の生徒の1週間の読書時間を調べ、次の度数分布表を得た。読書時間の平均値を求めよ。
0時間以上2時間未満 … 2人
2時間以上4時間未満 … 4人
4時間以上6時間未満 … 2人

答え

33 時間

解説

度数分布表から平均値を求めるときは、各階級のデータがすべて階級値(階級の真ん中の値)をとるとみなして計算します。

各階級の階級値は、002211224433446655 です。

「階級値 × 度数」の合計を総度数で割って

xˉ=1×2+3×4+5×28=2+12+108=248=3\bar{x} = \frac{1 \times 2 + 3 \times 4 + 5 \times 2}{8} = \frac{2 + 12 + 10}{8} = \frac{24}{8} = 3

よって平均値は 33 時間です。

度数分布表から求める平均値は、もとのデータの正確な平均値とは一般に一致しない「近似値」であることも覚えておきましょう。

ChatGPTで質問Claudeで質問Geminiで質問
3基本

次の6個のデータについて、中央値と範囲(レンジ)を求めよ。
2, 3, 5, 7, 8, 112, \ 3, \ 5, \ 7, \ 8, \ 11

答え

中央値 66、範囲 99

解説

データはすでに小さい順に並んでいます。個数が6個(偶数)なので、中央値は中央の2つ、すなわち3番目の値 55 と4番目の値 77 の平均です。

5+72=122=6\frac{5+7}{2} = \frac{12}{2} = 6

範囲は「最大値 − 最小値」なので

112=911 - 2 = 9

偶数個のデータの中央値は「2つの値の平均」であって、データの中に実際にある値とは限りません。この問題でも 66 はデータに含まれていませんが、それで正解です。

ChatGPTで質問Claudeで質問Geminiで質問
4基本

次の7個のデータについて、第1四分位数 Q1Q_1、第2四分位数 Q2Q_2、第3四分位数 Q3Q_3 と四分位範囲を求めよ。
1, 3, 4, 6, 8, 9, 121, \ 3, \ 4, \ 6, \ 8, \ 9, \ 12

答え

Q1=3Q_1 = 3Q2=6Q_2 = 6Q3=9Q_3 = 9、四分位範囲 66

解説

データはすでに小さい順に並んでいます。7個のデータの中央値は4番目の値なので

Q2=6Q_2 = 6

データの個数が奇数のときは、中央値をどちらの半分にも含めずにデータを分けます。

下半分は 1,3,41, 3, 4 で、その中央値が

Q1=3Q_1 = 3

上半分は 8,9,128, 9, 12 で、その中央値が

Q3=9Q_3 = 9

四分位範囲は

Q3Q1=93=6Q_3 - Q_1 = 9 - 3 = 6

「奇数個のときは中央値を除いて半分に分ける」というルールを忘れないようにしましょう。ここを間違えると Q1Q_1Q3Q_3 がずれてしまいます。

ChatGPTで質問Claudeで質問Geminiで質問
5基本

5人の生徒の通学時間(分)は次の通りであった。分散と標準偏差を求めよ。
4, 5, 6, 7, 84, \ 5, \ 6, \ 7, \ 8

答え

分散 22、標準偏差 2\sqrt{2}

解説

まず平均値を求めます。

xˉ=4+5+6+7+85=305=6\bar{x} = \frac{4+5+6+7+8}{5} = \frac{30}{5} = 6

各データの偏差(データ − 平均)は

2, 1, 0, 1, 2-2, \ -1, \ 0, \ 1, \ 2

分散は偏差の2乗の平均なので

s2=(2)2+(1)2+02+12+225=4+1+0+1+45=105=2s^2 = \frac{(-2)^2 + (-1)^2 + 0^2 + 1^2 + 2^2}{5} = \frac{4+1+0+1+4}{5} = \frac{10}{5} = 2

標準偏差は分散の正の平方根で

s=2s = \sqrt{2}

より 2\sqrt{2} 分です。

検算のコツ: 偏差の合計は必ず 00 になります。21+0+1+2=0-2-1+0+1+2 = 0 を確認してから2乗の計算に進むと、平均値の計算ミスに早く気づけます。

ChatGPTで質問Claudeで質問Geminiで質問
6標準

5個のデータ 3, 5, 7, x, 93, \ 5, \ 7, \ x, \ 9 の平均値が 66 であるとき、xx の値と、このデータの中央値を求めよ。

答え

x=6x = 6、中央値 66

解説

平均値の定義から式を立てます。平均値が 66 なので

3+5+7+x+95=6\frac{3+5+7+x+9}{5} = 6

両辺に 55 を掛けて

24+x=3024 + x = 30
x=6x = 6

x=6x = 6 をデータに戻し、小さい順に並べ直すと

3, 5, 6, 7, 93, \ 5, \ 6, \ 7, \ 9

5個(奇数個)なので、中央値は3番目の値で 66 です。

「平均値 × 個数 = 合計」という見方をすると、合計が 3030 と即座に分かり、x=3024=6x = 30 - 24 = 6 と暗算でも求められます。求めた xx を含めて並べ替え直すことを忘れないようにしましょう。

ChatGPTで質問Claudeで質問Geminiで質問
7標準

5個のデータ 1, 2, 4, 5, 81, \ 2, \ 4, \ 5, \ 8 の分散と標準偏差を求めよ。

答え

分散 66、標準偏差 6\sqrt{6}

解説

まず平均値を求めます。

xˉ=1+2+4+5+85=205=4\bar{x} = \frac{1+2+4+5+8}{5} = \frac{20}{5} = 4

【方法1】偏差の2乗の平均で計算する
偏差は 3, 2, 0, 1, 4-3, \ -2, \ 0, \ 1, \ 4 なので

s2=9+4+0+1+165=305=6s^2 = \frac{9 + 4 + 0 + 1 + 16}{5} = \frac{30}{5} = 6

【方法2】「2乗の平均 − 平均の2乗」で計算する
x2x^2 の平均は

x2=1+4+16+25+645=1105=22\overline{x^2} = \frac{1 + 4 + 16 + 25 + 64}{5} = \frac{110}{5} = 22

なので

s2=x2(xˉ)2=2242=2216=6s^2 = \overline{x^2} - (\bar{x})^2 = 22 - 4^2 = 22 - 16 = 6

どちらの方法でも分散は 66、標準偏差は s=6s = \sqrt{6} です。

2つの計算式で答えが一致することを確認すれば、それ自体が最強の検算になります。テストでも時間があれば両方で計算してみましょう。

ChatGPTで質問Claudeで質問Geminiで質問
8標準

8人の生徒がある月に図書室で借りた本の冊数は次の通りであった。
9, 3, 27, 5, 1, 9, 7, 39, \ 3, \ 27, \ 5, \ 1, \ 9, \ 7, \ 3
四分位数 Q1Q_1Q2Q_2Q3Q_3 を求めよ。また、四分位範囲を RR とするとき「Q11.5RQ_1 - 1.5R より小さい値、または Q3+1.5RQ_3 + 1.5R より大きい値を外れ値とする」という基準で、このデータに外れ値があれば求めよ。

答え

Q1=3Q_1 = 3Q2=6Q_2 = 6Q3=9Q_3 = 9。外れ値は 2727

解説

まずデータを小さい順に並べ替えます。

1, 3, 3, 5, 7, 9, 9, 271, \ 3, \ 3, \ 5, \ 7, \ 9, \ 9, \ 27

8個(偶数個)なので、中央値は4番目と5番目の平均で

Q2=5+72=6Q_2 = \frac{5+7}{2} = 6

偶数個のときはデータをちょうど半分ずつに分けます。下半分は 1,3,3,51, 3, 3, 5 で、その中央値は

Q1=3+32=3Q_1 = \frac{3+3}{2} = 3

上半分は 7,9,9,277, 9, 9, 27 で、その中央値は

Q3=9+92=9Q_3 = \frac{9+9}{2} = 9

四分位範囲は R=Q3Q1=93=6R = Q_3 - Q_1 = 9 - 3 = 6 です。外れ値の基準となる値を計算すると

Q11.5R=39=6,Q3+1.5R=9+9=18Q_1 - 1.5R = 3 - 9 = -6, \quad Q_3 + 1.5R = 9 + 9 = 18

6-6 より小さい値はありません。1818 より大きい値は 2727 だけなので、外れ値は 2727 です。

並べ替えを雑にやると全部ずれます。もとのデータの個数(8個)と並べ替え後の個数が一致しているか、指差し確認する習慣をつけましょう。

ChatGPTで質問Claudeで質問Geminiで質問
9標準

変量 xx のデータの平均値が 55、標準偏差が 22 であるとき、変量 y=2x+3y = 2x + 3 のデータの平均値、分散、標準偏差を求めよ。

答え

平均値 1313、分散 1616、標準偏差 44

解説

変量の変換の公式 y=ax+by = ax + b のとき yˉ=axˉ+b\bar{y} = a\bar{x} + bsy2=a2sx2s_y^2 = a^2 s_x^2sy=asxs_y = |a| s_x を使います。ここでは a=2a = 2b=3b = 3 です。

平均値は

yˉ=2xˉ+3=2×5+3=13\bar{y} = 2\bar{x} + 3 = 2 \times 5 + 3 = 13

xx の標準偏差が 22 なので、xx の分散は sx2=22=4s_x^2 = 2^2 = 4。よって yy の分散は

sy2=22×sx2=4×4=16s_y^2 = 2^2 \times s_x^2 = 4 \times 4 = 16

標準偏差は

sy=2×2=4s_y = |2| \times 2 = 4

(あるいは sy=16=4s_y = \sqrt{16} = 4 と求めても同じです。)

ポイントは「+3+3 は平均だけを動かし、散らばりには影響しない」「22 倍すると分散は 22=42^2 = 4 倍になる」という2点です。分散を 22 倍にしてしまうミスが非常に多いので注意しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
10標準

5人の生徒の数学の小テストの得点 xx と英語の小テストの得点 yy が次の通りであった。
(x,y)=(1,5), (2,4), (3,6), (4,8), (5,7)(x, y) = (1, 5), \ (2, 4), \ (3, 6), \ (4, 8), \ (5, 7)
xxyy の共分散 sxys_{xy} と相関係数 rr を求めよ。

答え

sxy=1.6s_{xy} = 1.6r=0.8r = 0.8

解説

相関係数は r=sxysxsyr = \dfrac{s_{xy}}{s_x s_y} で求めます。まず平均値から。

xˉ=1+2+3+4+55=3,yˉ=5+4+6+8+75=305=6\bar{x} = \frac{1+2+3+4+5}{5} = 3, \quad \bar{y} = \frac{5+4+6+8+7}{5} = \frac{30}{5} = 6

各組の偏差を並べると

xx の偏差: 2, 1, 0, 1, 2-2, \ -1, \ 0, \ 1, \ 2
yy の偏差: 1, 2, 0, 2, 1-1, \ -2, \ 0, \ 2, \ 1

分散はそれぞれ

sx2=4+1+0+1+45=105=2,sy2=1+4+0+4+15=105=2s_x^2 = \frac{4+1+0+1+4}{5} = \frac{10}{5} = 2, \quad s_y^2 = \frac{1+4+0+4+1}{5} = \frac{10}{5} = 2

なので sx=sy=2s_x = s_y = \sqrt{2}。共分散は偏差の積の平均で

sxy=(2)(1)+(1)(2)+00+12+215=2+2+0+2+25=85=1.6s_{xy} = \frac{(-2)(-1) + (-1)(-2) + 0 \cdot 0 + 1 \cdot 2 + 2 \cdot 1}{5} = \frac{2+2+0+2+2}{5} = \frac{8}{5} = 1.6

したがって相関係数は

r=sxysxsy=1.62×2=1.62=0.8r = \frac{s_{xy}}{s_x s_y} = \frac{1.6}{\sqrt{2} \times \sqrt{2}} = \frac{1.6}{2} = 0.8

計算を整理する表(偏差、偏差の2乗、偏差の積を並べた表)を作ると、ミスが激減します。また rr は必ず 1-1 以上 11 以下になるので、範囲を外れたら計算ミスです。

ChatGPTで質問Claudeで質問Geminiで質問
11標準

新商品AとBのどちらが好きかを7人に尋ねたところ、7人全員がAと答えた。「AとBの人気に差はない」と考えてよいか。基準となる確率を 5%5\% として、仮説検定の考え方で判断せよ。

答え

「人気に差はない」という仮説は棄却され、Aの方が人気があると判断できる

解説

仮説検定では、判断したい主張(Aの方が人気がある)に反する仮説を立て、その仮説のもとで実際の結果が起こる確率を調べます。

仮説: AとBの人気に差はない。つまり、各人がAと答える確率は 12\dfrac{1}{2} である。

この仮説のもとで、7人全員がAと答える確率は

(12)7=1128=0.0078\left(\frac{1}{2}\right)^7 = \frac{1}{128} = 0.0078\ldots

これは約 0.8%0.8\% で、基準の 5%5\% より小さい値です。

つまり、仮説が正しいとすると、確率約 0.8%0.8\% しかない「めったに起こらないこと」が起きたことになります。これは仮説の方を疑うべきだと考えて、仮説を棄却します。

したがって、AとBの人気に差はないとはいえず、Aの方が人気があると判断できます。

答案では「仮説を立てる → 確率を計算する → 5%5\% と比較する → 結論」という流れを明示することが大切です。確率が 5%5\% 以上のときは「仮説を棄却できない(差があるとは判断できない)」となることにも注意しましょう。

ChatGPTで質問Claudeで質問Geminiで質問
12発展

5個のデータ 2, 4, 6, a, b2, \ 4, \ 6, \ a, \ b(a<ba < b)の平均値が 55、分散が 44 であるとき、aabb の値を求めよ。

答え

a=5a = 5b=8b = 8

解説

平均値と分散の条件から、a+ba + ba2+b2a^2 + b^2 を求め、連立して解くのが定石です。

【条件1: 平均値】平均値が 55 なので

2+4+6+a+b5=5\frac{2 + 4 + 6 + a + b}{5} = 5
12+a+b=2512 + a + b = 25
a+b=13a + b = 13

【条件2: 分散】分散の公式 s2=x2(xˉ)2s^2 = \overline{x^2} - (\bar{x})^2 を使うと

x2=s2+(xˉ)2=4+25=29\overline{x^2} = s^2 + (\bar{x})^2 = 4 + 25 = 29

つまり x2x^2 の合計は 29×5=14529 \times 5 = 145 なので

22+42+62+a2+b2=1452^2 + 4^2 + 6^2 + a^2 + b^2 = 145
4+16+36+a2+b2=1454 + 16 + 36 + a^2 + b^2 = 145
a2+b2=89a^2 + b^2 = 89

【連立して解く】(a+b)2=a2+2ab+b2(a+b)^2 = a^2 + 2ab + b^2 より

2ab=(a+b)2(a2+b2)=13289=16989=802ab = (a+b)^2 - (a^2+b^2) = 13^2 - 89 = 169 - 89 = 80
ab=40ab = 40

和が 1313、積が 4040 の2数は、2次方程式 t213t+40=0t^2 - 13t + 40 = 0 の解です。因数分解して

(t5)(t8)=0(t-5)(t-8) = 0
t=5, 8t = 5, \ 8

a<ba < b なので a=5a = 5b=8b = 8 です。

検算: データは 2,4,6,5,82, 4, 6, 5, 8。合計 2525 で平均 55 ✓。偏差は 3,1,1,0,3-3, -1, 1, 0, 3 で、偏差の2乗の合計は 9+1+1+0+9=209+1+1+0+9 = 20、分散は 20÷5=420 \div 5 = 4 ✓。

分散の条件は「偏差の2乗の平均」で立式してもよいですが、x2(xˉ)2\overline{x^2} - (\bar{x})^2 を使う方が式が簡単になります。和と積が分かったら2次方程式に持ち込む、という流れは対称式の典型手法です。

ChatGPTで質問Claudeで質問Geminiで質問
13発展

あるクラスを2つの班に分けて小テストを行った。A班4人の平均値は 55 点、分散は 33、B班6人の平均値は 1010 点、分散は 88 であった。10人全体の平均値と分散を求めよ。

答え

平均値 88 点、分散 1212

解説

グループを合わせたデータの分散は、分散を単純に平均してはいけません。「合計」と「2乗の合計」に戻して計算するのが定石です。

【全体の平均値】各班の得点の合計は「平均 × 人数」なので、A班の合計は 5×4=205 \times 4 = 20 点、B班の合計は 10×6=6010 \times 6 = 60 点です。

よって10人全体の平均値は

xˉ=20+6010=8010=8\bar{x} = \frac{20 + 60}{10} = \frac{80}{10} = 8

より 88 点です。

【全体の分散】分散の公式 s2=x2(xˉ)2s^2 = \overline{x^2} - (\bar{x})^2 を変形すると、各班の「2乗の平均」は

x2=s2+(xˉ)2\overline{x^2} = s^2 + (\bar{x})^2

で求められます。

A班: x2=3+52=28\overline{x^2} = 3 + 5^2 = 28 なので、2乗の合計は 28×4=11228 \times 4 = 112

B班: x2=8+102=108\overline{x^2} = 8 + 10^2 = 108 なので、2乗の合計は 108×6=648108 \times 6 = 648

よって10人全体の2乗の平均は

x2=112+64810=76010=76\overline{x^2} = \frac{112 + 648}{10} = \frac{760}{10} = 76

したがって全体の分散は

s2=7682=7664=12s^2 = 76 - 8^2 = 76 - 64 = 12

全体の分散 1212 が、各班の分散(3388)のどちらよりも大きくなっていることに注目してください。これは、班の中の散らばりに加えて「班と班の平均値の差」による散らばりが上乗せされるためです。分散の平均 3×4+8×610=6\frac{3 \times 4 + 8 \times 6}{10} = 6 を答えにしてしまうのが最も多い誤りです。

ChatGPTで質問Claudeで質問Geminiで質問
14発展

2つの変量 xxyy について、xx の標準偏差が 22yy の標準偏差が 55xxyy の共分散が 66 である。
(1) xxyy の相関係数 rr を求めよ。
(2) 新しい変量を u=2x+1u = 2x + 1v=3y+2v = -3y + 2 で定めるとき、uuvv の相関係数を求めよ。

答え

(1) r=0.6r = 0.6
(2) 0.6-0.6

解説

(1) 相関係数の定義式に代入します。

r=sxysxsy=62×5=610=0.6r = \frac{s_{xy}}{s_x s_y} = \frac{6}{2 \times 5} = \frac{6}{10} = 0.6

(2) 変量の変換が標準偏差と共分散に与える影響を順に調べます。

まず標準偏差。u=2x+1u = 2x + 1 では su=2sx=2×2=4s_u = |2| s_x = 2 \times 2 = 4v=3y+2v = -3y + 2 では sv=3sy=3×5=15s_v = |-3| s_y = 3 \times 5 = 15 です(標準偏差は負にならないので、係数には絶対値がつきます)。

次に共分散。uu の偏差は uuˉ=(2x+1)(2xˉ+1)=2(xxˉ)u - \bar{u} = (2x+1) - (2\bar{x}+1) = 2(x - \bar{x})vv の偏差は vvˉ=3(yyˉ)v - \bar{v} = -3(y - \bar{y}) となるので、偏差の積は

(uuˉ)(vvˉ)=2×(3)×(xxˉ)(yyˉ)=6(xxˉ)(yyˉ)(u - \bar{u})(v - \bar{v}) = 2 \times (-3) \times (x-\bar{x})(y-\bar{y}) = -6(x-\bar{x})(y-\bar{y})

その平均をとって

suv=6sxy=6×6=36s_{uv} = -6 \, s_{xy} = -6 \times 6 = -36

したがって uuvv の相関係数は

suvsusv=364×15=3660=0.6\frac{s_{uv}}{s_u s_v} = \frac{-36}{4 \times 15} = \frac{-36}{60} = -0.6

一般に、u=ax+bu = ax + bv=cy+dv = cy + d(a0a \ne 0c0c \ne 0)と変換すると、相関係数の絶対値は変わらず、ac>0ac > 0 なら符号もそのまま、ac<0ac < 0 なら符号だけが反転します。「相関係数は単位の取り方によらない」という性質のあらわれで、記述式でもよく問われる重要ポイントです。

ChatGPTで質問Claudeで質問Geminiで質問