データの整理 ― 度数分布表と柱状グラフ
「クラスのみんなは、ボールをどれくらい遠くまで投げられるのかな?」――こんなことを調べるために集めた記録のまとまりを、データといいます。この章では、データを整理して、その特ちょうを読み取る方法をまなびます。
たとえば、6年1組の10人がソフトボール投げをした記録が、つぎのようだったとします(単位はm)。
18、25、31、22、15、28、34、20、27、23
このままでは、記録がちらばっていて、全体のようすがつかみにくいですね。そこで、「15m以上20m未満」「20m以上25m未満」のように、同じはばの区間に分けて、それぞれの区間に入る人数を数えて表にします。
15m以上20m未満 … 2人(15、18)
20m以上25m未満 … 3人(20、22、23)
25m以上30m未満 … 3人(25、27、28)
30m以上35m未満 … 2人(31、34)
合計 … 10人
度数分布表をグラフに表すと、データのちらばりのようすがひと目でわかります。区間ごとの度数を、長方形の柱(はしら)を間をあけずにならべてかいたグラフを、柱状(ちゅうじょう)グラフ、またはヒストグラムといいます。
ぼうグラフは「りんごの数」「みかんの数」のように、はなればなれの項目(こうもく)をくらべるので、ぼうとぼうの間をあけてかきます。いっぽう柱状グラフは、「15m以上20m未満」「20m以上25m未満」…と区間がとぎれずに続いているので、柱と柱の間をあけずにくっつけてかきます。ここが2つのグラフの大きなちがいです。
代表値 ― 平均値・中央値・最頻値
データ全体の特ちょうを、たった1つの数で代表して表すことがあります。この数を代表値(だいひょうち)といいます。代表値には、おもに平均値(へいきんち)・中央値(ちゅうおうち)・最頻値(さいひんち)の3つがあります。
つぎのデータで考えてみましょう。6年1組の10人が、10点満点の計算テストを受けた結果です(単位は点)。
6、8、7、6、9、7、7、10、8、7
このようなデータは、数直線の上に、データ1つを点(ドット)1つで表してならべると見やすくなります。これをドットプロットといいます。同じ値がいくつもあるときは、点をたてに積み上げてかきます。点がいちばん高く積み上がったところが、いちばん多く出てくる値です。
平均値はよく使われる代表値ですが、ほかの値からかけはなれて大きい(または小さい)値が1つあるだけで、大きく動いてしまうという弱点があります。たとえば、ほとんどの人が7点前後でも、0点の人が1人いると平均値はぐっと下がります。そんなときは、中央値や最頻値のほうがデータ全体のようすをよく表すことがあります。
「どの代表値を使うとデータの特ちょうがうまく伝わるか」を考えて選ぶことが大切です。
ならべ方 ― 落ちや重なりなく数える
ここからは、「ならべ方や選び方が全部で何通りあるか」という、場合の数(ばあいのかず)の勉強です。
たとえば、あかりさん(A)、ばんりさん(B)、ちなつさん(C)の3人がリレーで走るじゅん番は、何通りあるでしょうか。思いつくままに書き出すと、数えもらしたり(落ち)、同じものを2回数えたり(重なり)しがちです。そこで、「先頭を決めてから、じゅんによく整理して書き出す」のがコツです。
先頭がAのとき … A-B-C、A-C-B の2通り
先頭がBのとき … B-A-C、B-C-A の2通り
先頭がCのとき … C-A-B、C-B-A の2通り
どの先頭からも2通りずつできるので、全部で で、6通りです。
このように、「まず先頭を決める → つぎに2番めを決める → …」と枝分かれのようすを図にかいたものを、樹形図(じゅけいず)といいます。木が枝を広げるように、場合がどんどん分かれていくからです。樹形図をかくと、落ちも重なりもなく、すべての場合を数え上げることができます。
組み合わせ ― ならべ方とのちがい
こんどは、A、B、C、D の4チームの中から、試合をする2チームを選ぶ場合を考えます。
ここで大事なのは、「AとBの試合」と「BとAの試合」は同じ1つの試合だ、ということです。ならべ方ではA-BとB-Aはちがうものとして数えましたが、選ぶだけでじゅん番を考えないときは、同じものとして1回だけ数えます。このような選び方を組み合わせといいます。
問題を読んだら、まず「じゅん番を考えるのか、考えないのか」をはっきりさせましょう。リレーの走るじゅん番や、3けたの整数づくりは「ならべ方」。代表を2人選ぶ、対戦する2チームを選ぶ、といったものは「組み合わせ」です。ここを見分けられれば、場合の数はこわくありません。