gkt-horizontal-line

<1年p.242>

ふりかえり 〜算数から数学へ〜

【ドットプロット】

上のようなグラフを,ドットプロットという。

 

【階級】

「5m以上10m未満」などのように分けた区間を階級という。

 

【階級の幅】

5mなどのような区間の大きさを,階級の幅という。

 

【度数】

階級ごとに数えたデータの個数を階級の度数という。

 

【度数分布表】

階級や度数でデータの散らばりのようすを表している表を,度数分布表という。

 

【柱状グラフ】

度数分布表を使って,階級の幅を横,度数を縦とする長方形を順に並べてかいたグラフを柱状グラフという。

 

【平均値】

データの値の合計をデータの個数でわった値を,平均値という。

 

【最頻値】

データの中で,もっとも多く現れた値を最頻値という。

 

【中央値】

データを大きさの順に並べかえたときに,ちょうど真ん中に位置する値のことを中央値という。

 

【代表値】

平均値や,最頻値,中央値のように,データを代表する値のことを,代表値という。

1組のソフトボール投げの記録

[mathjax]\(\begin{array}{|c|c|c|} \hline \text{階級(m)}&\text{人数(人)}\\ \hline ^{\text{以上} \quad \text{未満} }& \\ 5 〜10 & 3\\10 〜15 & 3\\15 〜20 & 9\\ 20 〜25 & 6\\ 25 〜30 & 5\\ 30 〜35 & 8\\ 35 〜40 & 3\\40 〜45 & 2\\ 45 〜50 & 1\\ \hline \text{計} & 40\\ \hline \end{array}\)

調べたいことによって,使う表やグラフを変えて考えたね。

avatar

いろいろな表やグラフを使うと,データをまとめることができたね。

avatar

gkt-horizontal-line

<1年p.243>

7章 Chapter 7 データの活用

1節 データの傾向の調べ方
2節 データの活用

アッ!

ヨッ!

拓真さんは,鉛筆を途中で受け止められて,反応が速かったね。みんなの反応の速さを調べてみたいな。

avatar

? 身のまわりのデータの傾向は

どんな方法で調べられるかな?

※必要に応じて,電卓を使いましょう。

gkt-horizontal-line

<1年p.244>

1節 データの傾向の調べ方

反応の速さはどのくらいかな?

美月さんは,拓真さんが机の上から落ちた鉛筆をつかみとるのを見て,どのくらいの速さで反応できるのかを知りたいと考えました。そこで,みんなの反応の速さを知るために,落下する定規を使った「ルーラーキャッチ」という実験で,つかんだ位置を調べることにしました。つかんだ位置が短い方が,反応が速いことになります。

ルーラーキャッチ
2人1組で行う。

1人は指の間に50cm定規を構える。
1人は机の上に腕を置き,人差し指と親指を[mathjax]\(90^{\circ}\)に開く。
親指の上部を,定規の0の目盛りの位置に合わせる。

号令のあと,10秒以内に定規を落とす。
落下している定規をキャッチして,つかんだ親指の上部の位置を記録とする。

gkt-horizontal-line

<1年p.245>

【1】 美月さんの学校のクラスA組,B組でルーラーキャッチを行ったところ,それぞれの組の記録は次のようになりました。

A 組(単位:cm)

[mathjax]\(\bbox[white, 8pt, border: 1px solid black]{\begin{array}{ccc} 24.3 & 20.1 & 18.6 & 14.5 & 21.6 & 26.7 & 18.6 & 10.4 & 20.0\\ 29.3 & 24.3 & 22.4 & 19.8 & 27.0 & 20.4 & 26.7 & 15.8 & 24.3\\ 28.5 & 19.2 & 17.7 & 29.0 & 31.8 & 24.9 & 22.7 & 30.2 & 12.9\\ 27.2 & 15.0 & 23.0 & 27.2\end{array}}\)

B 組(単位:cm)

[mathjax]\(\bbox[white, 8pt, border: 1px solid black]{\begin{array}{ccc} 26.4 & 29.4 & 20.5 & 21.5 & 25.0 & 19.7 & 20.5 & 23.9 & 21.5\\ 21.1 & 26.6 & 31.9 & 20.2 & 17.2 & 19.4 & 26.5 & 23.9 & 31.9\\ 19.0 & 17.6 & 19.8 & 36.9 & 17.1 & 18.6 & 15.4 & 23.9 & 19.9\\ 18.4 & 27.0 & 11.0 & 22.4 \end{array}}\)

A組とB組では,どちらの組の方が反応が速いといえるかを調べます。どんなことを調べればよいか話し合いましょう。

クラスの平均値を比べればいいよ。

中央値を比べる方法もあるね。

平均値や中央値のような1つの値だけで比べていいのかな。

どのくらいの記録の人が多いのかな。

次の課題へ!
2つの集団のデータを比べるには,どのようなことを調べればいいのかな?
P.246

gkt-horizontal-line

<1年p.246>

1 データの整理

Q  Question

右の表は,前ページのA組, B組のルーラーキャッチのデータの値を,短い順に示したものです。2つのクラスのデータを比べるには,どのような比べ方があるか話し合ってみましょう。

見方・考え方 

小学校のときと同じように比べられるかな。

avatar

小学校では,平均値や最頻値,中央値で比べたよ。

散らばりのようすを調べるために,表やグラフで表せないかな。

avatar

ふりかえり 小学校6年

[mathjax]\(\textsf{平均値}=\dfrac{\textsf{データの値の合計}}{\textsf{データの総数}}\)

最頻値…データの中でもっとも多く出てくる値

中央値…データを大きさの順に並べたとき,中央にくる値

代表値…平均値や最頻値,中央値のように,データを代表する値

表1 ルーラーキャッチのデータ(cm)

[mathjax]\(\begin{array}{|r|c|c|} \hline \text{順番} & A \text{組} & B \text{組}\\ \hline 1 & 10.4 & 11.0\\ \hline 2 & 12.9 & 15.4\\ \hline 3 & 14.5 & 17.1\\ \hline 4 & 15.0 & 17.2\\ \hline 5 & 15.8 & 17.6\\ \hline 6 & 17.7 & 18.4\\ \hline 7 & 18.6 & 18.6\\ \hline 8 & 18.6 & 19.0\\ \hline 9 & 19.2&19.4\\ \hline 10 & 19.8 & 19.7\\ \hline 11 & 20.0 & 19.8\\ \hline 12 & 20.1 & 19.9\\ \hline 13 & 20.4 & 20.2\\ \hline 14 & 21.6 & 20.5\\ \hline 15 & 22.4 & 20.5\\ \hline 16 & 22.7 & 21.1\\ \hline 17 & 23.0 & 21.5\\ \hline 18 & 24.3 & 21.5\\ \hline 19 & 24.3 & 22.4\\ \hline 20 & 24.3 & 23.9\\ \hline 21 & 24.9 & 23.9\\ \hline 22 & 26.7 & 23.9\\ \hline 23 & 26.7 & 25.0\\ \hline 24 & 27.0 & 26.4\\ \hline 25 & 27.2 & 26.5\\ \hline 26 & 27.2 & 26.6\\ \hline 27 & 28.5 & 27.0\\ \hline 28 & 29.0 & 29.4\\ \hline 29 & 29.3 & 31.9\\ \hline 30 & 30.2 & 31.9\\ \hline 31 & 31.8 & 36.9\\ \hline \end{array}\)

 目標 ▷ 2つの集団のデータをどのように比べればよいか考えよう。

 問 1  表1から,A組,B組のルーラーキャッチのデータの平均値,中央値を求めなさい。また, A組とB組の平均値や中央値を比べると,どちらの組の方が反応が速いといえますか。

代表値だけで比べていいのかな。

avatar

表計算ソフトを使ってみよう

データの並べかえ P.273

代表値などの求め方 P.274

gkt-horizontal-line

<1年p.247>

次に,全体の散らばりのようすを比べてみよう。

 データの範囲

データを比べるには,代表値だけでは見えない「データの散らばり」のようすを見ることが大切である。

前ページの表1から, A組の値の 最大値 は[mathjax]\(31.8\) cm, 最小値は[mathjax]\(10.4\) cm であることがわかる。

データの散らばりの程度を表すのに,データの最大値と最小値の差を用いることがある。この値を,そのデータの 範囲 またはレンジ という。

A組のデータの範囲は,

[mathjax]\(31.8-10.4=21.4\)

より,[mathjax]\(21.4\) cmである。

 問 2  前ページの表1で,B組のデータの最大値,最小値,範囲を求めなさい。また,それぞれの値をA組と比べると,どんなことがわかりますか。

このようなデータの散らばりのようすを, 分布 という。

gkt-horizontal-line

その他の代表値 Tea Break

平均値,最頻値,中央値のほかに,次のような代表値もあります。

● 調整平均(トリム平均)

データを大きさの順に並べたとき,小さい方からa個,大きい方からa個取り除いた残りの平均値のことで,データの中に極端にかけ離れた値があった場合に,その影響を取り除くためのものです。
オリンピックの体操競技の採点などでは,この調整平均が用いられています。

【例】

gkt-horizontal-line

<1年p.248>

分布のようすを表やグラフで表してみよう。

 度数分布表

246ページの表1をもとにして,小学校で学んだように, A組のデータを5 cm ずつに区切り,その間に入る人数を調べると,表2のようになる。
表2で,「10 cm 以上15 cm 未満」などのように分けた区間を階級,区間の大きさを階級の幅,階級の中央の値を 階級値 という。たとえば,「10 cm 以上15 cm 未満」の階級の階級値は[mathjax]\(12.5\) cm である。
また,各階級に入っているデータの個数を,その階級の度数という。
このように,階級と度数でデータの分布を表している表を度数分布表という。

表2 ルーラーキャッチのデータ

 問 3  表2について,次の問いに答えなさい。

⑴ 246ページの表1をもとにして, B組のデータについて各階級の度数を調べ,表2に書き入れなさい。
⑵ それぞれのクラスで,度数がもっとも多い階級と,その階級値をいいなさい。

度数分布表では,度数がもっとも多い階級の階級値を最頻値とする。ふつう,代表値として最頻値を用いる場合は,データの中でもっとも多く出てくる値より,度数がもっとも多い階級の階級値にすることが多い。
たとえば,表2から,A組の記録の最頻値を求めると,度数がもっとも多い階級は「20 cm 以上25 cm未満」であるから,最頻値はその階級値である[mathjax]\(22.5\) cmとなる。

 問 4  表2をもとにして,B組の記録の最頻値を求めなさい。

表計算ソフトを使ってみよう
度数分布表P.273

gkt-horizontal-line

<1年p.249>

 ヒストグラム・度数折れ線

度数分布表を用いて,階級の幅を横,度数を縦とする長方形を順に並べてかいたグラフをヒストグラム または柱状グラフという。
前ページの表2の A組のルーラーキャッチのデータをヒストグラムに表すと,図1のようになる。このように,度数分布表からヒストグラムをつくると,データの分布が一目でわかるようになる。

柱状グラフとヒストグラムは,同じものだね。

avatar

図1 A組のルーラーキャッチのデータ
図2 B組のルーラーキャッチのデータ

 問 5  前ページの表2をもとにして, B組のルーラーキャッチのデータのヒストグラムを,図2にかき入れなさい。また,2つのクラスのデータの分布を比べ,気づいたことをいいなさい。

 問 6  階級の幅を3cmにとったA組とB組のルーラーキャッチのデータを,246ページの表1をもとにして,各階級の度数を調べ,表3に書き入れなさい。

表3 ルーラーキャッチのデータ
gkt-horizontal-line

<1年p.250>

 問 7  前ページの表3をもとにして,A組とB組のルーラーキャッチのヒストグラムを,次の図3,4にかき入れなさい。

図3 A組のルーラーキャッチのデータ
図4 B組のルーラーキャッチのデータ

 問 8  前ページの図1と図3のヒストグラムから読み取れることがらにどんなちがいがありますか。また,図2と図4ではどうですか。

同じデータを用いても,階級の幅を変えてヒストグラムをかくと,データの特徴の見え方や読み取れることがらが異なる場合がある。データの分布を調べるときは,階級の幅の異なるヒストグラムを何通りかつくって調べることも大切である。

図3のヒストグラムで,各長方形の上の辺の中点をとって順に結ぶと,図5のような折れ線グラフがかける。

このようにしてかいた折れ線グラフを,度数折れ線または 度数分布多角形 という。

ヒストグラムから度数折れ線をかくときは,両端の階級の左右に度数0の階級があるとみなして,横軸の上に点をとって結ぶ。

図5 A組のルーラーキャッチのデータ

表計算ソフトを使ってみよう
グラフの作成 P.274

gkt-horizontal-line

<1年p.251>

 問 9  前ページの問7でつくったヒストグラムをもとにして,前ページの図4に度数折れ線をかき入れなさい。また,前ページの図5と図4の度数折れ線を比べ,気づいたことを話し合いなさい。

 問 10  これまで調べたことから,A組とB組のルーラーキャッチのデータを比べると,どちらの組の方が反応が速いといえるか話し合いなさい。

 問 11  表4は,1年生のルーラーキャッチのデータを,度数分布表に表したものです。次の図6に,ヒストグラムと度数折れ線をかき入れなさい。

[mathjax]\(\begin{array}{|c|c|c|}\hline\text{階級(cm)} &\text{度数(人)}\\ \hline ^{\text{以上}} \quad ^{\text{未満}} & \\ 10 〜 13&6\\ 13 〜16&8\\ 16 〜19&26\\ 19 〜22&38\\ 22 〜25&18\\ 25 〜28&15\\ 28 〜31&9\\ 31 〜34&5\\ 34 〜37&1\\ \hline \text{計}&126\\ \hline \end{array}\)

表4 1年生のルーラーキャッチのデータ

図6 1年生のルーラーキャッチのデータ
gkt-horizontal-line

分布のかたよりと代表値 Tea Break

データの分布のかたよりによって,そのヒストグラムや度数折れ線は,いろいろな形になります。次の図のような3つのタイプに分けたとき,それぞれの代表値の位置は図に示したようになります。

図ア 山が右にかたよった分布
図イ 山が中央にある分布
図ウ 山が左にかたよった分布

このように,ヒストグラムの形から,目的に応じてどの代表値が適しているかを考えることも大切なことです。

gkt-horizontal-line

<1年p.252>

 説明する力をつけよう 

 問 12  次の図は,東京の1920年と2020年の8月の日ごとの最高気温をヒストグラムに表したものです。美月さんたちのグループは,このヒストグラムから分析したことをクラスで発表しようと考えています。

美月さんは,2つのヒストグラムから,次のことを読み取りました。

「1920年より2020年の方が,最高気温の高い日が多い傾向がある。」

この読み取ったことを,スライドにまとめて発表しようと思います。

図7 東京の1920年8月の日ごとの最高気温
図8 東京の2020年8月の日ごとの最高気温

⑴ どのようなグラフや理由をかけばよいか話し合いなさい。

avatar

ヒストグラムを横に並べると,ちがいが見えにくいね。グラフを重ねたらどうかな。

重ねるなら,度数折れ線の方が見やすいよ。あと,理由はどう書けばいいかな。

avatar

⑵ 次のような発表用のスライドを完成させなさい。

[読み取ったこと]

1920年より2020年の方が,最高気温の高い日が多い傾向がある。

[理由]

どんなことがわかったかな

2つの集団のデータを度数分布表やヒストグラムに表すと,そのデータの傾向を比べることができます。

次の課題へ!
全体の数が同じ複数の集団のデータは比べやすいけど,全体の数がちがう場合も,同じように比べられるのかな。
P.253