執筆者:工藤琢磨(Z会進学教室 八王子教室/社会科)
記事更新日:2022年06月24日
相関関係と因果関係の違いって何? 平均値より中央値の理由は? ~小学6年生に教えたい統計の世界~
こんにちは。Z会八王子教室教室長の工藤です。ふだん高校受験の指導をしていて「統計グラフが読めない、使いこなせない」という中学生に多く出会います。
一方、公立一貫校受検の6年生を指導していると統計グラフの読解や計算は徹底的に鍛えていきますので、ここは中学入学後に大きな差になっていきます。
中学受験をする/しないに関わらず小学生の皆さんにはもっと統計に強くなってほしいと思いますが、統計というとなんだか難しそう、色んな用語があってよくわからないという人もいるでしょう。そこで今回は統計にまつわる言葉や考え方を幾つかご紹介します。
円グラフと棒グラフの使い分け、できてますか?
「統計」とは観察・実験・調査などによって集めたデータを整理、分析したもののことで、統計を使いこなせると、自分が今いる集団や社会のことがわかったり、未来を予測したりすることができます。「来週の試合で勝ちたい」「将来大成功したい」という人を助けてくれるのが、統計です!
そんな統計について一から知ることができる、皆さんに役立ちそうな本を見つけました。Z会から出ている99%の小学生は気づいていない!?シリーズの『統計グラフのカラクリ』という本です。今回の記事は、この本の中にも登場する話も引用しながらお伝えします。
統計を使いこなすためには、まず色んな表やグラフの性質や使い方をマスターしましょう。たとえば円グラフ、棒グラフ、折れ線グラフ…様々な種類のグラフ。正確に使い分けができていますか?
棒グラフは、棒の長さでパッと見て数量の大小が比べられます。折れ線グラフは量の変化がわかります。ですから、たとえば「月ごとの平均気温とアイスの販売量との関連を知りたい」といったときに、気温を折れ線グラフで、アイスの販売量を棒グラフで表し、一つにまとめていけば、「●度以下になると販売量が減る」といった2つの関連を目で見て理解することができます。
棒グラフと似たようなもので帯グラフがあります。帯グラフは、あるトピック(たとえばりんごの生産量)についていくつかの項目(生産量が上位の都道府県)を割合で表したもので、どの項目の割合が高いのかわかるほか、「10年ごと」「国別」など、複数の帯グラフを並べることで、同じ項目における変化や比較ができます。
帯グラフや円グラフを見るときには、割合だけが表示されていることに注意しましょう。たとえば、次のような説明は正しいですか?
「帯グラフを見ると、1990年は10%だったZ県のりんごの生産量が2020年では20%になっているので、りんごの生産量は増えていることがわかる。」
これは、必ずしも正しいとは言えないですよね。なぜなら、全体の生産量(総数)がわからないので、たとえば以下のような場合、生産量はむしろ減っています。
1990年:全国の生産量50トンに対してZ県は10%を占めている
→Z県の生産量は50×0.1=5トン
2020年:全国の生産量10トンに対してZ県は20%を占めている
→Z県の生産量は10×0.2=2トン
平均値と中央値、「まんなか」はどっち?
統計を使いこなすためには、グラフが何を表しているか正確に読み取ることに加え、その用語が示す事柄を正確に理解する必要があります。
例えば「平均」という言葉をよく耳にすると思います。「テストの平均点」と聞いて、皆さんはどんなイメージを浮かべますか?「みんなの中のだいたい真ん中」「一番多くの人がとった点数」これはいずれも正確な表現ではありません。
「いくつかの数や量を等しい大きさになるようにならした値」が平均値です。
「データの値を大きさの順に並べたときの真ん中の値」を中央値といい、
「データの中で最も多く出てくる値」を最頻値(さいひんち)と言います。
「平均値」を知ると、例えばテストの平均点を知れば、みんなの中で自分の点数が高いのか低いのかという目安が分かりますね。でも、いつも必ずしも常に「平均値」を見た方が良いとは限りません。例えばクラス全員の毎月のお小遣い金額を調べたとき、以下のような場合ではどうでしょう。
Aさん:1000円 Bさん:1500円 Cさん:800円 Dさん:1000円
Eさん:1200円 Fさん:750円 Gさん:1100円 Hさん:20000円
(小学生の皆さん、画面の前で実際に表を書き、計算してみましょう)
一人だけ、金額が明らかに高い人がいますね。この8人の平均値を求めると、約3420円と、ほか7人の金額よりも2~4倍高い金額になってしまいます。このように、他と比べてとても大きな値やとても小さな値を「外れ値」と言い、外れ値があると平均値に大きな影響を及ぼします。そういう場合は中央値や最頻値を求めた方がよさそうです。8人の中央値は1050円ですから、この方が「みんなの金額」という感覚に近い数字になりますね。
相関関係と因果関係の違いって何?
先ほど「月ごとの平均気温とアイスの販売量との関連を知りたい」ということで、棒グラフと折れ線グラフの融合の話をしました。気温とアイスの販売にはどのようなつながりがあるでしょうか。
たとえば、「気温が高い月=アイスがたくさん売れる」「気温が低い月=アイスがあまり売れない」ということが言える場合、気温とアイスの販売量には「相関関係」があると言えます。そして、これとよく似た「因果関係」という言葉は「原因」と「結果」がはっきりしている場合に使える言葉です。仮に「気温が上がれば上がるほどアイスの販売量が増える」ことがいえる場合、これは「因果関係」と言えます。
このとき注意したいのは、「因果関係」は一方通行である、ということです。「アイスの販売量が増えれば増えるほど、気温が上がる」…これは正しいでしょうか?明らかにおかしいですよね。
こうした「正しい見方」に気を付けていないと、間違って説明してしまったり、わざと誤って説明しているものにだまされてしまうおそれがあります。Z会の「99%シリーズ」『統計グラフのカラクリ』には、このほかにも「質的データと量的データの違い」、「びっくりする棒グラフに注意」、「代表値のワナ」など、統計データを使いこなす方法がたくさん載っています。興味を持った人は書店で探してみてくださいね。
99%の小学生は気付いていない?
『統計グラフのカラクリ』は、Z会から出ている「99%シリーズ」のラインナップにあります。教科書では学べない、これから生きていくために大切な力です。気になった人はぜひ、『統計グラフのカラクリ』を本屋さんで買って読んでみてください。夏休みの自由研究や課題学習の際にも、ぜひ統計を調べてみましょう!
❖書籍紹介リンク
https://www.zkai.co.jp/books/guide/id-5406/
「99%シリーズ」特設サイトURL
https://www.zkai.co.jp/books/99series/
この記事の著者
工藤琢磨(くどう・たくま)
Z会進学教室で中学生の社会科を担当。公立中高一貫校受検の指導も得意。新宿教室の副教室長を経て、2018年の八王子教室開校に伴い、教室長として着任。八王子教室のWebページにて【はち便り】を月1回連載配信中。