「箱ひげ図」、聞いたことはあるけどどんなグラフかわからない?
見たことはあるけど、見方がわからない方も多いのではないでしょうか?
箱ひげ図と見方とあわせてパーセントタイルの考え方も紹介していきます。
箱ひげ図
箱ひげ図は上の図にもある箱とひげで表したものとなります。
この箱やひげの部分でデータの分布を把握することができます。
パーセントタイル
箱ひげ図の見るにあたって、一緒に覚えておきたいのがパーセントタイルです。
パーセントタイルはデータを小さい順で並べたとき、あるデータが小さい方から見て何%の位置にあるかを表したものとになります。
たとえば上記の85から100の数値データがあるときに、20パーセントタイルはどこか?といったときに数値を並べ20パーセントタイルは57付近になります。
データは均等にあるわけではなく、ばらつきがあるのでその分布をおおまかにとらえることができるのがパーセントタイルです。
0パーセントタイルは最小値、100パーセントタイルは最大値となります。
このパーセントタイルで覚えておきたいのが25パーセントタイルはごとの値です。
- 25パーセントタイル → 第1四分位
- 50パーセントタイル → 第2四分位
- 75パーセントタイル → 第3四分位
こちらの表記がそれぞれ箱ひげ図にでてくるので覚えておきましょう。
箱ひげ図の見方
パーセントタイルを踏まえたうえで箱ひげ図を見ていきましょう。
まずはひげの部分を見ていきましょう。
箱の下側についているひげが最小値。
箱の上側についているひげが最大値。
外れ値を入れていますが、値がなければひげの部分が0パーセントタイル(最小値)、100パーセントタイル(最大値)となります。
つづいて箱の部分です。
箱の下底は第1四分位。
箱の中央の線が第2四分位(中央値)。
箱の上底は第3四分位。
を表しています。
この箱の部分でデータの50%の分布幅を見ることができます。
ここまでは箱やひげから値の読みとり方を紹介してきました。
ここからは軸の見方について解説してきます。
上図では最小値と第1四分位の幅が小さいことがわかります。
全データの25%(最小値から25パーセントタイルまでのデータ)がこの範囲内の値で集中していることになります。
一方で第3四分位から最大値までの幅は大きいことがわかります。
この区間の値は広い範囲で分布しているということがわかります。
このようにどこの区間にデータが集中しているかといった情報を軸の長さから見て取ることができます。
まとめ:箱ひげ図の見方
箱ひげ図の見方やパーセントタイルについて紹介しました。
箱ひげ図からはデータのばらつき、中央値・最大値・最小値といった情報を読み取ることができます。
箱ひげ図以外もさまざまなチャートがあります。
こちらで紹介しているので気になる方はご覧ください。