2015年05月06日

箱ひげ図についてまとめてみた /データ分析の解説

データの分布の様子を見える化して確認する為にまずヒストグラムを描いてみるのが大切なのですが、比較するデータのグループがたくさんある時はいちいちヒストグラムを描くのはめんどくさい。。。
そこで便利なのが"箱ひげ図(Box Plot)"です。

箱ひげ図は"四分位数(点)"から作る事ができます。
"最小値"、"第1四分位数"(25%点)、"第2四分位数"(中央値)、"第3四分位数"(75%点)、"最大値"から作成します。
20150506_01.jpg

複数のデータのグループの分布を比較する時は縦型の箱ひげ図を使うと便利です。
20150506_02.jpg

箱ひげ図をみてヒストグラムをイメージできるようになるのが肝だ。
20150506_03.jpg

箱ひげ図では単峰性(山が1つ)か多峰性(山が2つ以上)かどうかは分かりません。
箱が長くてひげが短いような形の場合はヒストグラムを描いて多峰性かどうかの確認が必要です。
20150506_04.jpg

では、次回はこの箱ひげ図をExcelのグラフで実際に描いてみましょう。


バックナンバー
1.平均値と代表値(特性値)
2.中央値についてまとめてみた(平均値と何がちがう?)
3.四分位点、四分位範囲、四分位偏差についてまとめてみた

関連ページ
統計分析の基本中の基本、度数分布表についてまとめてみた
数値データの分布をみるヒストグラムについてまとめてみた
正規分布について
中央値を求めるMEDIAN関数
データ分析の解説/メニュー
posted by haku1569 at 15:37| データ分析の解説 | このブログの読者になる | 更新情報をチェックする