2016年08月28日

歪度と尖度 / データ分析の解説

さて、データの分布の一つである正規分布についてみてきましたが、分布の左右のバランスを表すのを歪度、上下のバランスを表すのを尖度といいます。そして歪度も尖度も"0"の時が正規分布になります。
ので、歪度と尖度の値を調べれば正規分布かどうかを判断することができます。

“歪度(わいど/skewness)”はグラフのひずみつまり左右対称ではない程度を表します。歪度が0より大きいと左偏り、0より小さいと右偏り、0の時左右対称になって正規分布である目安になります。
“尖度(せんど/Kurtosis)”は読んで字のごとくグラフの尖り具合ということなのですが、むしろ裾の形の厚さというか、“裾の重み”と言われる場合もあります。尖度が大きいと尖ったグラフつまり中心部分が高く裾が薄くて広いグラフになって、尖度が小さいとなだらかな高さが低く裾は厚くて短いグラフになります。この尖度が“0”ならば、正規分布である目安にまります。統計学的な定義のしかたによって“3”が正規分布になる尖度もありますが、Excelの場合は“0”です。
20161010-01.jpg

ではそれぞれの式をみてみまよう。
歪度は、
20161010-02.jpg

尖度は、
20161010-03.jpg

ちなみに"(xi-xチルダ)/s"、つまり"(データ値-平均値)÷標準偏差"を"z値(zスコア・z得点)"と言って、各データの平均値とのばらつきが標準偏差の何倍か(いわゆる「何シグマ」)を表す値です。
歪度はその3乗の平均値、尖度はその4乗の平均値-3ということです。

Excel では、歪度は"SKEW関数"、尖度は"KURT関数"で求めることができます。


バックナンバー
信頼区間と標本誤差についてまとめてみた
確率と正規分布の確率密度についてまとめてみた
コイン投げ(二項分布と中心極限定理の検証)
正規分布についてまとめてみた


関連ページ
統計分析の基本中の基本、度数分布表についてまとめてみた
数値データの分布をみるヒストグラムについてまとめてみた
データ分析の解説/メニュー


ラベル:尖度 歪度
posted by haku1569 at 13:59| データ分析の解説 | このブログの読者になる | 更新情報をチェックする
' + adSrc + '<' + '/body>'); d.close(); } loadAd(); window.setTimeout(loadAd, reloadSec * 1000); window.setTimeout(function() {adDiv.style.display = 'none'}, hideSec * 1000); }); }