2014年10月23日

「平均」の難しさ 『統計という名のウソ ― 数字の正体、データのたくらみ』

このブログの読者であれば、一般的な「平均」の計算は分かるだろう。

社長も含めた従業員が100人の会社があるとする。労働者は90人いて年収200万円のブラック、管理職は9人いて年収1000万円、社長は年収1億円とすると、この企業の「平均年収」は370万円になる。企業の90%の社員が年収200万円なのに、平均は370万円になるのだ。こういう場合の平均(相加平均)はあまりあてにならない。

そこで中央値を見ることにする。これは少ないものから順に並べて、真中のものを選ぶのだ。そうすると、この企業の場合、50番目と51番目はいずれも年収200万円だから、中央値は200万円ということになる。これは確かに実情に近い。そのかわり、ここでは搾取している側の年収1000万円と1億円という情報が失われる。

このように、「統計」というのは「まったくの真実」ではなく、「誰が、どんな意図をもって、いかなる基準で選んだものをどういう方法で数え、さらにどうやって提示するか」といったことに大きく左右される。そこには上記のように失われる情報が必ずあるということだ。

統計という名のウソ ― 数字の正体、データのたくらみ

統計に関する良書である、と書くと、なんだか難しそうな本だなぁと思われそうだが、そんなことはない。難しい式や概念はほとんど出てこない。そういう専門書ではなく、統計・数字というものを見る時の心構えのようなものが示されている。

0 件のコメント:

コメントを投稿

コメントへの返信を一時中止しています。
一部エントリでコメント欄に素晴らしいご意見をいただいており、閲覧者の参考にもなると思われるため、コメント欄そのものは残しております。
また、いただいたコメントはすべて読んでおります。