Article(本文)


2011/03/14 平均値の平均値

【緒言】 いったい何が問題を喚起したのか?

先日、何だかよくわかりませんが、「世界の一人あたりの穀物消費量」と、「地域別の一人あたりの穀物消費量」を計算していたときのことです。

「世界の一人あたりの穀物消費量」は「世界の穀物総生産量/世界人口」で求まります。そして、「地域別の一人あたりの消費量」というのも、例えば東アジアならば「東アジアの穀物生産量/東アジア人口」で求まりますので このようにして、東アジア、西アジア、ヨーロッパ等の各地域に関して「地域別の一人あたりの穀物消費量」を算出することができます。そこまではよかったのです。

この後、各地域の「地域別の一人あたりの穀物消費量」の平均値を計算すれば、世界平均になるだろうと素朴に思っていたのですが・・・あれ?どうも値がおかしい。なんだか「世界の一人あたりの穀物消費量」とズレるんですね。

ここでまさに生まれてはじめて、あるデータ系列の平均値と、そのデータ系列を分割して作った各グループの平均値の平均値が一致しないことに気が付いたのですね(←遅い!!)。 もう少し具体的に考えてみましょう。データ系列A{2,4,6,8,10}があったとしてこれをGroup1{2,4,6}、Group2{8,10}に分割したとします。データ系列Aの平均値は6。Group1とGroup2の平均値はそれぞれ4、9となります。ここにおいて、Group1とGroup2の平均値は6.5(≠6)となり、データ系列Aの平均値とは一致しないのですね。

そういったわけで、この洞察をもう少し一般的に数学的に記述して見ようと思い、いそいそと計算を始めたのでした。

【証明】 あるデータ系列の平均値と、そのデータ系列を分割して作った各グループの平均値の平均値は一般には一致しない。

以下で証明過程を示します。暇な方は是非追証明してみてください。

平均値の平均値

数学は一般的に物事を記述する場合には恐ろしくクリアに条件を教えてくれますね☆どうやら、あるデータ系列の平均値とそのデータ系列を分割して作った各グループの平均値の平均値が一致する特殊解が存在していて、それは、各グループの要素数が均等な場合に限られるようです。

かくのごとくして謎は解けました。めでたしめでたし。


Article 一覧へ

このページのトップへ