足してはいけない*1

Kmori58さんからご質問の件の:

(id:koiti_yanoさんは聞いたことありますか?)
http://d.hatena.ne.jp/kmori58/20051209/p1

竹内先生が統計学界のボブサップかって件ですか?

まず、質問をする相手を間違っておられます。矢野みたいなインチキ野郎に質問をしてはいけません。矢野なんざ、2ちゃんねるの数学板の「統計スレッド」を見て、「おお、この問題はこう解くのか!!!名無しさんってスゲー」と毎日思っているような人間なのです・・・
(´・ω・`)ショボン

矢野に質問するくらいならば、近所の塀の上を歩いている猫に聞いた方がよほどましです・・・と、とりあえずお断りしておきます。

さて、常識ある人ならば、「身長160、体重52、足して212」なんてことはしません。・・・しないよね?ね?ね?なぜなら単位が違うから。身長は㎝で、体重はkg。足したら・・・意味不明。

「単位が違うものを足すのはマズい」というのはさすがに常識でしょう。しかし、実は単位が同じでも「単純に足したらあまりよくない」事例がある、というのが今回のお話です。

「大学入試で、たとえば国語と数学の配点を100点ずつにして、バランスが取れてる、っていうだろ。でもそれは違うんだ。

国語はあまり点数がバラつかないが、数学はできる人とできない人の差が激しい。つまり、国語と数学の点をそのまま足してしまうと、事実上、数学だけで差がつくから、

数学のできる奴が合格しやすくなってしまうんだ。」

[ネタ元]http://www.nurs.or.jp/~lionfan/mainichi_2005_109.html

100人の人が国語と数学のテストを受けた場合を考えます。偶然にも(不幸にも?)国語のテストは100人全員が60点を取ってしまったとします。反対に数学の場合は0点から100点まで様々な点数の人がいるとします(つまり、数学の場合は点数がかなりバラバラ)。

一人一人の合計点を計算すると
合計点=国語の点数(全員60点)+数学の点数
これを見れば明らかなように、合計点の大小は数学の点数だけで決まってしまいます。なぜならば国語の点数は全員が同じ60点だから。

これが大学の入学試験で、合計点が大きい順に合格させていくとすると・・・数学の点が大きい人から合格します。えーっと、これって数学の実力だけしか試験では試されてないよね?ってことですね。

ここでは非常に極端な例(100人全員が国語で60点を取る)を考えましたが、こんなに極端な例でなくても、例えば「100人全員の国語テストの点数が55点から63点の間に固まってしまった(反対に数学の場合は0点から100点まで様々な点数の人がいる」としても成り立ちます。

・・・何がまずいの?

まずい理由は「実は国語の点数と数学の点数は分散が違う」から、です。

(本日の教訓)単位が同じでも分散が違うデータを単純に足してはいけない

「オレは学校では統計はとらなかったんだ!分散なんて知らねー」とか「分散は知ってるけど、どう対処すりゃいいんだ?」と思った人・・・のための続きは・・・えーーっと・・・*1

*1:矢野はマジで来週、香港で開催される国際学会に行きます。準備が・・・