物事を現実の問題につなげるということ

物事を現実の問題に結びつける力がないなあと最近感じる。何か面白いなあと思っても、面白い止まりで、だからどうだとか、何ができるとかいうところまでたどり着いていない。とあるブログで紹介されていたこの動画を見て、改めてそんなことを考えた。

英語字幕が欲しい人は、TEDのページを見ればいい。
http://www.ted.com/talks/peter_donnelly_shows_how_stats_fool_juries.html
日本語字幕がないので、まあがんばれ。序盤のジョークが面白い。

  • コイントスをひたすらして、表をH(Head)、裏をT(Tail)としたシーケンスを考えたとき、HTHとなる部分が出てくるのは平均的に何回目かを調べ、HTTとなる部分が出てくるのは平均的に何回目かも調べるとする。統計的にどっちが多いか?同じか?
  • 病気かどうかが99%の確率で判定できる検査方法があるとして、ある人に対して病気だという判定が出たとき、その人が病気である確率は何%か?

この2問。答は動画を見ればわかる。一問目の答はブログ記事を読んでやっと理解できた。
http://www.peetm.com/blog/?p=395
問題自体もまあ面白いんだけど、そこから後の論理展開がすごいと思った。

  • コイントスのシーケンスはHとTだけだが、ACTGのように4つにすれば遺伝子の配列に応用できる。どんな配列になるか、どこで切れるかの統計的な情報から遺伝病に対する理解が深まるのではないか

コイントスも遺伝子配列も抽象化して考えれば一緒ということか。こういう頭の使い方をまねていきたいと思った。
2問目は、判定すべき病気がどのくらいpopularなのか、どのくらいrareなのかという条件がないと意味がないよという話を動画でしている。そして、動画のタイトルである"Peter Donnelly shows how stats fool juries"につながる話が始まる。
Sally Clarkさんという人がイギリスにいて、不幸にも生まれて一週間で息子をなくし、2人目も同じように亡くしたそうだ。原因はよくわからずcot deathとなったが、Sally Clarkさんは、2人の子供を殺したということで逮捕されたとのこと。そのcot deathというのが、こういう家庭環境だと8534人に一人しか起きず、それが二人も続けてとなると8534×8534=約7300万人に1人となり、統計的にあり得ないから殺しただろということらしい。ひどい話だけど、本当にあった話。
でもこの計算はおかしいよとのこと。8534×8534とやっていいのは、2つの事象が独立な場合だけ。兄弟なんだから遺伝的に近いわけで、この2つが独立だとは到底いいがたい。環境的なことが問題ではなく、遺伝的なことが問題であるならば、一人がなくなったときにもう一人がなくなる確率は当然高くなる。そんなわけで、誤った統計の使い方をしてはいけませんよー、ちゃんちゃん。という動画。
予算獲得関連で慣れているのかもしれないけど、自分たちの研究がこんな風に役立つという説明がうまいなあと思った。自己満足ではなく抽象的に将来がどうのこうのでもなく、具体的にわかりやすく意義を述べているのが素晴らしいと思った。自分なりにbetter placeを追求していくことを論理的に説明することが今の自分には足りていないし、そういう考え方を心がけたい。大切なのはどの道具を使うかではなく、何をするかであり、どのルートを辿るかではなく、どの山に登るかである。なんとなく面白ければいい人はそれでいいけど、自分はもっと先へ進みたいので、それを言葉と行動で示していこうと思う。