統計学を拓いた異才たち

本を断裁してスキャンしたとかiPadに入れたとかいろいろ書いたけど、重要なとこはそこじゃなくて、何を読むかである。この本は非常に面白かった。統計の歴史について、主要な人物の描写を通じて理解できるので読んでいて楽しい。

統計学を拓いた異才たち(日経ビジネス人文庫)

統計学を拓いた異才たち(日経ビジネス人文庫)


当時の研究者が抱えていた問題が非常に具体的に記されており、それが次から次へとリレーされていて、少しずつこの分野が進展していくのがわかる。そしてそのトップバッターにカール・ピアソンを持ってきたところが、この本の実に秀逸な点だろう。

生物学の蓄積データを見て、ピアソンは、誤差は測定によるものというより、むしろ観測値そのものが確率分布を持っていることに気づいた。われわれの測定するものが何であろうと、実際にはそれはランダムな散らばりの一部分であり、その確率は分布関数という数学上の関数で表現される。ピアソンは分布関数の族を発見し、自ら「歪んだ分布(skew distributions)」と名づけた。彼の主張によれば、それは科学者がデータ上から見出すだろうと思われるあらゆるタイプの散らばりを表現できた。この族の各分布は四つの数値で識別される。

そしてこれらを表すのが母数(パラメータ)であり、統計の基礎となる。

ピアソンの革命が残したものは、科学の対象となる「こと」は観測可能ではなく、観測値に伴う確率を記述する数学的な分布関数であるという考え方である。

このように確率的な考え方と決定論的な考え方を対比させながら書いていて、新鮮な視点だと思った。

もし極値の分布と通常値の分布がわかっているならば、毎年の最高水位を記録しつづけ、百年に一度の洪水を起こしかねない水位を予測できる。このようにできるのは、年ごとの最高水位の記録があればティペットの分布の母数を推定するのに十分な情報となるからだ。ゆえに、アメリカ陸軍工兵隊は河川の堤防の高さをどのくらいにするかを計算できるし、アメリカ環境保護庁は工場から排出されるガスの最大量を規制する排出基準を設定できる。

こうやってどのような応用に役立つのか書かれていると、具体的にイメージしやすい。グンベル(Emil J. Gumbel)の「極値統計学(Statistics of Extremes)」はなかなか面白そうだな。フィッシャーの「研究者のための統計的方法」も気になるが。それからチェスター・ブリスのエピソードも面白かった。アメリカ農務省で殺虫剤の研究をしていたが、ルーズベルトが大統領に就任したときに財政赤字削減のために解雇され、フィッシャーに連絡を取ってロンドンに行ったが仕事はなく、スターリン粛正期のソ連に行くことになった人物である。

背が高く、痩せた、中西部出身の中流階級のアメリカ人、ノンポリのチェスター・ブリスは、それまで外国語を学んだこともなかったが、着るものだけを詰めた小さなスーツケースを携えて列車でヨーロッパを横断し、レニングラード駅に到着した。

これに比べたら自分なんてぬるいもんだなー。

ブリスが到着するとまもなく、彼を採用した人の上司がモスクワに呼び出された。そして二度と彼の姿を見ることはなかった。一ヶ月後、ブリスを採用した人がモスクワに呼び出され、その帰途に「自殺」した。ブリスの隣の研究室にいた男性は、ある日、急にいなくなり、ラトビアとの国境を越えてロシアを脱出した。
その間にもブリスは研究に取り組み、ロシアの害虫のなかから選んだグループに異なる殺虫剤の組み合わせを与え、プロビット分析でLD−50を算出した。

自殺じゃなくて「自殺」なところが怖い。で、なんでマイペースで実験してるんだ。研究者というのは、これくらいやる人の集まりなのかもしれない。

単独で研究する数学者はきわめて少なかった。もし、あなたが数学者なら、自分のしていることを議論する必要がある。自分の新しいアイデアを他者の批評の前にさらさなければならない。間違いを犯したり、自分にはわからないが他者にとっては明白な、隠された仮定を含んでしまうことはよくあることなのだ。

数学に限らず当てはまりそうな気がする。

エゴン・ピアソンとイェジー・ネイマンとの友情は1928年から33年にかけて交わされた書簡に残されている。この書簡は、一人がアイデアを出せばもう一人がそれに批評を交えるかたちで、いかにして二人の知性が一つの問題に取り組んできたかという、科学の社会学にとって見事な見識をもたらしている。

こういうやり取りというのは、非常に興味深い。この後に出てきたベイズも面白かったが、アンドレイ・ニコラエヴィッチ・コルモゴロフが圧巻としか言い様がない。

コルモゴロフは、どんな分野の仕事も独りで行い、徹底的に再評価させてしまう数学者の一人である。近年の数学者のなかで、これほど広汎な事柄に興味を示すだけでなく、これほど数学に影響を与えている数学者を探すのは難しい。・・・ハーディ(Hardy)は彼のことを三角級数の専門家だと思い、フォン・カルマン(von Karman)は彼を力学の専門家だと思っていた。

こんな人もいたんだな。あとナイチンゲールが凄かった。ナイチンゲールが統計学者であるというのは有名な話だが、ここまで筋金入りだったとは。フローレンス・ナイチンゲール・デイヴィッド(Florence Nightingale David)は、F・N・デイヴィッドの名前で本を10冊出版し、科学学術雑誌に100本以上の論文を発表したそうだ。

「砂漠の中を歩き回って、これらの破片がどこで見つかったかをプロットしたんだ。どこを掘れば貝塚が出てくるか教えてくれよ」って。
考古学者なんて金や銀なんかには目もくれず、壷や皿にしか興味がないわけ。それで、彼から地図を受け取ってその問題について考えてみたの。そうしたら、これがまったくV爆撃機の問題にそっくりなのに気づいたのよ。ここがロンドンだと仮定して、ここに爆弾が落ちたとするでしょう。どこからその爆弾が飛んできたのかを知りたければ、二次元正規分布平面を仮定して主軸を予測できるわけ。それを破片地図に当てはめてみたのよ。異なる問題のあいだに一種の普遍性があるなんて面白いと思わない?実際と違っていたのは、たった六個ほどだったわ。

こういう発言を読むと、違った一面が見られて面白い。また、こうして考古学とV爆撃機を並べて考えているところも、なかなか斬新なものの見方だと思う。そして以前エコ隊でやったフラミンガムの研究も取り上げられている。

1913年の夏の終わりに、ジョージ・W・スネデカーはケンタッキー大学をあとにして、スーツケースにわずかな荷物を詰め込み、アイオワ大学に向かって車を走らせた。そこで数学を教える就職口があることを人づてに聞いたのである。不幸なことに、彼はアイオワの地理にうとかったので、アイオワ大学のあるアイオワシティではなく、アイオワ州立大学のあるアイオワ州エームズに行ってしまった。
「違うよ、数学者なんか募集してないよ」。いったんはこういわれたのだが、アイオワ州立大学は数学的基礎のできていない学生を多く抱えていた。
「では代数学の授業を教えてくれないだろうか」

人生ってそんなものなのかもしれない。

テューキーの豊かな想像力はデータ解析の世界を広く展望し、あらゆる角度から見直した。彼の提案の多くは、やがてコンピュータソフトウェアに取り入れられていくに違いない。彼の二つの発明は既に英語になっている。それはテューキーの造語で、「ビット(bit)」と「ソフトウェア(software)」である。

大量の計算を必要とする統計学の分野ではコンピュータの発達が切望されていたんだろうな。そういうわけで、これだけ計算能力が上がった現在、統計学の応用というのはますます広い範囲に広がって行くんだろうと思う。
それから戦後の日本の産業の品質管理に貢献したデミングの話が興味深い。

当時「日本製」といえば、安物で、他国製品よりも品質の劣る模倣品を意味した。日本製品をそのように読んでいた講演の出席者は、ほぼ5年以内にそのレッテルを替えられるというデミングの言葉に衝撃を受けた。彼は耳を傾ける経営者たちに、品質管理の統計手法を正しく使うのだ、そうすれば高品質でありながら低価格の製品を生産でき、世界中の市場を席巻するようになる、と解いたのである。
デミングはのちに、そうなるまで5年かかると予想したのは間違いであったと語っている。日本人は5年どころか、ほぼ2年で彼の予想水準にまで達したのだ。

こんなに短期間で変化するものなのか。今品質の劣る模倣品と言われている製品も、数年後どうなっているかわからないな。具体的にどうしているかも紹介されていた。

デミングは、生産ラインを原材料に始まり最終製品にいたるまでの諸行程の流れとして見ることを提案した。各工程は測定可能であり、それぞれ環境要因によってバラツキも異なる。最終製品の段階まで待って、あらかじめ設定したバラツキの範囲を超えていないか確認するのではなく、マネジャーは各工程でのバラツキに注視すべきなのだ。最もバラツキの大きい工程にこそしっかり取り組む必要がある。

Made in Chinaはいまどの段階だろうか、と考えてしまった。あとギネスの自信がすごい。

原料が変わっても、それが天候や土壌条件、大麦やホップの品種で変わったのだとしても、一定の製品を生産するために、経済的に可能な限り、決して実験をやめませんでした。従業員は自社製品に並々ならぬ自信を持っており、ご存知かもしれませんが、1929年まで宣伝をいっさいしてきませんでした。というのは、ある考え方によるためで、ギネスのビールが市販されている製品の中で一番であり、販売促進のためにその品質を宣伝する必要はなく、飲まない人に宣伝するよりもむしろ同情するような考えなのです。

ちょっとアイルランドに行ってギネスが飲みたくなった。そして最後に確率の実生活上の意味というやや哲学的な問題に言及している。
この本を通じて、確率・統計というのもがどれほど広い分野に渡っているのかを改めて認識することができた。大学生の頃にこの本に出会っていれば、実験データに対する意識が違ったかもしれない。数理統計をもっと積極的に勉強していたかもしれない。まあ、今ならiTunes UでUCバークレーの統計の講義を見ることができるし、実際に6回分くらい見た。もう既に始まっているbig dataの時代にざっと統計的手法の歴史を見ておくのも悪くないと思う。きっとデータはどこにでもついてまわるのだから。