« 2013年1月 | トップページ | 2013年3月 »

2013年2月

2013年2月25日 (月)

科学研究に対する考え方

 前回は、かなり長くなってしまった上に、後半の方は何となくまとまりがない感じで終わってしまったような気もするが、その話題はまた改めて別の機会に書くことにして、今回はまた新聞で見た記事の中で2月中頃のものを忘れないうちにとり上げてみたい。

 それは、「天才科学者はもう現れない?」というタイトルの2月14日の新聞に載っていた記事。具体的には、アメリカ・カリフォルニア大デービス校のディーン・シモントン教授という人が、「最先端の自然科学の研究はグループで行われるようになり、1人の天才が新しい科学を想像するのは難しい」という趣旨の文章を科学誌ネイチャーに発表した、ということらしい。

 気になって調べてみたところ、その元の文章はnature Volumu 493 Number 7434(31 January 2013)の中に掲載されている「After Einstein: Scientific genius is extinct」という文章のようだ。タイトルを日本語に訳すと「アインシュタイン以後:科学的な天才は絶滅している」になると思う。

 残念ながら、その中身は見れなかった(有料だった)が、Live Scienceというサイトに、この文章に対する意見として「Is Scientific Genius Extinct?」(科学的な天才は絶滅しているか?)という記事が載っていたので、そちらの方を読んでみた。

 その内容の前半は、私が(日本の)新聞で見た内容とほぼ同じで、元の文章の要約が書かれている。元が同じなのだから、要約も同じ内容に決まっているのだが、何となく違いもあるように見えたのが少々気になった。例えば、現代科学の進歩に関する部分で、日本の新聞には「現代科学の進歩は...知識を根底から変えるものではなく...アスリートのように、理論や測定の改善の競争に勝った科学者がノーベル賞を取り続けるだろうとした」と書かれている。

 一方のLive Scienceの記事には、最先端の科学研究について「It has also become much more difficult for an individual to make groundbreaking contributions, since cutting-edge work is often done by large, well-funded teams, he argues.」と書かれている。

 直訳すると「最先端の研究(cutting-edge work...「(天才的な発見ではなく)理論や測定を改善して精密に切り込んでいく研究」というニュアンスか?)は、より大きく資金が潤沢なチームによってなされることが多くなり、個人(an individual)が道を切り開く草分け的貢献(groundbreaking contributions)を行うのはかなり難しくなっている」という感じだろう。

 ともに言っていることは正しく、元の文章の趣旨に合わせて適切な部分を抜き出していると思うが、私は、その抜き出し方に何となく日本とアメリカのお国柄、というか、考え方の違いが出ている気がするのが面白く感じて、今回この話を取り上げてみた。

 というのは、日本の新聞の「競争で勝った科学者が...」という記述は間違っていないだろうが、よく見ると、アメリカのように「done by large, well-funded teams(より大きく資金が潤沢なチームによって行われる)」とは書いていない。

 この辺りは、「(お金があまりなくとも少数精鋭で)競争で勝ち抜いていく」という如何にも勇ましい日本的な感覚というか美学のような雰囲気が無意識のうちに出たのかもしれない。また、それに対して「とにかく規模を大きくする、あるいはお金をかける」という感覚も如何にもアメリカ的な気がする。

 まあ、ここではどちらがいいか、などという野暮なことは考えない。というか、どっちもどっち、という感じだが、個人的には「そんな中でも、(すぐには現れないかもしれないが)結局そのうち天才科学者は現れるだろう」と楽観的な気持ちを持っている、と書いて今回は終わりにしたい。

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月21日 (木)

「ロングテール」の話

 前々回に、話の流れから、たまたまインターネットに検索に関する話の関連から「ロングテール」という用語に関する話をした。その中で「人々の関心を示す割合の統計をとったときの傾向(分布)」のことをグラフを使って説明してみたが、「指数関数的に...」とか、少々わかりにくい感じがしたので、今回はそれをもう少し噛み砕いて理解した上で「ロングテール」について少し考えてみたいと思う。

 そこで、これまでとパターンを少し変えて、今回はかなり長くなってしまうが少々数学っぽい話(数式は使わないが)から始めてみたい。ということで、まずは簡単に「統計データを使って傾向を調べる」ということについて考える。

 例えば、次のような棒グラフを見てみよう。

Bunpu1
Bunpu2

 とりあえず横軸はテストの点数でもマラソンの時間でも何でもいいのだが、これらのグラフは、何らかの計測を(架空の)200人を対象に行った結果の分布としよう。見てわかるように、上の青いグラフは、平均(真中)に人数が集中していて、「1」や「9」などの両端は少ないのに対し、下の赤いグラフは平均が最も人数が多いものの、両端にもある程度の人がいて、上の青いグラフと比べると人数が分散している。

 これだけでも、統計データを使って傾向を調べられる。しかし、このような分布を使って傾向を調べる方法は、「何らかの計測による結果の上下関係」という横軸の値と「人数」という縦軸の値が揃っている場合にしか使えない。

 例えば、インターネットで検索する言葉には上下関係はないため、「ある検索語とそれを使った人の数」という関係の統計データを取ったとしても、このままではテストの点数やマラソンの時間と同様の考察方法は使えない。

 では、そうゆうときにはどうするのか。とりあえず単純に考えて、上の2つの棒グラフの棒を、人数の多い順に並べ替えたものを見てみよう。

Bunpu3

 このグラフは、上の2つの棒が一番高いのは共に「5」だから左端は「5」で、二番目に高いのは...という感じで作成した。

 このグラフを見ると、青い「平均に集中している分布」の方は、一番左の棒は非常に高いが右を見ると非常に低くなっているのがわかる。一方、赤い「全体に分散している分布」では右の棒もそれなりの高さを維持している。言い換えると、「(平均的なものに集中せずに)全体に分散している傾向」がある方は右へ行った際に「グラフの減少が緩やかになっている」ということである。

 まあ、テストの点数などというと、何となく点数が低いか高いかが気になるかもしれないが、数学的に傾向を考えるためにそのような情報はなくてもいい。これも数学のいいところの一つかな、と思うのは私だけかもしれないが、これなら、横軸が数値でなく「インターネットの検索語」などのときでも「平均に集中している」か「全体に分散している」かという傾向が同じように見て取れるに違いない。

 ということで、前ふりが長くなったが、ここからが本題の「ロングテール」の話。まずは、改めて前々回のグラフを見てみよう。

500pxlongtailsvg_2

 インターネットでの検索や買い物の統計に見られる「ロングテール」というものは、赤いグラフのように減少が緩やかな状態を指している、ということを前々回に書いたと思う。こういうことから、要するに「インターネット上での買い物や検索では、あるところに集中するのではなく、様々なものに分散している傾向」が見て取れる、という話が出てくることになる。

 日本語の資料で「ロングテール」を調べると、大抵は数学の話は全くない。まあ、「様々なものに分散している」という傾向だけわかれば十分で、長ったらしい数学的な考察など必要ない、と感じる人がいるかもしれないが、こういう人はこの話の続きがあることには全く気がつかない。

 ちょっと話は変わるが、例えば「これはたくさんの人が買っているものだから良いものに違いない」という話を耳にする。何となく説得力があるように聞こえるが、実はよくよく考えるとこれは正しいとは言えない。

実際、「数値が大きい順に並べ替え」のグラフの横軸の数値を見てほしい。人数が多い左側は「5」「4」「6」ということで、平均に近いものしかない。一方、本当に良いと思われる「9」や「8」などはかなり右の方に現れる。

 一概に言えないのでは、という意見もあるかもしれないが、少なくとも「数値が大きい順に並べ替え」のグラフのデータを「物の質と買い物の傾向の関係」という形で見ることができるなら、本当に質の良い「8」や「9」のものは人数が少ないところにあり、たくさんの人が買っているところの中には本当に良いものはない(平均的なものばかり)という話になる。

 グラフの右の方は玉石混交という感じだが、こういうところからもインターネット上の統計データに見られる「ロングテール」の傾向がわかるかもしれない。実際、インターネットで検索して買い物をしようとする人は、普通のお店にある(平均的な)ものよりも良い物があるかもしれない(要するに、上の分布で言う「8」や「9」を探したい)と思って行動するから、その結果として「ロングテール」という傾向が現れる、と言えないだろうか。

 こうやって考えると実際には、「本当に良いもの」を見つけるための方法が確立していないため「数打てばあたる」という感じで検索や買い物している人が多いから「分散している分布」になる、という見方ができるかもしれない。また、wikipediaの「ロングテール」には「販売機会の少ない商品でもアイテム数を幅広く取り揃えることで、総体としての売上げを大きくする」などと書かれているが、要は、客が「数打てばあたる」でくるなら、流れ弾でも何でもいいからとにかくあたるような的(商品)をたくさん用意する、という感じなのだろうか。

 「本当に良いもの」を見つけるために「数打てばあたる」のようなやり方がいいかどうか、という話はまた改めて考えたいが、「良いものを探しているが見つける方法がわからない」という人の心理を逆手の取ったような商売をしている人たち(実はamazonやgoogleなどもそうかもしれない...)には騙されないように心がける必要はあるだろう。

 あと、amazonの個人向けのおすすめ紹介やgoogleの個人向けに最適化された検索が普及すると、もしかしたら「ロングテール」の傾向が変わる(「数打てばあたる」というやり方が減る)かもしれない、などとも思ったが、これは今のところよくわからない。

 ということで、今回はかなり長くなってしまったが、統計データの数学的な見方や(その見方に基づいて)「ロングテール」と呼ばれる話の考察をしてみた。最後は余談だが、平均的なものを「良いもの」と勘違いしたり、あまり人が関心をよせないからという理由だけで「本当に良いもの」を見逃してしまうのは、実は数学を知らないことが原因ではないか、などということにもついでに気がついてもらえればいいかな、と書いたところで終わりにしよう。(長い文章を最後まで読んで頂き、ありがとうございました。)

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月17日 (日)

今日は青梅マラソン

 今日は、2月の第3日曜日。昨年一昨年とまったく同じなのだが、今年も青梅マラソンが開催され、30kmに参加してきた。

 4日ごとの更新が、たまたま当日にあたったので更新が夜になってしまったが、今回は今日走った青梅マラソンの報告をしようと思う。

 まず、昨年はスタートから青梅駅までのコースを紹介したが、今回はその続きを紹介するために、スタート前の時間に少し早く行って、ウォーミングアップ代わりに一駅分の距離を歩いたり、たまにゆっくり走ったりしながら写真を撮ってきた。

 ということで、青梅駅前から次の宮ノ平駅前のところまでのコースを最初に紹介したい。まずは、青梅駅前の交差点を過ぎると、すぐに人形のお店が並んでいるところがあるが、このあたりは、帰りで言うとのだいたい残り2kmの地点になる。

P2171152

 その先に、青梅市民会館があり、さらにしばらく行くと神社が見えてくる。

P2171153

P2171155

 この神社のところまでが、青梅の市街地で、ここから先は山の方へ向って少しずつ登っていくことになるが、その最初のなだらかな登りはこんな感じ。

P2171156

 実際に走っている時は、ずっと先まで参加者で一杯になる。また、帰りの時は、当然この逆でここが最後の長い下りになるが、上の方から逆向きに見るとこんな感じになる。

P2171157

 このあとすぐに宮ノ平駅前に着く。

P2171158

 この辺りは、帰りで言うとの25km過ぎくらいのところ。正直なところ、今回は調子が良くなかったので、帰りのこの辺りは結構しんどかったが、その今回実際に走った記録は次の通り。

・5km通過 ... 39分27秒 (昨年 40分01秒)
・10km通過 ... 1時間9分03秒 (昨年 1時間16分07秒)
・15km通過 ... 1時間38分39秒 (昨年 1時間47分53秒)
・20km通過 ... 2時間06分46秒 (昨年 2時間13分24秒)
・25km通過 ... 2時間41分54秒 (昨年 2時間39分51秒)
・30kmゴール ... 3時間23分46秒 (昨年 3時間07分56秒)

ちなみに私は時計をせずに走っているが、青梅マラソンの大会では前回から5kmごとに全選手の時間を計測してくれることになったので、これだけ細かいラップタイムがわかる。全員の5kmごとのラップタイムを全て計測してくれるとは、さすがは歴史のある青梅マラソン、といったところだろうか。

 なお、この記録には、スタート地点に到達するまでの時間(今回は7分30秒)も含まれている(グロスタイム)ので、スタートラインからゴールまでの記録(ネットタイム)は3時間16分16秒になる。

 とりあえず、20kmまでは調子は悪くなかった。ただ、20km以降はペースがガタ落ちになった。特に、残り2kmから1kmの間に左足太ももの前の筋肉がツッてしまって、最後の1kmくらいはほとんど歩いている感じのペースに落ちたこともあって、かなり遅い記録に終わってしまった。

 まあ、親知らずを抜いた後に糸で縫った部分の抜糸が1週間前だったが、抜糸までの間は運動をほとんどしていなかったとか、もう40代の半ばになったので若い時のようにはいかない、などという身も蓋もないことを言うこともできるかもしれないが、こうなってしまった直接的な原因はわかっている。

 実際の走りは、21kmから22kmくらいのところにある登り坂(青梅マラソンの「心臓破りの坂」などと呼ばれることもあるらしい)で体力を使い切ってしまった感じになり、その後ペースがガタ落ちし、さらに下り坂で太ももの筋肉に負担がかかって結局ゴール手前の平坦なところで足がツッてしまった、というところである。

 ただ、先月のハーフマラソンのときは病み上がりで調子が悪かったが、今回は20kmまでは前回よりも少し速かったし、後は長い距離を走る練習をしていけば来年は何とかなろうだろう、と、ここはプラス思考で今回の結果をとらえていくことにしたい。

 最後は参加賞(途中棄権者も含め全員配布)のTシャツ、ゴールした人だけがもらえる毎年恒例のFINISHERストラップ(今回はTシャツとお揃いで緑色)、そして、今年も本日限定の青梅マラソンせんべい(こちらも文字が緑色)を買ってきたので、その写真を載せて終わりにしたい。

P2171164

13omestrap

13omesenbei

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月13日 (水)

35000を超えました

 カウント数が35000を超えた。以前「30000を超えました」を書いたのが約5ヶ月前の9月だから、1ヶ月あたり約1000づつカウント数が増えていった計算になる。その間、36回の更新を行った。

 去年、25000から30000までの間は18回の更新だったので丁度2倍かかったが、正直なところ去年の夏頃の増え方が異常な感じで、1年前くらいは半年で約5000ずつ増えていた感じだった。だから、その頃のペースに何となく戻って落ち着いてきた、といったところだろう。

 この約5ヶ月、36回分を改めて見てみると、半分以上にあたる20回が新聞やニュースからのネタになった。他には、ジョギング・登山が4回、立体折り紙の話が2回、本の紹介が1回で、残りの9回は個人的なこと、年末年始に書いた1年の振り返りやその他、となっている。

 また、30000から35000へ増える間に「通算200回目の更新」があるなど、このブログの節目にあたる時期でもあった。

 あと、年末の「今年のこのブログを振り返る」「今年92回目の更新」では、インターネットの検索で一番最初にこのブログが現れるキーワードととり上げてみた。

 このキーワードの話は、私はよく知らなかったのだが、最近少し詳しく調べてみたら「ロングテール」という話題に行き着いた。

 しかし、日本語のwebページをいくら調べてみても、ロングテールの説明が非常にいい加減な上に、商売のこと(売り上げを伸ばせるか)や検索のこと(如何にして上位に現れるようにするか)ということしか書かれていないので、正直なところ信用できないものばかりだった。(この手の説明を日本語でしか見たことがない人は注意してください。)

 だから、ここでは英語のwikipedia「Long tail」の説明と、その項目にあった次のグラフ(パブリック・ドメインの画像)を参考にしたい。

500pxlongtailsvg_3

 具体的には、人々の関心を示す割合の統計をとったときの傾向(分布)は、グラフ左の人気のあるものに関心が集中し、それ以外のもの(グラフの右)の方への関心は小さくなるが、通常はグラフが青い線のように左の不人気なものに行くにしたがって関心(グラフ)が急激に減少し、すぐにほとんど0の状態になる。

 これを数学的に言うと「指数関数的に急激に減衰」といい、例えば「偏差値」を計算する時など、一般に統計的な処理で利用されている「正規分布」も指数関数的に急激に減衰の形のグラフである。

 一方、インターネットでの検索の傾向の割合の統計をとると、実は赤い線のように左に行くにしたがって減衰するものの、青い線よりも減衰の割合が緩やかである、という性質を持っている。

 この「数学的」に減衰が緩やかという点が重要で、「ロングテール」という名前も、赤い線が恐竜のシッポのように(青い線よりも)緩やかに減衰することから名付けられたもののようだ。

 まあ、今回は「35000回を超えました」という話題なので、ロングテールの話題はもう少し詳しく調べてから改めてブログにでも書こうと思うが、このブログも「あまり人が関心を示していない新聞やニュースの小さな話題」を多くとり上げているので、結果的にインターネットの検索ではロングテールの話に繋がってくるのかもしれない。

(ということで、今後も似たような傾向になるとは思いますが、読んで頂いている皆様には感謝しています。今後ともよろしくお願いします。)

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月 9日 (土)

莫大な素数の大きさ

 知らない人が多いかもしれないが、先日の2月7日に久しぶりに数学にかかわるニュースが報道された。それは、現時点で具体的にわかっている素数の中で最大の、1742万5140桁の素数が新たに見つかった、というニュースである。

 ちなみに、朝日新聞では「世界最大の素数発見」というタイトルの記事だった。素数は無限に存在するので「世界最大」というのはどうかと思うが、数学を知らない人が書いた記事なのかもしれない。

 まあ、そんなことはどうでもいいことだが、前回の発見は2009年だから、4年ぶりに見つかったことになる。コンピュータを駆使して年がら年中素数を探し続けていても、4年間も見つからなかったのだから、探している人たちからしてみれば喜びもひとしおだろう。

 ところで、ここで素数といっているのは「メルセンヌ数」と呼ばれるものの中の素数で、「2の累乗-1」の形の数値を扱っている。例えば「2の2乗-1=4-1=3」「2の3乗-1=8-1=7」などがメルセンヌ数のなかの素数だが、実は「5」や「11」のようにメルセンヌ数ではない素数もたくさんある。

 だから、こういう話を聞くと、こんな大きな数を探さなくてもいいじゃないか、などと考えてしまうかもしれない。実際、小さな数の方が計算も楽ではないかと思ってしまうが、「メルセンヌ数」は2進数で表すと全て「1」が並ぶのでコンピュータで扱いやすい、という意味で計算しやすいのだろう。

 要するに、今回発見されたのは「2の5788万5161乗-1」という数だったそうだが、それは2進数で表すと「1」が5788万5161個並んでいる数に相当する。また、次のメルセンヌ数は2進数で「1」が5788万5162個並んだものなので、とにかくメモリが許す範囲で「1」を並べていけば、またそのうち素数にあたるかもしれない、という感じになっている。

 ただ、次にいつ見つかるかは見当がつかない。4年間というのも長いと思うが、よくよく考えてみると、次は自分が生きている間に見つかるかどうかもわからない。というか、そもそも、素数が無限にあることはわかっているものの、メルセンヌ数の形をした素数が無限にあるかどうかは実はわかっていない。だから、この方法で次に素数が見つかる保証もない。

 さらに、全世界にある全てのコンピュータ上のメモリに「1」を並べきってしまったら、次はどうするのだろう。見つかるかどうかもわからないメルセンヌ数の形をした素数を探すためだけにコンピュータやメモリを無限に作り続けなければならないのもばかばかしい、という話になって、そのうちどこかで見切りをつける必要に迫られるかもしれない。

 そんなことで今回は、莫大な素数の大きさに比べたら、人間の寿命や最新鋭のコンピュータも、はかない存在かな、などと思いながら何となくダラダラと文章を書いてしまった。まあ、たまにはこんな感じでもいいだろう。

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月 5日 (火)

米の伝説テニスプレーヤー

 数日前、歯科で「おやしらず」を抜いた、というか除去してもらった。そんなこともあり、インターネットで検索しながら、「おやしらず」にまつわるブログネタを探してみたが、正直なところ個人的に興味が持てそうなものが見つからなかった。

 こんなときには、英語を使って検索をしてみたくなる。ということで、まずは「おやしらず」の英訳を調べてみると「wisdom teeth」という言葉が出てきた。「wisdom=知恵」ということだが、日本でも別名「知恵歯」「知歯」などと呼ばれることがあるので、それと同様の意味で捉えれば納得がいくかもしれない。

 そこで今度は「wisdom teeth」という言葉を使ってインターネットで検索をしてみた。まあ、日本と同様、「おやしらず=wisdom teeth」の説明や歯科の宣伝のようなページばかりが現れたのだが、そのなかに少し変わったニュースを見つけた。

 それはCNNの「Arthur Ashe estate up for auction: Tennis trophies, wisdom teeth」という記事。私はテニスは詳しくないのだが、「Arthur Ashe=アーサー・アッシュ」は、1993年2月6日に亡くなったアメリカ・バージニア州リッチモンド出身の黒人テニスプレーヤーの先駆者として活躍した人らしい。

 もう少し詳しく読むと、この人は黒人で最初にUSオープンとウィンブルドンで優勝したテニスプレーヤーで、1960年代後半から1970年代にかけて活躍したそうだ。しかし、1980年代に心臓のバイパス手術を受けた際の輸血によってHIVウィルスに感染し、1993年に49歳という若さで亡くなってしまった。

 ただ、亡くなった後もアメリカでは彼の功績は大きく称えられ、例えばニューヨークにある世界最大のテニス専用競技場「アーサー・アッシュ・スタジアム」やアメリカで1993年に始まった主にスポーツ界で活躍した人を中心に授与される「ESPY賞」の中の「Arthur Ashe Award=アーサーアッシュ賞」などにその名を残す「伝説のテニスプレーヤー」といった感じの人のようだ。

 ところで、アーサー・アッシュが亡くなった日付をよく見ると、明日の2月6日で亡くなってからちょうど20年になる。このCNNのニュースは、そのメモリアルに、アーサー・アッシュの形見の品々のネット・オークションが行われている、ということが書かれていて、その中に「おやしらず=wisdom teeth」も含まれているらしい。それで、このキーワードの検索で引っかかった話題のようだ。

 このオークションには他にもいろいろとあるようで、もう少し詳しく見てみようと思い実際のネット・オークションのサイトへ覗いてみた。

 すると、例えば「Arthur Ashe's Jacket(ジャケット) From the 1962 U.S. Junior Davis Cup」「Arthur Ashe's Davis Cup Runner-Up Trophy(トロフィー) From 1984」などの他にも、「Arthur Ashe's Handwritten Notes(直筆ノート) for a Speech to Black Graduates 」や「Arthur Ashe's Passport(パスポート)」など、300点以上の遺品が出品されていることがわかった。

 その中で「おやしらず=wisdom teeth」が含まれているものは「#378(378番目)」のもの。実際には、おやしらずと一緒にコイン等も入っている小さなポーチのようで、このブログを書くために見た段階では、まだ誰も入札していなかった。ちなみに、私はテニスに興味がある訳ではなく別に欲しいとは思わないので何もしていない。なお、入札の期限は、1993年2月6日にアーサー・アッシュが亡くなってから20年のメモリアルということで、明日の2月6日までとなっている。

 ということで、今回は「おやしらず」から米の伝説テニスプレーヤーに偶然たどり着いた。最近は新聞記事からのネタが多かったが、久しぶりに英語のweb siteを検索して結構楽しめた。また、こういった感じで面白そうなネタを探してみることにしよう。

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

2013年2月 1日 (金)

(本の紹介)その数学が戦略を決める

 前回、ブログで「統計的な解析による指標」の中で、「その数学が戦略を決める」という本を紹介した。実のところ、私がこの本を読んだのは5年くらい前なのだが、最近文庫版が出たようだ。文庫版が出るということは結構売れている本なのだろうと思うので、今回は簡単にこの本の紹介でもしてみることにした。

 タイトルには「数学」となっているが、中身の方は前回書いたように「統計」にまつわる話がメインである。まあ、「統計」は「数学」の一部だと言えばそうだとは思うが、数学全体に関する話ではない、ということである。

 数学全体にまつわる話の本では、例えば夏頃にブログで紹介したの本(「数学は最善世界の夢を見るか」「不可能、不確定、不完全」)などがあると思うが、これら少々難解な部分があるのは否めないかもしれない。

 一方、今回紹介する本は、統計にまつわることを、様々な話を交えながらわかりやすく話しているうえに、各章の最後に丁寧に「まとめ・ポイント」が2ページ程度に書かれている。このようなものなら、高校生くらいなら普通に読める内容だろうし、中学生でも意欲がある人なら大丈夫だと思う。

 内容は、前半は前回紹介したワインの質の話など、統計的な解析による指標を認めたがらない専門家の反応を交えながら、如何に統計的な解析が優れているか(あるいは専門家が信用できないか)という話を展開している。

 例えば、第4章には医療現場での話が書かれているが、その最初の方に約170年ほど前のゼンメルワイスという人の話が載っている。この本によると、この人は勤めていたウィーンの産院で産褥熱(さんじょくねつ)に関する詳細な統計調査を1840年ごろに完成させている、とある。

 具体的には、調査の結果、「診療所の医師や看護師が患者を診る前に塩素入り石灰水で手を洗えば産褥熱による死亡率が12%から2%に下がる」ということを発見したそうだ。要するに手を消毒してから患者を診察すれば(今で言う)院内感染は防げる、という当たり前とも思えるような結論だが、170年前の医師たちからは猛反発をくらった、と本には書かれている。

 何故反発されたかについては、この本にはそれほど書かれていないが、興味がある人は例えばwikipediaなどに詳しく載っているようなので、そちらを見るといい。この本には、(当時としては)驚異的な発見をしたにもかかわらず主張が受け入れられなかったこの人は、後に神経衰弱になり失意のうちに亡くなった、ということが書かれている。

 「消毒のために手を洗う」ということは今では常識だと思うので、当時の人たちが統計調査の結果を受け入れなかったことに憤慨する人が多いかもしれないが、現在でも似たように(100年以上たったら常識になっているかもしれないことを)単に「数学や統計がよくわからないから」とか「専門家でない人に何がわかる?」などと言いながら取り合わないことも結構多いような気もする。

 こういった本を読むと、どんなことでも何らかの根拠に基づいて得られた結果は(たとえ自分自身が理解できなかったとしても)尊重していく姿勢が如何に重要か、ということを思い知らされる。

 このような話に続いて、本の後半(第6章以降)では、統計的な解析の手法にまつわる話がわかりやすく書かれている。専門書ではないので、この本を読んだだけでは統計的手法の勉強にはならないかもしれないが、何となく「統計をもう少し真剣に勉強してもいいかな」と思わせるように文章が書かれているような気がするのがいい。文庫本は低価格で購入できるし、もしかしたらそのうち古本屋にも出まわるかもしれないので、もし見かけたら、たまにはこういった本を読んでみるのもいいのではないかと思う。

--------

Copyright (c) 2013 ANADA, Koichi. All Rights Reserved.

| コメント (0)

« 2013年1月 | トップページ | 2013年3月 »