「<不確実性と情報>入門」

「<不確実性と情報>入門」(金子郁容/岩波セミナーブックス)

→1990年初版の確率論と情報論の入門書。ぞくぞくするほどおもしろかった。
この名著を読みながら生きているのって楽しいな、おもしろいなと興奮したものである。
たぶん確率(運、ツキ、偶然)への興味が異常に強いからだと思う。
万人が読んでおもしろいかどうかはわからない。そのうえ本書を読みこなすためには、
確率や統計に対する最低限の知識は図解雑学シリーズ等で学んでいる必要がある。
以下、本書から学んだことを感想をまじえながらわかりやすく紹介する。
運やツキ、偶然に興味がある方にお読みいただけたら書き手はとても嬉しいです。

・西洋では長いこと決定論的世界観が維持されてきた。
我われになにが起こるかはすでに決まっていて、
それを変えることはできないという世界観だ。
19世紀までは科学とは、
原因と結果の間に存在する決定論的因果律を発見することだった。
しかし、20世紀に入ったころから原因と結果の間には、
確定的な関係など存在しないのではないかという見方がなされるようになる。
原因と結果の不確定な関係をどう見るかというのが確率の基盤となる考え方である。
・天気予報は「たぶん雨が降るでしょう」から「降水確率80%」と表現が変わった。
これは世間が確率の見方を受け入れるようになったということを意味している。
「降水確率80%」という情報は、我われの主体的行動(選択)を求めている気配がある。
しかし、「降水確率90%」も「降水確率30%」も明日の天気を左右するわけではない。
天気予報とまったく関係なく、雨が降るときは降るだろうし、晴れるときは晴れる。

・確率論の対象は、やってみなければ(起こってみなければ)わからない、
不確実性をふくんだ出来事全般である。
重要なので繰り返すが、やってみなければ(起こってみなければ)わからないこと全般を
取り扱うのが確率だ。わからない不確実なことに枠組みを与え可視化する。
しかし、決して確率は万能というわけではない。
なぜなら、結果の可能性が見えているという前提がなければ確率論は成り立たないからだ。
わかりやすくサイコロの話をすると、
結果(標本点)はかならず1、2、3、4、5、6としなければならない。
結果の予想がついていないと確率論は成立しないからである。
ところが、サイコロの場合、振ったときに壊れてしまう可能性は確率に入れられない。
テレビ番組の巨大サイコロのようになにかにぶつかり中途半端なまま安定してしまうこと
だって絶対にないとは言えないだろうが、そこは確率論では言及できない。
サイコロが転がって戸棚のすきまに入って取れなくなってしまうことも確率では計算できない。
つまり、あらかじめ結果(標本点)を決めるという前提に確率論の限界(弱み)がある。
結果(標本点)を予想している時点であいまいな直観(主観)が入ってしまっているのが問題だ。
とはいえ、そこを深く追求してしまうと確率論は壊れてしまうので、
たとえばサイコロの場合はかならず1~6の数字が出るという前提で確率は論じられる。
☆確率の限界について論じられているものをはじめて読んだので非常に感銘を受けた!

・著者が大学の講義で77人の学生に実験をさせたという。
コインを100回投げて表が出た回数を記録させる。
結果、表が出た最多数は60で最少数は26(!)だったとのことである。
50ぴったりだった学生はひとりもいなかった。
全体としては7700回のうち3901回が表で確率は0.507になる。
これはなにを意味しているのか?
我われは経験的あるいは直観的にコインの表が出る確率は1/2だと思っている。
しかし、それは本当に正しいのだろうか?
というのも、26回しか出なかった学生もいるのだから、
この人にとったらばコインの表が出る確率は0.26になるのではないか?
別の学生にとっては0.6が正しい答えになるだろう。
それはコインを投げる回数が少ないからだという反論はわかる。
とはいえ、7700回振った結果は0.507だから1/2ではない。
ならば、0.507が本当は正しいのではないか? なにがいったい正しいのか?
☆コイン実験はまるで人生の禍福の暗喩(ほのめかし)のようで寒気がした。
ついているやつと運が悪いやつがいるのは、こういうわけではないかと薄ら寒い。
幸運なやつも不運なやつもいるけれど、全体としては0.507というのもおもしろい。

・生命保険会社は確率に基づいた人の寿命に関する数学モデルを持っている。
この数学モデルにしたがって保険の掛け金を決めるらしい。
ある会社の数学モデルに数値を代入するとものすごい低い確率だが、
千歳まで生きる人がいるという結果が出てくるそうだ。
この意味で確率は現実を正確には表わしていないが、
だからといって経済的には非常に有効な手段であるという事実までは変わらない。
・そうなのである。確率の考え方は経済的にとても有効である。
たとえば、ある危険施設の安全対策をどうするか?
まったく危険が起きないようにすると莫大なコストがかかってしまう。
だが、危険率を0.1%許容するとコストを55%削減できることになる。
20%の危険率を許容してもコストは51%までしか下がらないのも意外と言えば意外だ。
さて、直観では0.1%の危険率を許容したくらいで
コストが55%も削減できるとはふつう思えないはずだ。
確率を計算してみると直観では得られぬ知見を持つことができるようになる。
☆この考え方も新鮮で驚いた。だが、どうだろう。0.1%の危険は起きないのか?
ちなみに0.1%とはどういう数字か。吃音(どもり)と統合失調症の発症率がともに1%。
ならば、吃音で統合失調症患者なら0.1%的(笑)な存在ということになるのではないか?
0.1%の危険はそれほど起こらないわけではないような気もするが、どうでしょうか?

・情報はいろいろな解釈があるけれど、確率論との関連でかりにこう定義する。
情報の定義――不確実性を減少するものが情報である。
我われは情報(=不確実性を減少するもの)を参考にして意思決定する。
経済的に言えば、我われは不確実性に操られ損をしたくないから情報を求める。
・一般的には情報が増せばそのぶんだけ確実性も増加していると考えられる。
☆個人的には、不確実性ほどスリルあるわくわくしたものはないと思うが、あはっ。
たぶんギャンブルは不確実性をめぐる娯楽になるのだろう。

・確率論には「条件つき確率」という考え方がある。
サイコロを振ったとき、なにが出るかの確率は1/6だ。
このとき出る目が偶数だという情報を知っていたら(条件がついていたら)、
当たる確率が1/6から1/3まで増加することになる。
情報とは当たる確率を増やすもので、条件つき確率の考え方を用いて計算される。
マーケティングが情報を集めているのは新商品が「当たる」確率を計算するためである。
・「箱当てクイズ」をやってみよう。
ふたつの箱があって、中には白いボールと黒いボールが入っている。比率はこうだ。
箱1[○●●●]白1黒3
箱2[○○○●●●]白3黒3
ふたつの箱は外見からは見分けがつかない。
この段階でどちらが箱1でどちらが箱2か当てられる確率は1/2である。
さて、アシスタントがいて箱からボールをサンプルとしてひとつ取り出す。
確率が変わるのはこのときである。
もしアシスタントの取り出したボールが白だったとする。
この情報(サンプル)でなにがわかるのか? その箱は箱2の確率が高いということだ。
なぜならば箱1から白が出る確率は1/4、箱2から白が出る確率は1/2だからだ。
反対にもしアシスタントが無作為に箱から取り出したボールが黒だったらどうか?
その箱は箱1である可能性が高いということだ。
なぜならば箱1から黒が出る確率は3/4、箱2から黒が出る確率は1/2だからだ。
サンプルを取ることで箱1だか箱2だかを当てる確率が変動する。

・マーケティング・リサーチがやっているのは基本的にこれと変わりないらしい。
新商品を市場に出すとき、当たるか外れるかは箱1箱2とおなじ仕組みとのこと。
アンケートやら地域限定発売で得られた情報をもとにリサーチャーは先を読む。
・最重要なことは、確率は変わろうが箱1箱2は断じて中身を変えるわけではない。
情報(サンプル)を得て当たる確率は変わるが、中身は絶対に変わらない。
ならば、たとえ白いボールがサンプルでも箱1であることは十分にありえることなのだ。
1/4の確率で白いボールが出てくることだって立派にありうるということである。
このことからなにがわかるのか?
サンプルを取ろうが取るまいが、不確実性は変わらないということである。
サンプルを取ってもその箱が1か2かという「真の状態」はなんら変化しない。
ならば、サンプルを取ることでなにが変わるのか? 変わるのは我われの認識である。
これはとても重要だと思う。情報なんて大したことはないとも言えてしまうわけだ。
なぜなら、情報を得ることで変わるのは不確実性そのものではなく、
不確実性に対する我われの認識だからである。

☆学者の著者は書いていないが、情報によって得られるのは安心くらいではないか。
情報によって当たる確率は変わるが、当たるか外れるかはすでに決まっているのだから。
結局、最後はどちらかに賭けなければならなくなるだろう。
確率が高いほうに賭けても外れることはあるに違いない。
確率が低いほうに賭けたら当たってしまうこともなくはないはずである。
いくら天気予報で明日の晴れが告知されていても雨が降るときは降る。
情報に天気を変えるような力はまったくないのである。
天気予報はせいぜいイベント開催者が安心して眠れる程度にしか効果がないのだ。
怖ろしい真実を言い放ってしまうと、
もしかしたら一般的に価値があるとされるあらゆる情報が、
たかだが天気予報程度の意味しかないのではないか?
いまは情報によって当たり外れを左右できると誤解している人が大勢いるような気がする。
情報に不確実性を完全に消去する力はないにもかかわらず。
どのみち最後は賭けになるのである。
そして、残酷なことに確率が高いほうに賭けても負けることはいくらだってある。
どうしてかと考えるに、情報と真実性の相関が実際はあまりないからなのだと思う。
だが、不確実性は一般に人(企業)を不安にするから、みんな血まなこで情報を求める。
・箱当てゲームで100円賭けるとしたら、サンプル(情報)の価値は25円だという。
☆25円払って情報を得てさらに負けてしまったら125円の損でバカ丸出しだな!

・偶然を計算するというおもしろいことを著者は本書でしている。
1950年にアメリカでこういう事件があったという。
その日、とある小さな町の教会で7時20分から聖歌隊の練習をすることになっていた。
ところが、メンバーの15人全員が遅刻してしまう。
教会になにが起こったのか?
7時25分に教会のボイラーが爆発して、建物が全壊したという。
メンバーの15人全員が遅刻したおかげで怪我人はひとりも出なかった。
この事件は「神のご加護」と当時騒がれたとのことである。
この確率はどのくらいか著者は計算する。
メンバーそれぞれ4回に1回くらい遅刻すると考える。
するとこの「神のご加護」が発生する確率は1/4の15乗。
だいたい10億分の1くらいの確率になるそうだ。
・確率が低いことを奇跡と言うならば、ふたつの奇跡がある。
たとえば、宝くじに当たるような奇跡はたしかに低確率だが起こりうるものである。
いっぽうでコインを投げたときに縁(ふち)で立つような奇跡はそれとは違う。
前者は「稀(まれ)な出来事」で後者は「意外な出来事」である。
教会の遅刻事件は「意外な出来事」に分類される。
☆わたしの言葉で言うならば、
「意外な出来事」は計算できない出来事くらいの意味になろう。
宝くじに当たるのやトランプゲームで驚きの配列ができるのは計算可能だ。
しかし、コインが縁で立つこと、サイコロが壊れること、教会爆発は計算できない。

・統計によって部分から全体を推定することが可能になる。
たとえば、湖の魚の数を知りたいとする。どうしたらいいか?
千匹の魚に印(しるし)をつけて湖に放流する。
一定期間後に新たに千匹の魚をサンプルに取り、
何匹に印がついているかを見たら全体数が推定できるだろう。
このとき百匹に印がついていたら、サンプルの1割に印がついていたのだから、
湖全体には最初に印をつけたものの10倍いるのではないかと直観的に予想できる。
これを計算式(文系なのでわかりましぇーん)に代入するとこうなるという。
f(8500)≦0.04
f(12000)≦0.03
これはどういう意味か? 
湖の魚の全体数が8500であるということは4%以下の確率でしか起こらない。
湖の魚の全体数が12000であるということは3%以下の確率でしか起こらない。
そんな確率の低いことはまずありえないだろうと解釈する。
結果として全体数は10000を目安として、
8500から12000の間と考えておけば間違いなかろうということになる。
前提としてあるのは4%や3%のことは起こらないだろうという確信である。
この信頼の詳細を分析するとどういうことになるか?
例の教会爆発事件のような「意外なこと」はまず起こらないだろうという確信が、
計算式で出てきた統計の数値を信じるに足るものにしているということである。
☆個人的には3%や4%の発生確率のことは起こっても不思議ではないと思っている。
このためだろう。わたしは統計を信じることができない。
どうして部分から全体を推定できるのか、いまだにどこか感覚的にわからない。
サンプルで取った数字が「たまたま異常値」の危険性をつい考えてしまう。
しかし、実際に湖全体の魚の数は調べられないから、
統計によって導き出された数値が当面の真実として流通してしまうのだろう。
この当面の真実に過ぎぬものが絶対的真理のような扱いを受け、
そこに異議を唱えるものは狂人のように多数派から見られるのだから世間は恐ろしい。

・数学でも直観はたいせつだが、直観はつねに理論で磨かれつづける必要がある。
我われは自分の直観が正しいと思いたがるが、直観が間違えることもある。
たとえば、サイコロを6回振って1の目が1回でも出る確率はどのくらいか?
直観で考えてみよう。答えは約2/3だという。あなたの直観は当たっていたか?
1年は365日あるが、22人の人がいて誕生日が一致する確率はどのくらいか?
確率的に正しい答えは約1/2である。
たった22人くらいの集まりで誕生日が一致する確率が1/2もある。
カードのおまけつき菓子があるとする。カードは10種類。
このうち5種類のカードを集めるためには何個菓子を買えばいいのか?
(期待値=答えは6.5個)
ぜんぶのカードを集めたいと思ったら、だいたい何個くらい買えばいいのか?
(期待値=答えは30個)
☆わたしは古本の引きがいいから(おい、ぜんぜん関係ないぞ!)、
お菓子を20個購入したくらいでぜんぶカードを集められそうな気がする。
運が悪い人は40個買っても50個買ってもカードはそろわない気がする。

・何回読んでもよく理論がわからなかったが、運のよし悪しも計算できるという。
結果だけ書くと、人はみなだれもが自分は周囲と比べて運が悪いと思うものらしい。
自分だけクジ運が悪いとか、いつも電車やバスが来ないとか(笑)。
確率論から言えることは、自分だけ運が悪いのではないかと思うことは正しい!
そして、それはあなただけではなく、みんなが感じていることなのである。
ならば、被害者意識を持つことも正しいが、みんなそうなんだからあきらめような。
☆あはっ、確率論に説教を喰らってしまったよ……。
・確率は絶対的真理ではないかもしれない。どういうことか?
たとえば「大数の法則」というものがある。
この法則にしたがって我われはコインの片方が出る確率を1/2だと信じている。
つまり、膨大な数のコイン実験をしたらかならずや確率はきっちり1/2になるはずだ。
しかし、これは証明することができない。
たとえ1万回コイン実験をしたときに数値が1/2に近づいても、
次の1万回で裏ばかり出て2万回実験後には1/4になっているかもしれない。
10万回やったから正しいというわけでもない。次の10万回でなにがあるかわからない。
1億回やってもストップした時点でその数値は仮説の域を出ない。
無限回やれば1/2になるのかもしれないが、無限回コイン実験をすることは不可能だ。
そうだとしたら、コインの表が出る確率はもしかしたら1/2ではないのかもしれない。
答えは、たぶん人間にはわからない。
これはわたしの意見ではなく、当時一橋大学教授だった著者が主張していることである。

・平均値がもっとも高く、しだいに数が減少していくグラフを正規分布という(ちょい適当)。
予備校の模試などでおなじみのあれである。
著者の主張では、正規分布を理想としてしまうと多様な人間が出てこない。
典型的学生を調べるテストではなく、人の多様性をはかるようなテストも必要ではないか?
・情報には静的情報と動的情報がある。
静的情報には、情報を秘匿することによって他人を支配しようという面がある。
いっぽうで公開されながら相互に変容していく動的情報というものがある。
これからは静的情報よりも動的情報のほうが重要性を担うのではないか?
・たとえば対面しているふたりの人は動的情報を交換し合っているとも言いうる。
私が見ているあなたは静的情報としてのあなたではない。
どういうことか? 開かれた動的情報としてのあなたを私は見ている。
私が見ているのは「私を理解してくれようとしているあなた」(動的情報)である。
あなたが見ているのも「あなたを理解しようとしている私」(動的情報)である。
ならば、私はあなたを見ながら私自身を見ていることになるし、
あなたも私を見ながらあなた自身を見ていると言うこともできるだろう。
・上記のような考え方をすると、情報を静的なものとみなす確率論は古いことになる。
たえず変容している情報を自分も変化しながらとらえるネットワーク論のようなものが新しい。
・世界は歴史とともに決定論→確率論→ネットワーク論と変じていくのではないか。
・パスカルの時代、確率は賭博のためのいかがわしいものだった。
・いまでは学問として認知されたけれども、それでもやっぱり確率はどこかいかがわしい。
☆誤字脱字、失礼。最後までお読みくださり本当にありがとうございます。

COMMENT









 

TRACKBACK http://yondance.blog25.fc2.com/tb.php/3546-e15c5dc9