Chapter Content

Calculating...

えー、皆さん、こんにちは。今日はね、第九章について、ちょっと、あの、お話してみようかな、なんて思ってるんですよ。ええと、今回のテーマは、「人生はゲームではない」っていう、まあ、ちょっとドキッとするようなタイトルなんですけどね。

で、その中でも特に、「自然の残滓としての数学」っていう部分に焦点を当てて、お話を進めていこうかな、と。

そもそも、数学って、長い間、科学技術の一部として、ずーっと使われてきましたよね。ええと、例えば、古代文明では、農業計画とか、貿易とか、税金計算とかに、算術が使われていたし、幾何学は、建物を建てたり、物を配置したりするのに使われていたし。カレンダーも、時間の流れを把握したり、天体の動きを理解するために、数学を使っていましたよね。統計的な手法とか、経済理論も、数学的な原理に基づいているし。アインシュタインの相対性理論とか、量子力学も、その基礎は数学にあるわけじゃないですか。初期のコンピューターも、計算の数学的な理論を活用してたし。

現代では、数学は、最も純粋な科学だなんて言われることもありますよね。一般的には、数学があるからこそ、科学が厳密になる、みたいなイメージがあるんじゃないかな。理論がより正確で、数学的であればあるほど、その推論はより綿密で、慎重になる、みたいなね。ええと、もっと言うと、ほとんどの自然システムが、数学自体に見られる多くの対称性とか構造を示すから、数学は、自然の言語である、って考えられてるわけですよ。

でもね、実は、数学が応用される時、その成功は、ほとんどが不自然な状況で見られるんです。例えば、ポーカーゲーム。数学は、確率を使って意思決定をサポートしたり、数学的な戦略を用いることで、人がポーカーでより多く勝つのに役立ちますよね。でも、ポーカーって、現実世界とはちょっと違うじゃないですか。ポーカーには、簡単に守れるルールがあるけど、そのルールから外れたら、ゲームを正しくプレイしているとは言えない。ポーカーはゲームであって、人生ではない、と。

この例が、ちょっと無理やりすぎるかなって思ったら、ルート最適化を考えてみましょうか。ルート最適化っていうのは、数学の力を借りて、たくさんの可能性の中から、一番いいルートを見つけようとするものですよね。ルート最適化は、すごく難しい問題で、ポーカーゲームよりは、ずっと現実的に見えるかもしれない。だって、人間は、昔から、道を探す必要があったわけですからね。一番いいルートを見つける問題では、可能性の空間がものすごく大きくて、解決策を見つけるための直接的な道はないんです。でも、それでも、ルートを見つけるっていうのは、やっぱり、ちょっと作られたものなんですよね。自然界には、ルートなんてないんですよ。森には、葉っぱとか、枝とか、木とか、有機物とかは、いっぱいあるけど、ルートはない。ルートは、道とか、小道とか、道路とか、人間が作ったものなんです。ルートは、現代世界の低次元的な働きの副産物なんですよ。

ポーカーも、ルート最適化も、車の購入交渉とか、職場への最短ルートを見つけるとか、現実世界に対応するものはあるけど、それでも、比較的、人工的な状況の中で行われているんですよね。車の購入は、購入プロセスに関わる、構造化されたルールとか、社会的な慣習の下で行われますよね。そこには、あまり自由な余地はなくて、ほんの少しの有利な点が現れて、利用される、みたいな感じかな。これを、森の中で熊に出会うのと比べてみてください。そこには、何のルールもなくて、本能的にパターンを認識して、感情的に素早く行動を決定するだけですよね。でも、それが交渉ではないっていうわけではないんですよ。熊の立場とか、利害とか、潜在的な脅威を考慮しなければならない。脅威レベルとか、行動とか、潜在的な危険性を評価する必要がある。私たちは、それを交渉だとは考えないけど、それは、それがすごく速く起こるからなんです。私たちは、どんな正確で、数学的な方法でも、情報が使われているとは見ないけど、でも、確実に使われているんですよ。

職場への最短ルートは、数学的な最適化で見つけることができるけど、それは、私たちが、明確に定義されたルールのある、グリッド状の環境で運転しているからこそ、できることなんです。数学は、私たちの現代の関心の多くに応用されるけど、それは、私たちの状況の多くが、ゲームのように設定されているからなんですよね。何かがゲームである場合、そこには、目に見えていて、説明できるピースがある。そのシンプルさが、数学がシステムの各部分に付着できる理由なんです。

でも、ゲームの領域から離れて、より自然な環境に移ると、その付着性っていうのが、失われてしまうんですよ。はっきりとしていて、透明で、制御可能だったものが、複雑さの乱流の中で、なめらかになっていく。複雑さの下では、数学は、記述したいと思っているシステムに対するグリップを失ってしまう。これは、単なる近似のせいだ、なんて言われることが多いけど、以前にも話したように、複雑さっていうのは、決定論的なシステムの超強化版ではなくて、全く違うものなんですよ。どんなに数学を使っても、熊との遭遇を交渉したり、手つかずの密な森の中を通り抜けていくのに、役立つことはないんです。

ここで、反論が出てくるのは、当然かもしれませんね。「私たちの生活は、現代のゲームのような構造に大きく捧げられているから、応用数学を擁護する」っていう前提の下で。私たちのほとんどは、熊に出会ったり、仕事に行くために森をかき分けたりはしない。でも、複雑性の時代は、その枠組みに異議を唱えているんですよ。私たちの社会が、数学の仕組みにうまく適合する、ゲームのようなルールに基づいて、ますます構築されているのは事実だけど、複雑性が私たちの行動様式になると、状況は劇的に変わるんです。

私たちは、単純な機械を作ろうとしているわけではないし、自然についての私たちの推論は、複雑さがどのように機能するかを考慮しなければならなくなったんです。複雑さっていうのは、科学のニッチな分野ではなくて、全てなんです。私たちの自然の理論とか、知識とスキルの定義とか、より穏やかな、ヒューリスティックな思考の応用が、今や重要なことなんです。このことが、自然を記述するために数学を使うことを、ますます問題にしているんです。なぜなら、複雑さを無視できないことに気づき始めているからなんですよ。

でもね、全ての数学が、超正確で、決定論的なわけではないんですよ。確率は、正確な予測とか、演繹を超えて、現実世界の不確実性とか、ランダム性を考慮しようとする。確率があれば、予測不可能な状況を定量化して、推論するためのフレームワークが得られますよね。

でも、確率も、やっぱり、付着性の問題に悩まされているんです。どんな確率的評価においても、何かを何かで割る、つまり、二つのものを比較するっていう概念があるんですよね。例えば、トランプのデッキからエースを引く確率を計算したい場合、まず、起こりうる結果の総数 (分母) を特定して、次に、好ましい結果の数を特定して (分子)、最後に、好ましい結果の数を、起こりうる結果の総数で割りますよね。したがって、標準的な52枚のカードのデッキから、エース (デッキに4枚) を引く確率は、4/52 (0.077) になります。私たちが、エースを引く確率を計算できるのは、確率的フレームワークを、ゲームのような状況の具体的な内容に付着させることができるからに過ぎないんですよ。

もちろん、確率には、基本的な比率を計算するよりも高度な方法があるけど、それらは全て、この種の比較を行っています。確率の使用っていうのは、イベントが発生する可能性と、発生しない可能性の間で、暗黙の対比が考慮されていることを意味するんです。

トランプのデッキは、一つのことだけど、自然環境で比較することの、どれだけ非現実的かを考えてみてください。分子は、何かのイベントが起こる回数でなければならないし、分母は、起こりうるイベントの総数でなければなりませんよね。この比較を、どうやって計算できるでしょうか?分子については、妥当な推測ができるかもしれないけど、分母は?無理ですよね。起こりうるイベントの総数を、知る方法はないんです。なぜなら、自然環境では、イベントの数が事実上無限だからなんです。

もし、比率の話が、確率の本質を記述するには、単純すぎるように思えるなら、分布に進んでみましょう。グラフ上にプロットされた確率分布を見ると、数学関数の値を視覚化していることになりますよね。それは、ランダム変数の (ランダムな現象の結果に基づく、未知または変化する量) の、各可能な結果の尤度を表すものです。言い換えれば、自然なものによって生成された出力のことですね。

確率分布は、保険会社がリスクを評価して、保険料を計算するために使用したり、金融モデリングでリスクを管理したり、品質管理で製品の標準を監視して、改善したり、医学研究、疫学、臨床試験で健康関連データを分析したり、気象条件やサプライチェーンの需要を予測したり、在庫を最適化したり、AIで統計的方法とか、機械学習アルゴリズムを使用したりするために使われていますよね。

もし、確率が、自然な状況を反映する能力の点で、それほど限定的であるなら、なぜ、それほど多く使われているのでしょうか?それは、繰り返しますが、上記に挙げた全てのものが、私たちが作り出した世界の、構造化されたルールと、社会的な慣習の下で動作しているからなんです。

確率っていうのは、ギャンブルから生まれたんですよ。それは、当然ですよね。論理的には、何かの起源が、その使用を無効にするわけではないけど、確率がもともと、偶然のゲームで意思決定をするためのツールとして、どのように想定されていたかを示しています。確率が、自然環境の中で発見されることは、ほとんどなかったでしょうね。これは、偶然が現実世界で、何の役割も果たしていないことを意味するわけではなくて、自然版の偶然が、人間が作ったフレームワークの単純なルールに従って実行されないことを意味するだけなんです。

何かが起こる可能性を教えてくれる数を、計算できるほど、限定されているのは、ゲームだけなんです。これは、確率的なバージョンを含めて、数学が、自然とは何か、そして、自然がどのように機能するかと、大きく乖離していることを意味します。もし、制約された環境で活動するなら、数学は、意思決定をしたり、内部プロセスを記述したりするための、優れたツールになります。でも、現実世界の複雑性の領域に足を踏み入れると、数学は、物事がどのように機能するかに対するグリップを失ってしまう。これは、純粋数学の分野を脅かすものではないんですよ。純粋数学は、抽象的な概念と、理論的な結果だけに関心があるんですから。でも、応用数学、つまり、基本的な物理理論での使用を含めた、数学の応用に関しては、その妥当性に深刻な限界があることを示唆しているんです。

私たちが作るものが単純である場合、応用数学は、私たちの課題と非常に関連性があり、システム設計について推論するための厳密な方法を提供してくれる。でも、本当に複雑なものを作る時代に入ると、数学は、厳密さを見つける場所になるだろうっていう、デフォルトの仮定は、非常に疑わしいものになるんです。

数学と現実の乖離を理解している人は多いですよ。ほとんどの学生は、数学が自分の人生に役立たないことを不満に思っていますよね。この不満は、通常、数学は、直接的に適用できなくても、より良い思考方法を与えてくれるっていう、いつもの言い訳で無視されますよね。それは、啓蒙時代とか、産業革命の間は、真実だったかもしれないけど、私たちが作るものが本当に複雑になると、その言葉は成り立たないんですよ。事実、正直に言うと、数学は、以前に議論した比率の例が示すように、誤った考え方を助長しやすいんです。

数学の現実世界での有用性の欠如に気づいているのは、学生だけではありません。株式市場で数学を使用する人を見ると、資産価格の食い違いとか、何らかの情報非対称性を利用するリソースを持っている人に有利ですよね。でも、これらの利点は微妙で、より基本的なことをすでに考慮している人にしか役に立たない。もし、数学がそれほど手ごわいものであったなら、もっと多くの人が株式市場で大儲けしているでしょうね。スポーツ賭博にも、同じことが言える。再現可能な利益を上げようとしている人には、多少の利点があるかもしれないけど、ほとんどの人にとって、利益をもたらすほどではない。それに、これら全ては、現在プレイ中の生存者バイアスを無視しているんです。

数学と確率が、現実世界に対応するという根本的な仮定は、それが正しかった時代から来ているんですよ。でも、それは、私たちが入りつつある時代ではない。市場から、あるいはスポーツ賭博から、かろうじて利益を得るっていうのは、一つのことだけど、本当に複雑なものの創造はどうでしょうか?

私たちの現代世界が、ゲームのような計算を役立つものにしているっていう議論は、弱まりつつあるんですよ。STEM関連の知識は、複雑性に直面した時に、関連性を維持するために、大幅な見直しが必要なんです。私たちが構築するものの物理的な抽象化のレベルを上げ続けるにつれて、私たちは、内部知識から遠ざかり、試行錯誤とか、ヒューリスティクスとか、パターン認識によって扱いやすくなるものに向かっていくんです。

これは、数学に対する反対意見というよりも、むしろ、数学が現在どのように適用されているかに対する意見なんです。数学は、計算よりも抽象化に関するものであって、抽象化は、複雑性の全てなんです。情報的にだけでなく、物理的にもね。でも、数学は、あたかもそれが、私たちが作るシステムの内部の仕組みを語るかのように、因果的な意味で大きく振りかざされる。そのアプローチは、複雑性の時代には、全く支持できないことが証明されるでしょう。

私たちは、AIが数学によって可能になったとよく言われますよね。結局のところ、深層学習は、行列演算とか、ベクトル空間とか、固有値とか、固有ベクトルとか、線形代数からのさまざまな方法を使用するじゃないですか。深層学習は、勾配とか、微分とか、微分積分を使用するし、積分とか、最適化も使用しますよね。確率、ベイズ統計、マルコフ連鎖、グラフ理論、組み合わせ論などからの、分布とか、期待値とか、分散もありますよね。AIをコンピューティングにおける数学の実装として捉えるのは、無理もないかもしれません。それは全て、応用数学の素晴らしい成功物語のように見えるんですよ。

ある意味では、それは真実だけど、非常に誤解を招くものです。数学は、AIシステムの足場を構築するために使用されるけど、それがAIを機能させているわけでは、決してないんです。AIが機能するのは、システムに組み込まれていない創発的な特性があるからなんです。数学は、コロニーの個々のアリに似ています。個々のアリは、重要な特性を持っているけど、特定のアリが難しい問題を解決するわけではないんです。アリの集合体が解決するんです。AIの核心が具体化して、必要な出力を計算できるようにするのは、無数の「アリ」を解放することなんです。数学は、試行錯誤とヒューリスティクスを組み合わせた、実行する必要がある高レベルのプロセスの個々のピースを構築する方法なんです。その後、システムは、決定論的な因果的な意味では、理解できない方法で収束していくんですよ。

ソフトウェア内で試行錯誤が確実に起こるようにする足場を設置するために、AIエンジニアは、距離とか、速度とか、混合を計算する方法を必要とします。AIは、モデルの最良の推測と、実際の量やラベルの間のギャップを埋めようとするたびに、距離計算を使用します。AIは、パラメータ値を計算するために、微積分を活用する時に、速度を使用します。AIは、データを変換するために、大きな行列を一緒に乗算する時に、混合を使用します。数学は、間違いなく、今日のAIシステムで使用されています。でも、数学が、複雑なシステムが出力を生成する方法の本質を明らかにしているからではなくて、数学が、距離とか、速度とか、混合を機械にコーディングする唯一の方法だからなんです。

数学は、距離とか、速度とか、混合を計算的に定義する方法を与えてくれる。でも、距離とか、速度とか、混合の概念は、数学に属するものではなくて、試行錯誤とか、高レベルのヒューリスティクスを介して進もうとするプロセスの、必要な側面なんです。数学が表現したり、捉えたりできるものよりも、距離とか、速度とか、混合を実行する、はるかに優れた方法があるかもしれないけど、今のところ、数学が私たちにできる全てなんです。数学のベクトルとか、行列は役立つけど、それらの (潜在的にプラトン的な) 存在が、自然の動作方法であると信じる理由はないんです。

AIを機能させているのは、数学ではなくて、試行錯誤とヒューリスティクスの使用の中心にある概念なんです。数学は、自然の中で起こることの単なる残滓として理解されなければならない。自然の内部の仕組みの決定的な説明としてではなくてね。

でも、今日の科学技術のパラダイムは、数学自体が、複雑なものが機能する方法であるっていう仮定に染まっているんです。私たちは、今日の科学者とか、エンジニアが抱えているAIの「錬金術」についての継続的な不快感の中に、この考え方を見ています。AIが科学よりも芸術のように見えることは、科学とか、エンジニアリング界の多くの人を苦しめているんです。AIシステムは、慎重な設計とか、深い因果推論によって改善されるわけではなくて、高レベルの混合とか、マッチングとか、より多くのデータとか、処理能力を追加して、結果を達成することで改善される。全てが、あまりにも厳密ではないように聞こえるんですよね。

問題なのは、AI研究の錬金術との戦いなんです。今日のAI研究者は、AIが内部でどのように機能するかについての、より厳密な記述を見つけたいと思っているんです。でも、見つけるべきものは、何もないんですよ。私たちが、因果的なバージョンから離れる限り、AIがどのように機能するかを知っています。情報とか、計算とか、進化に関連する表面レベルの知識だけが、AIが何をしているかを記述することができるんです。システムに手を伸ばして、エレガントな数学理論によって語られる、決定論的な物語を見つけようとする学術的な試みは、複雑さの下では、偽物なんです。数学は、AIがどのように機能するかではなくて、AIがどのように設定されているかなんです。

数学が現実の単なる残滓であるということは、私たちが複雑なものをどのように構築しなければならないかの本質を語っています。数学が何を表しているかの理解を再構築しなければなりません。それは、複雑な何かが内部でどのように機能するかを記述できるものではないし、複雑な解決策を構築する方法を私たちに導くこともできません。複雑なものの内部が、どのように機能するかについての、適切な数学的理論は決して存在しないでしょう。数学は、せいぜい、機械で試行錯誤が起こることを保証するために必要な、計算足場の一種をプログラミングするための、役立つツールでしかないんです。

これは、応用数学についての考え方を劇的に変えるし、より広く (そして、より重要なことに)、科学とエンジニアリングに厳密さをもたらすことが何を意味するかを変えるんです。数学は、私たちが宇宙を理解できる普遍的な言語ではなくて、システムを設定するけど、その動作を制御しない、計算構造を作成して、思考するためのフレームワークなんです。

自然は、完全な分布を使用する

数学と確率が、本質的に複雑さが内部でどのように機能するかと乖離しているにもかかわらず、確率は、役立つ類似的なツールを提供してくれます。私たちは、自然の現象が、可能な値の範囲に従って、その出力を生成していると考えることができるんです。これは、確率分布が捉えようとしていることです。

ほとんどの確率分布には、ピークがありますよね。ピークは、値が最も集中している場所のことです。つまり、ピークは、私たちが最も観察しやすい値のセットなんです。それらの値を最も観察しやすいのは、それらが最も高い頻度で発生するからです。公正な6面サイコロを何度も転がすと、各数字がほぼ同じ回数だけ表示されると予想され、均一な (平らな線) 分布が生成されますよね。しかし、サイコロを偏らせて、主に数字の6に着地させるようにすると、値の分布にピークが現れて、6がより可能性の高い結果であることを示します。

ピークのある分布の概念を、エントロピーと多重実現可能性に接続することができます。分布のピークは、統計的に最も可能性の高い構成を表しています。これはまさに、エントロピーがピースの配置を特定の巨視的状態にマッピングする方法なんです。私たちが何を見るかを予測できるのは、最も頻繁に発生する配置だからです。これと並行して、多重実現可能性の概念があります。これは、覚えていると思いますが、複雑なシステムで最も不変な特性は、可能な限り多くの方法で到達できることを意味します。分布のピークが、私たちが何を見るかを予測できるものであり、エントロピーが不変な構造と動作に着地するメカニズムに対応しているため、確率分布のピークを創発的な構造または動作として考えることができるんです。

これら全てにおける重要な認識は、ピークは、分布の残りの部分なしには、何の意味もないということです。ピークは、システムの統計的に最も可能性の高い微視的構成を表しているので、何が起こると予想されるかを示してくれます。でも、それは、他の構成が無関係であることを意味するわけではないんです。全く逆で、これらの可能性の低い構成は、全体の分布を形成する上で、重要な役割を果たしているんです。さらに重要なことに、これらの可能性の低い構成が存在していなければ、最も可能性の高い構成は存在しなかったでしょう。これらの可能性の低い構成がなければ、システムの統計的特性は存在しなくなるんです。

これが、なぜ重要なのか、そして、複雑性の時代に物を構築することと、何の関係があるのでしょうか?それは、自然が複雑さを機能させるために、分布全体を使用しているに違いないことを示してくれます。これは、物事を孤立させて理解しようとする、現代科学の誤謬に大きな影響を与えているんです。それは、還元主義は、その全ての現れにおいて、根本的に間違っていなければならないことを示しています。なぜなら、それは、私たちが観察し、測定し、経験することから、本質的に切り離されているからなんです。

自然をリバースエンジニアリングしようと、物事を分解することに、「厳密さ」も「科学的」なものも、何もないんです。これは、科学的に真実であると同時に、私たちが構築するものにとっても真実なんです。これらの影響については、後ほど詳しく説明します。今のところは、還元主義による分離が、現在のパラダイムが崇拝しているとされる数学的、科学的原則にさえ当てはまらないことを理解しておいてください。

計算を実行しないでください

数学を使って意思決定をするには、2つの方法があります。計算を実行して、その結果に従って生きるか、数学が語る普遍的な特性を理解するかのどちらかです。前者について言えば、数学と確率が、今日どのように適用されているかを考えてみてください。投資では、投資全体で予想されるリターンとリスクを計算します。会計では、予算編成とか、財務計画に関連する結果を計算します。エンジニアリングでは、さまざまな条件下での構造の挙動をシミュレートして、分析したり、信号を分析して、操作したり、さまざまな制御システムの安定性とパフォーマンスを調査したりします。科学では、物理現象をシミュレートして、実験結果を予測します。これら全てのケースで、数学を使用するのは、計算を実行して、何らかの結果を得るためです。

でも、数学のもう一つの側面は、計算ではなくて、その特性に関係しています。すでに説明したように、特性は、オブジェクトまたは現象の記述的な側面のことです。特性は、オブジェクトがどのように出力

Go Back Print Chapter