読者です 読者をやめる 読者になる 読者になる

人間的思考と機械学習 2

人工知能 哲学 機械学習

機械学習とは、教師ありであれ教師なしであれ、統計学の理論であり、確率の理論です。例えば猫の画像を分類しようと思った時、コンピュータはそれが猫である確率を計算することによって分類を行います。その確率を計算する際には、計算のもととなるデータが必要です。この既知のデータをもとに、未知のデータを分類するための「汎化」を行います。この汎化によって、より精度の高い確率の計算ができるので、分類の精度を高めることができるのです。

僕は前の記事で、人間も経験という既知のデータから「汎化」を行っていると言いました。これはおそらく事実でしょう。しかし、機械学習と決定的に違うのは、僕たちは確率を使って猫を分類しないということです。「あの物体が猫である確率は、僕の経験から言うと94%である」。そんな考え方は人間はしません。それでは、一体どうやって僕たちは汎化を行っているのでしょうか?

この問いを明らかにするためには、まず機械学習の汎化とは何なのかを考えてみます。機械学習は先に言った通り、確率の理論です。それでは、そもそも確率とは一体何でしょうか?

例えばコインを投げて、その裏表が判明する前に紙コップでコインを覆ったとします。その時、コインが表の確率は何でしょうか?1/2、と答えるかもしれません。でもそれって本当ですか?コインは(量子論的な考えをしない限り)紙コップの中で表か裏のどちらかになっているはずです。つまり表の確率が1で裏の確率は0か、もしくは表の確率は0で裏の確率は1のどちらか、というのが正しい答えではないでしょうか?

この具体例によって、確率というのがそもそも何なのかを理解できます。確率とは、人間が不確定な要素について論じるための1つのツールなのです。コインが表である確率は0か1です。しかし、ここで確率を1/2と考えることによって、僕たちは不確定性について数理的に論じることができるようになるのです。アインシュタインの言葉を使えば、「神はサイコロを振らない」のです。サイコロを振るのは人間だけであり、確率とは人間が作り出した概念です。

 

注:しかし、量子論的に見れば神はサイコロを振ります。その意味でこの考え方は誤っていますが、重要なのは量子論が存在する前から人間は確率という概念を作り出して使っていたということです。その意味で確率は(自然にそれが発見されるまで)人間が作り出していた、と言えるのではないでしょうか。

 

つまり、機械学習とはこの人間の不確定性について数値的に論じる機能のひとつが、他の機能から独立して発展したものだと考えることができるでしょう。コンピュータを使えば、それは計算能力という点で人間よりも性能は上だと思いますが、人間の汎化能力の一部が発展したものに過ぎないのです。

それでは話は戻って、人間はどのように汎化を行っているかについて考えてみます。どうやら僕たちは機械と違ってデータを精密に蓄積するようなことはできないようです。あるいは無意識の中に正確なデータがいくらか残っているのかもしれませんが、基本的に僕らが扱うのは精密なデータそのものではなく、そのデータの概念なのです。ここでいう概念とは、データの「概ねの部分」くらいの意味です。僕らは主観的にデータの概ねの部分、つまり概念を取捨選択し、それを思考に用います。概念というツールを用いて思考するからこそ、僕たちは正確な確率を計算することはできないのです。

僕たちは生のデータをそのまま取り入れずに、とりあえず均して、それを概念として取り扱います。これをどのように均しているのかが分かれば、本当の意味で人間的思考について理解できるかもしれません。

まとめると、機械学習とは人間が不確定性を数値的に論じるための手法であり、その意味でもともと人間の機能の1つでしたが、それはおそらくコンピュータという計算資源を利用することで、ある意味人間の思考を上回ることができます。しかし、人間の思考を機械学習によって完全にモデル化するのは難しいように思います。なぜなら、人間がどのようにデータを均すかというと、概念を使うからです。概念による思考は、確率による計算とは根本的に違うのではないか、というのが僕の考えです。しかし、この問題はやっぱり難しく、まだまだ決定的なことは言えないです。今後の行方に期待します。