読者です 読者をやめる 読者になる 読者になる

言語学入門(とちょっと自然言語処理)

哲学 人工知能

 僕たち人間は言葉を使うことによってものごとを考えることができます。「彼はかっこいいから、きっとモテるんだろうな」と考える時も、「彼」とか「かっこいい」のような言葉を組み合わせることによって思考してるのだと考えることができます。つまり言語というのは思考にとってとてつもなく重要なツールなのです。そして思考というのは生きる上で欠かせない以上、最低限の言語学を学ぶのはとても意味があるように思います。

 まず、言語とは何かについて考えます。例えば「東京タワー」のような固有名詞を考えると、言葉は現実世界の何かしらの対象を指すもののように思われます。しかし、ちょっと考えるだけですぐこれは誤りだとわかります。例えば「ユニコーン」という言葉は、ユニコーンが現実世界に存在しない以上、現実の何かを指している訳ではありません。

 少し天下り的ですが、言葉の定義としてより優れたものが存在します。それは、「言葉とは差異を表すもの」ということです。簡単に言ってしまえば、言葉によって僕たちは何かしらの区別をしようとしているのです。例えば「男」と「女」というのは、現実世界の人間の集合を男の集合と女の集合に分けるのではないのです。これは前述のように言葉が現実世界の対象(男の集合と女の集合)を指すような考え方であり、言葉が絶対的な意味を持つ、という誤解です。そうではなく、身体的、心理的、その他あらゆる人間に知覚できる違いを表すために、「男」と「女」という言葉を僕たちは使っており、その意味は相対的であるのです。

 「言葉とは差異を表すもの」というのは最初はびっくりするかもしれませんが、実はとても自然な定義であることがわかります。まず、差異というのは人間が先天的に(アプリオリに)認識できる重要な概念です。先天的であるとは、もしも人間が差異を生まれた時から知覚できないなら、人間は一生差異を知覚できないはずである、ということです。もしも視界が変化してもそれに気づかないなら、僕たちは一生視界の変化を知覚できないはずです。なので、視界の差異というのは先天的に認識できるようになっているはずであり、聴覚、味覚などの差異も同様のことが言えます。

 僕たちは僕たちの知覚する差異を、言語によって表します。それでは言語はどのような歴史の変遷を経て発達していったのでしょうか?一番初めは、象形文字のように、いわゆる絵文字によって言語は作られました。この時は、文字自体とその意味が独立していませんでした(文字から意味を推測できる)。しかし、色々な実用上の問題から、ひらがなやアルファベットのような現代文字が作られました。これは結構驚くべきことです。これによって、例えばaとかbというのは全く意味を持たない(文字から意味を推測できない)のに、その組み合わせによって意味を表すことができるようになったのです。

 ここで、ソシュールという言語学者が、シニフィアンシニフィエという概念を提案しました。シニフィアンとは厳密性をなくして言うとアルファベットの組み合わせ、avocadoとかsuperbとかadieowsとかのことです。そしてシニフィエとは、それらの組み合わせが生み出す意味のことです。Avocadoというa,v,o,c,a,d,oからなるシニフィアンに対応するシニフィエは、いわゆる僕たちが考えるアボカドです。厳密なシニフィアンシニフィエの定義は専門書をお読みください。

 言語学入門は今回はここでやめときます。最後に、自然言語処理(以下NLP)のお話をします。NLPとは、コンピューターにプログラミング言語ではなく人間の言語(英語とか日本語)を理解させよう、という試みです。これはとても重要な技術ですが、シニフィアンシニフィエの概念を理解すると、NLPの限界というのが見えてくるように思います。

 簡単に言ってしまえば、コンピューターは今の現状ではシニフィエを理解できないのではないか、ゆえに人間の言語を本当の意味で理解することはできないのではないか、ということです。コンピューターはシニフィアンを取り扱うのは上手いです。ある意味人間より上手いでしょう。しかし、コンピューターはシニフィアンしか理解することができず、そこからシニフィエを理解することができる、というのは保証されていません。

 これは以前書いた僕の記事にも関連しています。

futsaludy.hatenablog.com

この記事(上に挙げたやつ)はちょっと妄想的なところがあるので鵜呑みにしない方が良いです。しかし、人工知能の壁みたいなのはわかるかと思います。これをいかに克服するか、僕としてはとても楽しみです。