
電気通信大学 田野 俊一学長インタビュー[後編]
■ 「なぜかできてしまう」、生成AIの仕組みに愕然
――ここからは、先生ご自身のご専門の学問的な興味や関心、研究の構想がもしありましたら教えていただきたいと思います。
興味という点では、高校生の時から、頭の中の知的処理に興味がありました。だから、大学を選ぶ時も実は、医学部に行って脳について研究するか情報工学系に行ってコンピュータを研究するか迷いましたが、やはりコンピュータのほうが面白いと思って、東京工業大学の制御工学科で、自然言語処理や曖昧さの処理をずっと研究してきました。
会社を選ぶ時も、生意気にも「AIをやらせてくれるのなら入ります」と言っていましたら、日立製作所のシステム開発研究所がやらせてくれると言ったので、そこに決めて、以来AIの研究をしてきました。
ところが、ずっと研究していたにも関わらず、生成AIが出て来てしまって、愕然としている、というのが実情です。
なぜかと言うと、例えば今の生成AIというのは、日本語の文章を入れて、その次の文章、次の単語を予測する、というめちゃくちゃ単純なことをしているだけなのです。だから、生成AI自身は何も理解していなくて、単に「むかしむかしあるところに」と言われたら、次は「おじいさんとおばあさんが」というのを予測するだけ。たったそれだけの原則で、世界中の知識のありとあらゆるいろいろな文章を食べているだけなのです。
それにも関わらず、足し算や引き算も翻訳もできてしまう。翻訳にしても、方法論は何も知らずに、ただ次の語を推定しているだけなのです。
それで一番困っているのは、自然言語翻訳の人たちです。もう研究することがなくなってしまったのですね。翻訳プログラムが実装されていないのに、とにかく翻訳しろと言えばちゃんとできてしまう。しかも、その出来がすごく良いのですから。
私は、自分の研究の最後のほうで「自然言語の曖昧さ」ということを、ファジィ理論で研究していました。
例えば、「背が高い/低い」ということについて、170cmというのは高いのか、低いのかという可能性を計算して推論して、「170cmは背が高いですか?」と尋ねられたら、「いや、低いです」という応答ができるようなシステムを作ることを研究していたわけです。
ところが、今のChatGPTに「私の研究室にオランダ人の男の子がいます。身長170cmだけど、高いと思う?」と聞くと、「オランダ人の平均身長は184cmだから、170㎝はそれほど高くないですね」とちゃんと答えるわけです。
この「それほど」という言葉を出すのに、どれだけ僕らが苦労したことか。「ほとんど高い」「めちゃくちゃ高い」といった自然言語をどうやって出すのかを計算でやっていたのに、ChatGPTには何も教えていないのにちゃんと出てくるのです。
「オランダ人は」というのもまた凄くて、背の高い・低いというのは文脈に依存するので、日本とオランダ人では基準が違うことも知っている。さらに、これを人の名前で聞くと、「その人が女性だったら高いですが、男性だったら低いです」と、これも何も教えていないのに出てくるのです。もう愕然とするしかないわけです。
ですから、今ChatGPTを見ていて思うのは、単に文章の出現頻度を膨大に勉強しているだけなのに、いろいろなことがわかる。ということは、人間もそういうやり方でずっと勉強しているのかもしれない。それはどうなのかな、というのが、今一番興味のあるところですね。