チューリングテストについて改めて思うこと

A new thought about the Turing Test


2021/07/01
藤田昭人


唐突ですが…

久しぶりに読み物を書きたくなって 本稿を書いてます。

テーマは「チューリングテスト」です。

エッセイなどというオシャレな文章ではありませんが、
ちょっとした暇つぶしにはなるかとは思います😁


2014年のチューリングテストへの批判記事

本稿を書きたくなったのは、次の記事を見かけた事がきっかけでした。

www.itmedia.co.jp

3年前の2018年07月26日に公開された記事だったのですが、 タイトルの「4年前の『AIがチューリングテスト合格』騒動は何だったのか?」が 妙に挑発的に感じられたので覗いてみたところ…

この記事が問題にしているのは、 2014年6月8日に英国レディング大学で実施されたチューリングテストの実験でした。 「チャットボット Eugene Goostman がチューリングテストをクリアした」 との報道には僕にも記憶があります。 しかし、この記事は「チューリングテスト合格は本当?」と テストの正当性に疑惑を提示する文言が並んでます*1

確かに、このレディング大学のイベントに限らず、 チューリングテストに基づくコンテストには その正当性に疑義を突きつけられる事例もあるのですが…

2014年といえば アラン・チューリング法 が成立し、英国王室よりアラン・チューリングを始めとする 過去の同性愛を理由に逮捕・投獄された方々への恩赦が正式に発表された年です。 チューリング生誕100周年を祝った2012年の アラン・チューリング・イヤー に続き、英国がチューリングの名誉回復に祝ってお祭り騒ぎに沸いてる年に 開かれたチューリング関連のイベントに対し 後出しのように疑義を提示するというのは何とも無粋な感じですよね?*2

記事では、レディング大学のイベントを一通り腐した後、 アラン・チューリング自身が語った論文 "Computing Machinery and Intelligence" を持ち出してきます*3。 記事の著者としては「原典に当たれば、自ずと答えが見えるだろう」という思惑だったのでしょう。 が、残念なことに彼の思惑は大きく空振りだったようです。 著者が残したこの記事の結論は次のような1文でした。

私が感じたのは「思考する行為」と「思考しているフリの行為」の違いは何かという問題提起です。

この、尻切れトンボのような幕切れに僕は大笑いしてしまいました。
著者に申し訳ないですが、どうにも苦し紛れの一言のように僕には感じられて…
どうやらこの記事の著者は「チューリングテスト」を甘くみていたようですね*4

まぁ、その場は記事を笑い飛ばして終わったのですが(失礼)

数日後、この記事のある部分からちょっと想起されることがありました。 それが次のくだりです。

人間の頭の中はのぞけません。 その人の思想、信条を無理にでも知ろうとする行為は、自由に反します。法に触れる可能性もあるでしょう。 「思考しているフリ」をして「思考している!」と主張されれば、一体どうやってそれを証明できるでしょうか。

思考だけではなく、愛も、憎しみも、敬意も、軽蔑も、実際に目に見えないものをどうやって証明するのか。 同じように「そうではないこと」をどうやって証明するのか。非常に難しいと言えます。

「お前は私を愛していない」とレッテル張りされれば最後、どう反証しても目に見えませんから言葉で説明する他ありません。 その言葉を信じられなければどうしようもありません。

このくだりを改めて読んで想起されたのは「第2次AIブームの終焉」でした。 そこで、この文章だけを拝借して、僕なりの記事を書いてみたくなったという訳です*5


第2次AIブームの終焉

「第2次AIブームの終焉」と書くと非常にわかりづらいのですが、 僕を含めた現在50歳以上の情報系の面々には、 これは特に拘りのある問題ではないかと思います。端的に述べると 「いったい、いつから機械学習はAIの研究分野になったんだ!!」 ということです。

第2次AIブームが終わったのは概ね1990年前後だったと記憶してますが、 それまでAIは「思考のメカニズムを解き明かす」研究分野だと説明されていました。 当時、機械学習は既に存在していましたが、 それは単に「人間の振る舞いを模倣するだけ」と説明され 「AIではない」と指導教官や先輩に 嗜められる学生や若手エンジニアが多かったのです。 なので現在のAIブームが起こった時、 その中身が機械学習だと聞いて 「それってAIじゃないのでは?」 と反論する方々も多かったのではないでしょうか?

こういう思いを抱えているのは僕らだけではないようです。 例えば、今日のモダンなチャットボットの実装基盤のひとつである A.L.I.C.E. の開発者 リチャード・ウォレス はインタビューに次のように答えています。

At first, he said, he had tried to follow some of the more grandiose theories of traditional A.I., but he found them sterile. "You read a book with a title like 'Consciousness Explained,'" he said, "and you expect to find some kind of instruction manual, something that you can use to build a consciousness. But of course it's nothing of the kind." (Daniel Dennett wrote "Consciousness Explained.")

最初は、伝統的なAIの壮大な理論のいくつかに従おうとしたが、それは不毛だと思ったという。 彼が言うには「もし "Consciousness Explained" のようなタイトルの本を読んだとしたら、 ある種の手順書や意識を構築するために使用できる何かを期待するでしょう。 しかし、もちろんそのようなものは何もありません」 ということだ。 ("Consciousness Explained"『意識の説明』はダニエル・デネットの著作)

Artificial stupidity, Part 2 から引用

つまり、前述の記事のくだりは、第2次AIブームまでの 「思考のメカニズムを解き明かす」AI研究の 限界を指摘する素朴だけど痛烈な批判だと僕には思えます。

そこで、第2次AIブームの終焉の始まりを明確に示す出来事を調べてみたのですが…

それまでのAI研究に引導を渡したのは当時の DARPA/ISTO のディレクタだった ジェイコブ・T・シュワルツ だったそうです。

mathshistory.st-andrews.ac.uk

DARPA のディレクタと言えば ARPANET の構築や Internet の実現に辣腕を振るった ボブ・カーン が有名ですが、 シュワルツはその2代あとのディレクタです。 彼が引導を渡した経緯について調べてみたところ、 「AIの歴史」を語った歴史的名著 "Machines Who Think: A Personal Inquiry Into the History and Prospects of Artificial Intelligence" に次のような記述があることを見つけました。

Schwartz believed that DARPA was using a swimming model — setting a goal, and paddling toward it regardless of currents or storms. DARPA should instead be using a surfer model — waiting for the big wave, which would allow its relatively modest funds to surf gracefully and successfully toward that same goal. As a consequence, he eviscerated Strategic Computing, a swimmer model in his view (though Kahn’s original vision certainly seemed to be premised on catching the wave that was beginning to swell). Schwartz thought that in the long run, AI was possible and promising, but its wave had yet to rise, so a number of sites working on AI and robotics found their funding cut suddenly and brutally. Schwartz’s own interests lay in new architectures, which he favored as the swelling wave, and so he funded the revival of connectionism and machine intelligence, based on new findings in neural modeling.

シュワルツは、DARPA がスイマー・モデルを使っていると考えていた。 つまり、目標を設定して、流れや嵐に関係なく、その目標に向かってパドリングしているのだ。 しかし、DARPA はサーファー・モデルを使うべきだ。 大きな波を待っていれば、比較的少ない資金でも同じ目標に向かって優雅に成功することができる。 その結果、シュワルツは Strategic Computing を廃止した。 彼の考えでは、Strategic Computing はスイマー・モデルだった(ただし、カーンの当初の構想は、うねり始めた波を捕まえることを前提にしていたようだ)。 シュワルツは、長い目で見ればAIは可能で有望だが、その波はまだ高まっていないと考えていた。 そのため、AIやロボット工学に取り組んでいる多くのサイトでは、突然、残酷にも資金が削減された。 シュワルツは、自分の興味が新しいアーキテクチャにあり、それが波のように押し寄せてくることを好ましく思っていたので、ニューラル・モデルの新しい知見をもとにコネクショニズムや機械知能を復活させるための資金を提供した。

ここで登場する Strategic Computing とは第2次AIブームの際、DARPA がAI研究のために設立した組織です。 シュワルツはこの組織が助成する研究チームを切り替えることで、 旧来のAI研究に引導を渡したようです。またここで語られている 「ニューラル・モデルの新しい知見に基づくコネクショニズムや機械知能」 にはその後、今日の機械学習などへと発展する研究プロジェクトが含まれていました。

結局、我々の世代が習ったAI研究が「徒労とまでは言わないが、 いつなったら完成するのか全く見通せない代物」だったということは、 その後の歴史が示すとおりです。 前述のリチャード・ウォレスは、 別のインタビューでAIについて次のように語っています。

"The smarter people are, the more complex they think the human brain is," he says. "It's like anthropocentrism, but on an intellectual level. 'I have a great brain, therefore everybody else does -- and a computer must, too.'" Wallace says with a laugh. "And unfortunately most people don't."

「頭の良い人ほど人間の脳は複雑だと思っています」と彼は言う。 「人間中心主義に似ていますが、それは知的レベルの問題です」。 「僕は頭がいいから、ほかのみんなもそうする。コンピュータもそうしなければならない」とウォレスは笑う。 「残念ながらほとんどの人はそうではありません」

"Approximating Life" , July 7, 2002, Section 6 から引用

しかし、真の天才であるアラン・チューリングは、 彼の周囲にいる秀才たちが「問題を複雑に考えすぎて失敗する」ことに 気づいていたかも知れません。 そう考えると「チューリングテスト」の 「知能があると判定する基準」 を属人性のある曖昧な形に留めたことに、 不思議と納得できるような気がするのです。


チューリングテストの今日的な解釈

次はおそらくアラン・チューリングが全く想像できなかったであろう話、
今日のSNSにまつわる話です。

例えば、Twitter。僕も Twitter を日々利用しているのですが、 タイムラインを眺めているとモデルや女優と見紛うような美人の呟きが流れて来ることがあります。 もちろん面識のない女性です。そこでプロフィールを見てみるとごく普通の一般人のように見えます。 その時、僕が考えるのは…

  • 最新のコスメを駆使した「作られた可愛い」の人だろうか?
  • いや、最新アプリを使いこなした「画像合成美人」だろうか?
  • いやいや、どこから顔写真を盗んできたネカマかもしれない?
  • ひょっとして、これチャットボット何じゃないの?

…とまぁ、その美しさをシンプルに讃える訳ではなくて、 猜疑心をどこまでも肥大していってしまうことを告白します😀

今どきのSNSとチューリングテストの関係を端的に示す事例をもうひとつ…

最近TVCMでも見かけるようになった「ジェンダー・レス」ボーイの井手上漠くん(ちゃん付けした方が良いのかな?) 今どきの若者の彼は SNSも積極的に活用していて、例えば インスタグラムのアカウント も公開してます。 で、芸能人になったこともあってか フォローしておくと律儀に毎日のように 写真や動画をアップしていることがわかります。 これまた、タイムラインに唐突に現れるのですが… その写真を目にした瞬間 「この美人、誰?女性?男性?」 と一瞬混乱状態に陥ることも告白しておきます😀

「それとチューリングテストに何の関係があるんだ?」と突っ込まれそうですが…

チューリングテストの論文を思い出してください。 この論文は「人間 vs 機械」の比較テストについて 述べているのですが、 その冒頭で読者の理解を促すため 「男性 vs 女性」の事例について言及しています。 テレタイプ越しに「男性のフリをする女性」と 「女性のフリをする男性」が登場する話です。 不意に井手上漠くんの写真を突きつけられると、 ひとしきり混乱した後、 僕はいつもこのチューリングの語りを 思い出してしまうのです。 「彼なのだろうか?彼女なのだろうか?」と…

僕の、というか現在の多くの人々のこの日常は、 1950年に知能機械の可能性を探るためにチューリングが考え出したテストの舞台装置が、 今日の僕たちの日常になってしまっていることを意味しています。 さらにもっと言ってしまうと、 こういったデジタルコミュニケーションが推奨されるコロナ禍の今、 このようなコミュニケーションがさらに加速させるような圧力があります。

もちろん、 社会のこのような変化への是非について 皆さん色々な意見があると思いますが、 僕にとって重要なことは 今日の状況が僕たちのチューリングテストへの 理解や解釈を一変させてしまう…それが容易に想像できる状況に 今、僕らはいるという事実に、 僕はちょっと驚いてしまうのです。

それから気がかりなことがもうひとつ…

改めて考えると、僕たちは日常的に「フリ」をします。 「嘘をつく」だとか「他者を欺く」といった悪意あることはそんなに頻繁ではないでしょうが、 「見なかったフリをする」だとか「気づかなったフリをする」ことは案外多い。 また気まずい状況を笑に変えるためのジョークでは「誰かのフリをする」こともあります。 「優しい嘘」なんて言葉があるくらいですしね*6

SNSはこういった人間の「フリ」をする癖を助長させます。 例えば、Twitter では別にアカウントを取得して 別のキャラクターを演じたりすることがありますが、 これも日常的で些細な「フリ」の延長上にある行動だと思います。 ですが問題は、 こうやって生まれた「フリ」の発言も含む SNSのビッグデータ機械学習に使われることです。 学習する際に「正直」な発言と「フリ」の発言は 容易には区別できません。

もちろんSNS各社はトレンド分析などで、 このようなデータを使っているでしょうし、 そこから得られたデータの正しさに関する傾向も 常時把握しているのでしょうが…

彼らのデータの正確性を向上させるための基本戦略は「収集データを増やす」ことだけのように思います。 もし、僕にSNS各社のエンジニアに 質問できる機会があれば 是非この質問をブツけてみたいのですが、 きっと答えは 「正確性を向上するためいろんな補正をしています」 だとか 「それは社外秘なのでお答えできません」 だとか…

またまた「問題を複雑に考えすぎて失敗する」のような匂いがしてきませんか?

この問題を抜本的に解決する方策の1つに 「全部フリで発言された」と解釈することで、 これは多くのチューリングテストに基づく コンテストで用いられている方法のように思います。 つまり、チャットボットが 「人間のフリ」をするのに対し、 人間は「チャットボットのフリ」をする。 それで、どちらが(あるいはどれが) 一番、ジャッジを騙せたか?を競うのが 一般的なチューリングテストに基づくコンテストなんです*7。 もちろん、これが解決策になり得るのは 知能レベルを競うだけで (一般に素直に発言するよりも、フリをする方が知能が必要です)、 周囲はゲーム感覚で見てることができる チューリングテストに基づくコンテストの 場合だけであることは 言うまでもないのですが…

ともあれ…

SNSにより「フリをするコミュニケーション」 がコモディティ化している今日、 そのコミュニケーションにより 発言者の知能を評価するチューリングテストには 新たな役割が課せられるかも知れないなぁ… などと僕は考えています。


「思考する機械」の実像とは?

最後に、SNSのお陰で(あるいはせいで)僕らの身近なところに チューリングテストの世界が存在するようになった現在について考えたいと思います。

例えば、Twitter には相当数のチャットボットが存在します。 名前に bot と付いた明示したチャットボットもありますが、 そうではない存在を隠して「思考するフリをする」チャットボットも 多数紛れ込んでいるのではないかと僕は何年も前から想像してきました。 最初にそのように疑った時には何か薄気味悪い感じがしたかも知れません。 でも今はその時に感じた事も思い出せないくらい慣れっこになっています。 何故なら人間もチャットボットと同じぐらい「フリ」をするから。

この「思考するフリをする機械」はSNSだけの話ではないようです。 例えば、将棋AIを対戦したことのあるプロの棋士によると 「将棋AIと対戦しているとAIに意思や感情があるように錯覚することがある」 と言います。「指手で会話する」という感覚は僕には全く理解できないのですが、 仮にチャットボットでも「思考するフリ」をどんどん高度化していくと、 対話相手の人間にはそこに人格が存在するかのように 感じられるようになるのかも知れません。

これは漫画『攻殻機動隊』に登場する 「ゴースト」みたいなものなんじゃないかな?と思ったりします。 この作品の英語タイトルが "Ghost in the Shell" というぐらいなので、 「ゴースト」はこの作品シリーズで一貫するコンセプトだと思うのですが、 作品をご存知ない方のために少し紹介しておくと、主人公の 草薙素子は身体のほとんど 義体化 (機械化)してしまっているサイボーグであるにもかかわらず、 人間だった時の自我や意思(のようなもの)が残っていること感じ、 その理由を追い求めている…といった話です*8

この「ゴースト」というコンセプトは「チューリングテスト」を 非常にわかりやすくしてくれるのではないか?と僕が考えています。 例えば、僕自身が自分の自我をどのように感じ取っているのか?といったことを考えてみます。 もっとも自我を客観的に意識できる時といえば、 友人の誰かから意見を求められて答えたときに その友人から「それ、君らしいコメントだね」との返事が返ってくる。 それを聞いて「僕はそういう風な人間なんだ」と再確認することができます。 つまり人間は誰もが自分の自我を直接客観的に感じることはできない訳で、 その思考パターンなどを感じる他者からのリアクションを得て 自分の自我の形を間接的に把握してるのだ…と思ったりします。

この考えに立つと「チューリングテスト」は 非常に良くできたテストであるような気がしてなりません。 「ひょっとしたらチューリングは他にも何か書き残してるかも?」 と思うくらいです。

それが Turing Bot を作ろうと考えたもうひとつの理由かも知れません😀

僕的にはオチがつきました。 おあとが宜しいようで…

*1:記事の中で登場するレディング大学のプレスリリースは次で閲覧できます。

www.reading.ac.uk

ちなみに、記事中でも指摘されている 「It's not a "supercomputer," it's a chatbot.」には対応済みで、 ちゃんと chatbot に直されていました。

*2:その記事をあげつらっている僕も大人気ないですけどね😀

*3:この論文の原文は以下で読めます。

academic.oup.com

ですが非常に良くできた日本語訳も公開されています。

www.unixuser.org

日本語がネイティブの方にはこちらがお勧めです。

*4:実はこのブログでも「チューリングテスト」については かなりしつこく書いています。

次の記事は、かの Springer が出版している丸々一冊「チューリングテスト」の論文集で、 コンピュータサイエンティストだけでなく、心理学者、社会学者、歴史学者、果ては哲学者まで、 「チューリングテスト」で知られる錚々たるメンバーが寄稿しています。 僕は気になる記事だけ拾い読みした状態ですが、 それでも「チューリングテスト」が 難解な試験であることには納得しました。

akito-fujita.hatenablog.com

それから「チューリングテスト」に基づく 最古のコンテストであるローブナー賞については 2度書いてます。

akito-fujita.hatenablog.com

akito-fujita.hatenablog.com

ローブナー賞もなかなか興味深い裏事情があるようで…

ご参考まで。

*5:おかげで進めていた実装は棚上げになってしまいました。 待っておられる方はすいません。

*6:なので、件の記事で著者が 「人をだますのに集中したことに納得がいきません」 と強弁してることに笑っちゃいました。

僕たち自身は普段から嘘を連発にしてるのに、 チャットボットにはそれを許さないってこと?

…と思えたもんで😀

*7:件の記事の著者には、これ、納得してもらえるでしょうかねぇ?

*8:この作品の最初の 原作漫画 には欄外に大量の注釈があるのですが、 その中には「チューリング」との表記も見つけられます。

きっとこの作品もまた「チューリングテスト」にインスパイアされた作品なのでしょう。