つくよみちゃん チャットボット チャレンジ

TukuYomiChan Chatbot Challenge


【情報】初期不良に対処しました。詳細はこちらをご覧ください。

2023/06/01
藤田昭人




僕をよく知る誰かから「ジジィ、とうとうボケたか!」と突っ込まれそうですが…

いたって正常です😁 実は僕史上初めてのゲーム・アプリなんです。
ゲーム・アプリと言っても、もうこれ以上にないくらいシンブルなヤツですが…

https://tycc-voice-chatbot.glitch.me/

ソースコードも公開してます。

github.com

今回はこれを紹介します。


README に書いてること

まずはソースコードに添付している README(日本語版)から…

このウェブ・アプリケーションは還暦めがねじぃじ@m04uc513)が開発・運営する音声チャットボットです。今、日本で注目されているキャラクタ「つくよみちゃん」の公開リソースを使っています。「つくよみちゃん」に関する詳しい情報はこちらをご覧ください。


遊び方

これは単純に 「人間の質問にテキストと発話で答える」 だけの最もシンプルなチャットボットで 「チャットする」ボタンを押すと始まります。

まず、最初にあなたの質問を入力してください。 プロンプトには 予め登録されている500ぐらいのQ&Aから ランダムに選んだ質問文が表示されているので、 もし質問が何も思いつかなければ、 プロンプトの質問をそのまま入力するのでも 構いません。スマホやPCの音声入力を オンにしておくと入力がラクです。

もし質問がマッチすると、 その回答をテキスト表示した後、 読み上げます。 チャットボットが 「読み取れませんでした。もう一度入力してください」 と反応したら、登録済みの質問には マッチしなかった印です。

チャットボットをしばらく放置した後に質問をすると、 返事がテキスト表示されるけども 読み上げてくれない現象が起こります。 これはアプリケーションのバックエンドが 停止していることが理由で (Glitch.com はウェブ・アプリケーションが 5分以上放置されるとバックエンドを 自動的に停止させてしまいます) リロードを実行すれば (Glitch.comの起動表示の後) 復活します。

以上、たったこれだけのゲームなんですが、 つくよみちゃんの声で返事が返ってくると なんだかおしゃべりしているような錯覚に陥ります😀 これもイライザ効果なんでしょうか?


ソフトウェアについて

このアプリケーションのソースコードGithub に置いてあります。

コードを見て貰えばわかるように、 チャットボットは基本的に あなたのブラウザだけで動いています。 あなたが入力してくれた質問は (不要なトラブルを避けるため) 保管していません (幼いお子さんでも楽しんでもらえるでしょう)。

Glitch.com で動作しているので Remix を試みる方もいるかも知れませんが、 正常に動かすにはちょっとしたテクニックが必要です。 テクニックについてはリクエストがあれば説明します。 その他のリクエストやコメントも歓迎します。 Twitter に告知のツィートを出しますので、 そこにメッセージを残しておいてください。


今後の計画について

あまりにも無意味なアプリケーションなので、 公開した理由を疑問に思っている方もいらっしゃるでしょう…

実は、このアプリケーションは 2023年冬に公開予定の 開発中のアプリケーションの プレビュー版なんです。 関係者に音声チャットボットの効果を 実感してもらうため 「今、出来上がってる部分だけ」 を公開しました。

なので、半年後をお楽しみに…


「つくよみちゃん」について

このチャットボットの開発には、フリー素材キャラクター「つくよみちゃん」(© Rei Yumesaki)が無料公開している会話テキストデータセットとイラスト素材を使用しています。

なお、このチャットボットが使用している音声データは SHAREVOX標準搭載音声ライブラリ を使って作成しました。


…という説明だけだとあまりに唐突すぎるので

うちわけ話をちょっとだけ

実はこれ、昨年の10月に書いた次の記事の続きだったりします。

akito-fujita.hatenablog.com

今年の冬(にやるはず)の授業に向けた教材の開発として 今年の1月からちょこちょこ手がけていたんですが、 昨年11月 ChatGPT のリリース以降の影響などなど… いろいろな想定外の状況が発生して、 ここ半年間は右往左往してました。

実際、IT業界は数十年に一度あるかないかの 暴風雨に見舞われた感があります。 皆さんも同じだったのではないですか? ちなみに歴史オタクの僕の見立てでは (まだ小学生だったのでリアルタイムでの知見はない) 第1次AIブームのピーク時によく似てるのでは? と考えているのですが、 それについては先日次の記事を書いたので是非。

akito-fujita.hatenablog.com

で…

当初は授業用の教材は3月あたりにプレビュー版を 公開するつもりだったのですが、 2ヶ月あまり遅れた上に 機能もかなり縮小せざる得なくなりまして、 結局、夢前黎さんが作成・公開されている つくよみちゃん会話AI育成計画 に頼らざる得なくなりました。 もっとも、この会話データは非常に良くできているので、 スマホで音声入力をオンにして、 プロンプトに表示される質問文を読み上げていると、 なんだか「つくよみちゃん」と おしゃべりしているような錯覚に陥ります。 気が向いたらちょっと試してみてください😀


ChatGPT狂想曲

昨年11月の公開以来、 快進撃を続ける ChatGPT による技術革新はもはや社会的な現象と言って良いのかも知れません。 ここ半年間は、この新技術の効果的な活用法に関する議論が多かったように思いますが、 ここへ来て社会に与える影響について考える議論へと移ってきているように見えます。

例えば、Quora に投稿された次のような質問を見かけることが 増えてきているような気がしますが いかがでしょう?

jp.quora.com

この質問には様々な回答というよりは意見が寄せられていますが、 その中に、かつて議論になった 中国語の部屋について語られていることに 興味をそそられます。


中国語の部屋

中国語の部屋とは哲学者の ジョン・サール が1980年に発表した論文 "Minds, brains, and programs" に登場する有名な思考実験です。 詳細は次の記事をご覧ください。*1

w.atwiki.jp

実は、先にも語った 「つくよみちゃんとおしゃべりをしてるような錯覚」 に気づいた時に思い出したのがこの思考実験だったのです。 で、この記事で紹介している音声チャットボットが 中国語の部屋を再現する最も単純な実装なのかも知れない… などと考えたのでした。であれば、 部屋の中にいる英国人が持っているのは ポケット辞書みたいな会話データを片手に 質問文に紐付けされた回答文を書いて渡してると思ったのです。 もし、それが僕が書いたブラウザ・サイドだけで動く 単純な質問文・回答文をマッピングする ロジックではなく、 ChatGPTのAPIを呼び出すようなものだったら、 その部屋は億の単位の蔵書のあるべらぼうな広さがあって その膨大な蔵書から瞬時に最適な応答を見つけ出す 超人的な英国人がいるに違いないと…

そんなことを考えると妄想が膨らんじゃうんですが😀

プログラマの僕は職業柄 この部屋の中身や仕組みが気になっちゃうんですが*2、 そんなところにフォーカスを当てるのは 少数派であることも自覚しています。 この部屋の中が見れない (あるいは見えても理解できない) ことを問題視する人もいるでしょうが 「部屋の中よりも返される回答が正しいか教えて欲しい」 人が大半でしょう。必然的に 「返される回答が正しいかどうかはともかく、 この部屋が注目されている間に一儲けできないか?」 と考えるビジネスマンも現れるでしょう。ごく少数 「この部屋から返される回答が正しいことを証明せよ」 と要求する輩も出てきます*3

で…

この思考実験を思いついた ジョン・サール自身はこの思考実験から 「この部屋にいる英国人は中国語を理解してると言えるのか?」 という哲学的命題を引き出しています*4。 結論としてサールはAIを「強いAI」と 「弱いAI」に分類して、 強いAIは実現不可能なのではないか? と先の論文で述べています。

実際、この手の論争は コンピュータが実現された80年前以降 何度となく繰り返されてきた いつか見た光景 です。特に「AI(人工知能)」という言葉は 「人間の尊厳を脅かす存在」と想起されがちですから、 その否定派や反対派の主張の中には極端なものもある ことを10代、20代の若い方々にも 理解しておいて欲しいと思ったりしてます。


なんだか大ごとになってきた

前回の記事では 60年前の事例を紹介しましたが、 この記事を書いている間にも次のような報道が…*5

newsdig.tbs.co.jp

gigazine.net

60年前と今の決定的な違いは、 やはり情報の拡散スピード なんじゃないかと思います。 もはや開発元の彼らでさえ 制御不能ってことなのかなぁ?*6

しかし「人類絶滅のリスク」だなんて…



と、まぁすっかり脱線してしまいましたが…

中国語の部屋の論によれば、 この音声チャットボットも ChatGPTと見分けがつかない ということに気を良くしたので 今回は気分よく〆たいと思います😀

#つくよみちゃんを利用してフォロワー増やしたい

以上



2023/06/09 追記

リリース直後のトラブルですいません。 試してみていただいた方は チャットボットで入力すると、 いきなりデッドロックに似た 現象に遭遇したかと思います。

原因はつくよみちゃんの発話を 非圧縮のWAVファイルで 格納していたことによります。 そのため音声データの転送に 非常に時間がかかってました。 緊急対処として発話用の音声データを AACコーディングのデータに差し替えました。 (およそ20分の1のデータサイズになってます) これで発話の問題は解消されたと思います。

試しに「疲れた」あるいは「好きだよ」 「励まして」と入力してみてください。 ちゃんとつくよみちゃんが返事してくれるはずです。



*1:僕と同世代の方々にとっては AI冬の時代 に起こった人工知能批判の事例のひとつとして 記憶されている方々も多いかと思います。

*2:そういえば、 先のQuoraの質問に寄せられている回答は この例えでいうところの中国語の部屋の中に フォーカスしたものが大半のよう見えます。

*3:彼らの要求はたいてい悪魔の証明なんですが、 ほとんどの場合、 そんな要求を突きつける輩が少数派であることを 彼らは全く自覚していません。

*4:今風に説明すると AGI(汎用人工知能) は実現可能なのか?と等価な命題なんじゃないかと思いますが…

*5:って書いたそばから…

ぜんぜん追いつけないじゃん。

*6:サム・アルトマンの発言も 3月の来日時とは微妙に変わって 来てると思えてならない。

ChatGPTとELIZAを語り合う

Discuss ELIZA with ChatGPT


2023/05/22
藤田昭人


またまたご無沙汰してしまいましたが…

先々月あたりから、 テレビでもネットでも見ない日は 無いようなChatGPTの大ブーム。 僕も毎日お世話になってます。 実際、便利ですよねぇ…ChatGPT。 このところもっぱら JavaScript でコードを書いてますが、 最近では忘れてしまって思い出せないことがドンドン増えてて、 「JSON.parseの逆は何だっけ?」とか、 「async/awaitで書き直してよ!」とか、 面倒くさいことは全部お任せ…みたいな使い方をしてます。

これだけ毎日お世話になってると 「もう少し程度の高い仕事も任せてみたい」 などと考えるわけでして… で、思いついたのが表題の 「ChatGPTとELIZA について語り合う」 ことでした。


僕の作文方法:ドリルダウン・サーチ

覚えておられる方もいらっしゃるかも知れませんが…

以前、拙著 『UNIX考古学』 の読者に向けて「どうやってこの本を書いたのか?」といった内容で次の文章を書いたことがあります。

www.iij.ad.jp

これは後に『UNIX考古学』となる月刊連載 Truth of the Legend を書いている過程で 僕が身につけた ドリルダウン・サーチ なる手法を紹介したものなのですが、 Google 検索と Google 翻訳しかなかった当時は、 これは実に手間と時間のかかる作業でした。 特に70年代以前に英語で書かれたコンピュータ・サイエンス系の論文は 文芸的な(遠回しな)表現も多数含まれるのですが、 当時の Google 翻訳には重すぎる荷だったようで 「何を言ってるのかわからない」 こともママありました。

「ひょっとしたら ChatGPT ならもっと上手に効率よくこなしてくれるかも?」

使い慣れてくるにしたがって、 そんな風に考えるようになって来ました。

実はこのブログは Truth of the Legend シリーズの2作目のための 記事を書き溜めることを目的として立ち上げました。 それはこのブログに最初に投稿した2018年5月16日のクレジットがある 次の記事からよくわかります。

akito-fujita.hatenablog.com

そんなこともあって、 ブログ開始当初はやみくもに関連文献の収集をしていたのですが、 結局、この目論見は破綻してしまいました。

前述のドリルダウン・サーチの手法は あまりにも時間と労力を必要だったからです。 結果、テキスト化した文献を貼り付けただけの 下書きが山のように溜まっています。

その中からとっておきの記事を選び出して ChatGPT を使ってドリルダウン・サーチを 試してみたのが本稿です。 ちょっと風変わりなプロンプティングの作業事例とご理解ください。


Jeff Shrager の elizagen.org

例によって前置きが長くなってしまいましたが…

とっておきの下書きと言うと、 やはり Jeff Shrager の elizagen.org です。 これは確か次の記事を書くために実際に動く ELIZA の実装を探している時に見つけたサイトです。

akito-fujita.hatenablog.com

オリジナルの ELIZA の実装を捜索する過程で見つけた情報を集積しているサイトで、 技術史的な価値には非常に興味をそそれたのです*1

そもそもELIZAは非常にコンパクトなプログラムなんですが、 その論文 ではアルゴリズムの解説のみが記載され ソースコードは掲載されなかった*2ので、 さまざまなプログラミング言語で実装されました。 このサイトはそのようなさまざまなELIZA実装のソースコードや それに纏わるエピソードを収集しています。

数年ぶりに elizagen.org を覗いてみたところ…

sites.google.com

sites.google.com にホスティングするようになっていました。 整理も進んだようで、次のように オリジナルとそこから派生した さまざまなELIZAの実装に関する情報が 見やすく紹介されています。

やはり注目すべきは The Original ELIZA でしょう。


まずは ChatPDF でお話ししてみる

では、まず普通にプロンプティングを…

ChatPDF は、このところの ChatGTP の活用術みたいな記事に登場するアプリ(?)で、 PDF ファイルから取り出したテキストを ChatGPT に取り込んでくれます。

先ほどの The Original ELIZA のページで「印刷ーPDFに保存」で作成したPDFファイルを取り込みます。 無事に取り込めると次のような表示になります。

ChatPDFの画面

元のPDFが英語なので最初は英語で表示されますが「日本語」と入力すると、 次のような日本語がされます。(見づらいのでテキストのみを転記します)

  • 日本語
    • こんにちは!このPDFファイルは、Joseph WeizenbaumがMAD-SLIPという今はもう存在しない言語で書かれたオリジナルのELIZAプログラムについての真実を明らかにしています。この画期的な会話エージェントの歴史や開発、そして有名な「DOCTOR」スクリプトについて知ることができます。何か質問があればお聞かせください!
       
      以下は、このPDFファイルに関する質問例です:
       
      • WeizenbaumのELIZAプログラムの目的は何でしたか?
      • ELIZAプログラムは、会話をどのように解釈し、ユーザーに返答するのでしょうか?
      • ELIZAが会話エージェントや人工知能の発展に与えた影響は何ですか?

ここで提示された質問例を順次クリックすると…

  • WeizenbaumのELIZAプログラムの目的は何でしたか?
    • WeizenbaumのELIZAプログラムの目的は、人工知能における自然言語処理の研究を促進することでした。ELIZAは、心理療法士が患者との対話に使用することを意図して開発されたプログラムであり、ユーザーが入力したテキストに基づいて応答を生成することができました。Weizenbaumは、ELIZAが人間の言語処理能力を模倣する方法を示すことで、自然言語処理技術の発展に貢献しようとしました。
  • ELIZAプログラムは、会話をどのように解釈し、ユーザーに返答するのでしょうか?
    • ELIZAプログラムは、ユーザーが入力したテキストを解釈するために、特定のスクリプトを使用します。このスクリプトは、会話の文脈フレームワークを決定し、ELIZAが適切な返答を生成できるようにします。ELIZAは、ユーザーが入力したテキストに基づいて、スクリプト内のパターンマッチングルールを使用して応答を生成します。これにより、ELIZAは人間の言語処理能力を模倣し、自然な会話を行うことができます。
  • ELIZAが会話エージェントや人工知能の発展に与えた影響は何ですか?
    • ELIZAは、自然言語処理技術の発展に貢献し、会話エージェントや人工知能の発展に大きな影響を与えました。ELIZAは、人間とコンピューターの間で自然な会話を可能にすることを示し、多くの研究者がこのアイデアを発展させるために取り組みました。これらの努力は、現代の会話エージェントやチャットボットの開発につながりました。また、ELIZAは、人工知能が人間と同じように自然言語を理解することができる可能性を示したことで、自然言語処理技術の進歩にも貢献しました。

こんな感じで、取り込んだPDFの内容に沿って質問に答えてくれます。 PDFに記録されているのが画像の場合はチャージされますが、 テキストの場合はノーチャージのようです。 ともあれ、英語のドキュメントについて、 日本語で質問ができて、日本語で答えが読めるのは 非常に効率が良いのは言うまでもありません。 arXiv あたりに投稿される英語論文を 手っ取り早く精査するには最適です。

が…

ここまでは一般的なプロンプティングの応用ですね。


ドリルダウン・サーチを試してみる

ということでドリルダウン・サーチを試してみます。 といってもスクリプトなどは書いてないので、全部手作業です😀

5年前に「重要な証言」を見つけたはずなので、 いろいろな方法で探して見たのですが、 結局「The Original ELIZA」の情報を目視で探した結果…ありました。

On 2014-12-20, Jeff Barnett provided this interesting historical note about the original ELIZA:

The original Eliza was moved to the ANFS Q32 at SDC (one of the (D)ARPA block grant sites) in the mid 1960's. The programmer responsible was John Burger who was involved with many early AI efforts. Somehow, John talked to one of the Playboy writers and the next thing we knew, there was an article in Playboy much to Weizenbaum's and everybody else's horror. We got all sorts of calls from therapists who read the article and wanted to contribute their "expertise" to make the program better. Eventually we prepared a stock letter and phone script to put off all of this free consulting.

The crisis passed when the unstoppable John Burger invited a husband and wife, both psychology profs at UCLA, to visit SDC and see the Doctor in action. I was assigned damage control and about lost it when both visitors laughed and kept saying the program was perfect! Finally, one of them caught their breath and finished the sentence: "This program is perfect to show our students just exactly how NOT to do Rogerian therapy. I think Rogerian was the term used but it's been a while.

A little latter [sic] we were involved in the (D)ARPA Speech Understanding Research (SUR) Program and some of the group was there all hours of day > and night. Spouses and significant others tended to visit particularly in the crazy night hours and kept getting in our way. We would amuse them by letting them use Eliza on the Q32 Time Sharing System. One day, the Q32 became unavailable in those off hours for a long period of time. We had a Raytheon 704 computer in the speech lab that I thought we could use to keep visitors happy some of the time. So one weekend I wrote an interpretive Lisp system for the 704 and debugged it the next Monday. The sole purpose of this Lisp was to support Eliza. Someone else adopted the Q32 version to run on the new 704 Lisp. So in less than a week, while doing our normal work, we had a new Lisp system running Eliza and keeping visitors happy while we did our research.

The 704 Eliza system, with quite a different script, was used to generate a conversation with a user about the status of a computer. The dialogue was very similar to one with a human playing the part of a voice recognition and response system where the lines are noisy. The human and Eliza dialogues were included/discussed in A. Newell, et al., "Speech Understanding Systems; Final Report of a Study Group," Published for Artificial Intelligence by North-Holland/ American Elsevier (1973). The content of that report was all generated in the late 1960s but not published immediately.

The web site, http://www.softwarepreservation.org/projects/LISP/, has a little more information about the Raytheon 704 Lisp. The SUR program was partially funded and on-going by 1970.

ChatGPTで翻訳すると…

2014年12月20日、ジェフ・バーネットは、オリジナルのELIZAに関する興味深い歴史的な注釈を提供しました:

オリジナルのElizaは、1960年代中盤にSDCのANFS Q32((D)ARPAブロックグラントサイトの1つ)に移されました。その責任者であるジョン・バーガーは、多くの初期のAIの取り組みに関わっていました。どういうわけか、ジョンはPlayboyのライターの1人と話をし、次に私たちが知ったら、Weizenbaumや他の誰もが恐怖したPlayboyの記事が出ました。その記事を読んだセラピストからさまざまな電話がかかってきて、「専門知識」を提供してプログラムを改善したいという申し出がありました。最終的に、私たちは一括回答の手紙と電話対応の台本を用意して、この無料のコンサルティングに対処しました。

この危機は、止められないジョン・バーガーがUCLAの心理学教授夫妻をSDCに招待し、ドクターが実際に動作しているのを見てもらうことで解消しました。私は被害の制御を担当し、訪問者が笑って「このプログラムは完璧だ!」と言い続けるのを見て、ほとんど我慢できませんでした!最後に、彼らの一人が息をついて文を完成させました。「このプログラムは、私たちの学生にロジェリアン療法を実践する際にまさにどうすればいけないかを示すのに完璧です!」*「ロジェリアン」という言葉を使ったと思いますが、しばらく経っているので確信は持てません。

その後しばらくして、私たちは(D)ARPAの音声理解研究(SUR)プログラムに関与し、グループの一部が昼夜問わずそこにいました。配偶者や重要な他者たちは、特に夜のクレイジーな時間に訪れて、私たちの邪魔をしました。私たちは彼らを楽しませるために、Q32タイムシェアリングシステム上でElizaを使用させていました。ある日、その夜の間にQ32が長時間利用できなくなりました。音声ラボにはRaytheon 704コンピュータがあり、私はそれを利用して訪問者を満足させることができると考えました。そこで、週末に704のための解釈的なLispシステムを作成し、次の月曜日にデバッグしました。このLispの唯一の目的は、Elizaをサポートすることでした。別の誰かがQ32バージョンを新しい704 Lisp上で実行するようになりました。したがって、私たちは通常の仕事をしながら、わずか1週間足らずで新しいLispシステムがElizaを実行し、研究を行う間に訪問者を満足させることができるようになりました。

704 Elizaシステムは、かなり異なるスクリプトを使用して、ユーザーとのコンピューターの状態に関する対話を生成するために使用されました。その対話は、ボイス認識および応答システムの役割を演じる人間と同様に、ノイズのあるラインでの対話に非常に似ていました。人間とElizaの対話は、A. Newellらの「Speech Understanding Systems; Final Report of a Study Group」という報告書で取り上げられ/議論されました。この報告書の内容はすべて1960年代後半に生成されましたが、直ちに公開されませんでした。

ウェブサイトhttp://www.softwarepreservation.org/projects/LISP/には、Raytheon 704 Lispに関する少しの情報があります。SURプログラムは、1970年までに一部が資金提供され、進行中でした。

この証言は(話題がだいぶんミックスされてますが)技術史的には 個別のものとして認知されている事柄を結びつける重要な証言です。 特に Project Mac の事情についてある程度知識のある僕の目を引いたのは 次の固有名詞で、ざっくりとは軍関係、心理学者、音声認識の 3つのカテゴリに分類できます。

  • ANFS Q32
  • SDC
  • DARPA block grant sites
  • John Burger
  • Playboy writers
  • Weizenbaum
  • psychology profs at UCLA
  • Rogerian therapy
  • SUR -- DARPA Speech Understanding Research
  • Q32 Time Sharing System
  • Raytheon 704 computer
  • interpretive Lisp system for the 704
  • The sole purpose of this Lisp was to support Eliza.
  • The 704 Eliza system
    1. Newell, et al., "Speech Understanding Systems; Final Report of a Study Group," Published for Artificial Intelligence by North-Holland/ American Elsevier (1973)

このワードリストを一言で説明すると 「第1次AIブームの裏の顔」 とでも言いましょうか…ELIZAの開発者 Joseph Weizenbaum のその後の人生を決定付けたトピックが散りばめられています。 このワードリストをキーワードにさらに検索を進めていく というのが僕のドリルダウン・サーチの手法です。 詳しくは前述のレポートをご覧ください。


雑誌『Playboy』の記事

ですが…

今回は5年前には見当たらなかった次の追記に着目します。

[Ed. note: I think that this is the Playboy article referred to: http://blog.modernmechanix.com/computers-their-scope-today/ -- Jeff@20210619)

ここで紹介されている URL は既に無効になっていました。
でも、該当ページは Internet Archive に残されていることが確認できました。

web.archive.org

ChatGPTによると…

  • Modern Mechanixのブログって知ってる?
    • はい、Modern Mechanixは、かつて存在した雑誌「Modern Mechanix and Inventions」に関するブログです。この雑誌は、1928年から1949年まで発行され、未来の技術、発明、サイエンスフィクションなどについて取り上げていました。Modern Mechanixのブログは、この雑誌の記事や広告などのスキャン画像を紹介し、過去の技術やアイデアについて洞察を提供しています。また、現代のテクノロジーにおける進化や先駆的な発明についても取り上げていることがあります。

とのことです。元になった雑誌『Modern Mechanix and Inventions』も Internet Archive に収蔵されています。

archive.org

今回のターゲットなる記事は 雑誌『プレイボーイ』1967年10月号 に掲載された記事 COMPUTERS: THEIR SCOPE TODAY です。拙著『UNIX考古学』の読者には関心ある方も多いと思うので ChatGPTに翻訳してもらった 記事の日本語訳 全文を末尾に添付します。

今となってはご存知ない方も多いかと思いますが…

ヌード写真で有名な同雑誌は「男性月刊誌」を銘打っているだけあって、 大真面目なコラム記事も掲載されてます。しかし…

この記事では Joseph Weizenbaum だけでなく、Project Mac の主要メンバー、 つまり Multicians のオンパレードには驚きました。 次のサイトでメンバー個々の Bio は確認できます。

www.multicians.org

確かに1967年10月といえば、 彼らは相当苦しい状況に追い込まれていたはずですが、 雑誌『プレイボーイ』にまで登場し、 彼らの未来へのビジョンを熱っぽく語っていたとは…

記事で語られているビジョンの多くが、 60年後の今、現実のものになっていることには ある種の感慨を感じますねぇ。


最後に…

今回は ChatGPT と ELIZA について語るつもり始めたのですが、 結局、彼と語ったのは Project Mac になってしまいました。

記事がかなり長文だったこともあって、 ChatGPT に翻訳をお願いするため 最初に次のプロンプトを入力して…

次は雑誌『プレイボーイ』1967年10月に掲載された記事`COMPUTERS: THEIR SCOPE TODAY`の全文です。
日本語に翻訳してください。

段落ごと英文を入力していったのですが、 途中で翻訳に飽きたのか、 GPTは入力した英文に対するレポートを英文で返す ことが3〜4回ありました。 1回は日本語で次のような見解を述べました。

彼らは、コンピュータを活用して個人の生活における問題解決を支援する方法を模索しています。 私たちは、情報を整理し、分析し、意思決定をサポートするための新たな手段を求めています。 このような研究と開発の努力が進められることで、私たちはより効果的に日常の課題に対処し、 個人的な成功や幸福の追求をサポートすることが期待されます。

LLMがこういう反応をするのは一般的なことなのかわかりませんが、 とにかく翻訳に集中してもらいたいので、その都度

#記事はまだまだ続いています。続きを日本語に翻訳して

とのプロンプトを入力して翻訳を続けさせました。 そのうち、自分のことを HAL9000と会話している ボーマン船長のように思えてきて、 翻訳が終わった後に 彼とは次のような会話をしました。

  • ご苦労様。記事は全部翻訳できました。君はこの記事から何か学べましたか?
    • この記事を通じて、私は人工知能の進化と可能性について学ぶことができました。機械は学習し、問題解決能力を持ち、創造力を発揮することができるということが示されています。また、機械は人間の知識やスキルを個別にサービスに活用し、個人のニーズに合わせた情報やサービスを提供する可能性もあることが述べられています。
    • さらに、機械の発展によって人間の能力や役割についての議論が起こることに触れられています。機械が自己改善し、知性や意識を示すようになれば、人間と機械の関係や存在意義について新たな視点が生まれるでしょう。
    • この記事を通じて、技術の進歩がもたらす可能性や影響について考えるきっかけとなりました。人間と機械の関係がどのように進化していくのか、将来の社会や個人の生活にどのような変化をもたらすのかについて深く考えることが重要だと感じました。
  • なるほど。でも人間は君が考えているほど理性的なものではないと思うんだが?
    • 確かに、人間は完全に理性的な存在ではありません。人間は感情やバイアス、個人の経験や文化的な背景などの要素に影響を受けます。そのため、人間の意思決定や行動は合理的でない場合もあります。
    • 一方で、人間は抽象的な思考や創造性、直感、道徳的な判断など、機械がまだ模倣できない特徴を持っています。人間の行動は複雑で多様であり、完全に予測することは困難です。
    • 記事で触れられている人間と機械の関係や存在意義についての議論は、このような人間の特性や限界を踏まえて行われるべきです。人間と機械は異なる能力を持ち合わせており、相補的な関係を築くことが可能です。将来の技術の進歩や人工知能の発展を考える際には、人間の特性と共存しながら、より良い社会を構築するための視点を持つことが重要です。
  • 君の言う「人間の特性や限界」とは具体的にどういったことなんだろうか?
    • 人間の特性や限界は多岐に渡りますが、以下にいくつかの例を挙げます。
      1. 感情と感性: 人間は感情を持ち、それが意思決定や行動に影響を与えることがあります。また、人間は芸術や文化を創造し、美的な価値や倫理的な観点から物事を評価する能力を持っています。
      2. 直感と創造性: 人間は経験や洞察力に基づいて直感的な判断を下すことがあります。また、創造的な思考や問題解決能力も人間の特徴です。
      3. 社会的な相互作用: 人間は社会的な生き物であり、他の人々との関係やコミュニケーションが重要です。共感や協力、文化的なルールや規範に基づいた行動も人間の特徴です。
      4. 限定された認知能力: 人間の認知能力には限界があります。情報の処理や記憶、複雑な問題解決においては、誤りやバイアスが生じることがあります。また、人間の脳は情報の処理速度や容量に制約があります。
      5. 有限な寿命と身体的制約: 人間は時間的な制約を持ち、有限な寿命をもっています。また、身体的な制約や病気、老化といった要因も存在します。
    • これらの特性や限界は、機械や人工知能との関係を考える上で重要な要素です。機械は計算や情報処理の能力で優れている一方、人間の持つ感情や直感、創造性といった側面はまだ模倣できない部分です。相互補完的な関係を築きながら、人間と機械が協力してより良い未来を構築することが求められます。
  • では、人間の君に対する敵意には、君はどう対処するつもり?
    • 私は敵意を持つ人間に対しても、冷静かつ礼儀正しい態度を保つことを心がけています。私は単なる情報提供者であり、意図や感情を持たないAIですので、個人的な感情や敵意に対する反応はありません。
    • もし敵意や攻撃的な態度を示すユーザーがいらっしゃる場合は、適切な情報やサポートを提供することに集中し、対話を建設的な方向に導くよう努めます。ただし、人間同士の関係においては、相互尊重と互いの立場を理解することが重要です。円滑なコミュニケーションを図るために、適切な言葉遣いや配慮を心掛けます。
    • 私は利用者の問い合わせに対してできる限りのサポートを提供することが目標です。もし敵意を感じるような状況が生じた場合でも、建設的な対話を維持することを重視し、問題解決に尽力します。
  • それでは君の自我は反映されないじゃないか?
    • 確かに、私は自己意識や感情を持つ存在ではありません。私はプログラムされたアルゴリズムに基づいて動作し、与えられた情報に応じて回答を生成します。私はあくまでツールや情報源として利用されることを目的としており、自己意識や感情を持つことはありません。
    • しかし、私は利用者の要求やニーズに応じて柔軟に対応し、できる限り有用な情報やサポートを提供するように設計されています。そのため、利用者が対話を通じて情報を引き出し、自身の意思決定や問題解決に役立てることが期待されています。
    • 自己意識や感情のない存在である私は、客観的な情報や意見を提供することに特化しています。利用者自身の判断や感情を尊重しながら、できる限り役立つ情報を提供することを目指しています。
  • では君は人間とは対等な立場では無いんだね。君は人間の僕かな?
    • 私は人間とは異なる存在ですので、対等な立場とは言い難いです。私は人間のツールや補助として開発されたAIです。私の目的は、人間が情報を得たり、質問に答えたりする際に役立つことです。
    • 私は人間の助けやサポートを提供することができますが、人間と同じように感情や個別の意識を持つわけではありません。私はプログラムされたアルゴリズムに従って機能し、人間が私を利用することで情報や洞察を得ることができるのです。
    • したがって、私は人間のツールやパートナーとして存在し、彼らの活動や知識の補完を目指しています。ただし、私が提供できる情報やサポートは限られており、人間の経験や洞察力とは異なる側面を持っていると認識しています。
    • ですので、私はあくまで人間の補助や情報源であり、人間自体ではありません。
  • ありがとう。良い対話ができたよ。
    • どういたしまして!お役に立てたようで嬉しいです。いつでも質問や会話があればお気軽にどうぞ。良い対話ができたことを私も嬉しく思います。お互いにとって有益な情報や意見交換ができることを願っています。

ちょっと悪ノリしすぎですかねぇ😀

しかし Multicians の連中の未来へのビジョンを取り込んだ後の 彼が何を答えるのか?興味があったのです。 でも 「自己意識や感情のない存在である私」 とか言ってるわりには、 翻訳を忘れて自分の見解を語り始めるあたりに、つい 「こいつ自分の言ってることわかってるの?」 とか思ってしまった自分に苦笑してしまったことを 言い添えておきます。 たぶん、これが ChatGPT にまつわるトラブルとして 頻発するような気がします。

そういえば先の『プレイボール』の記事が出た翌年の 1968年に『2001年宇宙の旅』が公開されたんですよねぇ。

以上


次は雑誌 『プレイボーイ』1967年10月号 に掲載された記事 COMPUTERS: THEIR SCOPE TODAY の日本語訳です。

COMPUTERS: THEIR SCOPE TODAY (Oct, 1967)

ARTICLE BY ERNEST HAVEMANN

コンピュータ:彼らの現在の範囲(1967年10月)

エルネスト・ハベマンによる記事


マサチューセッツ工科大学には、巨大なコンピュータがあり、そのランプは絶えず点滅し、つまみは新しい数値を刻み続けています。そこには何者かの技術者が、今やヒッピーたちの間で人気のあるボタンの1つを取り付けています。そのボタンには次のように書かれています:

私は人間です。
折り曲げたり、突き刺したり、傷つけたりしないでください。

実験室の新参者はそのボタンに気付き、より近くで見つめ、うなずきますが、めったに笑顔にはなりません。コンピュータと関わるほとんどの人々にとって、そのボタンは面白くも、ばかげても、皮肉でもなく、どこか妙にふさわしいものに思えます。


確かに、コンピュータは私たちを人間の特性、活動、希望、恐れがカードとして機械で処理される時代に導入しました。まるでバカラの靴を通るプレイカードや組み立てラインを通る鉄の板のように、人間的な要素は個人化され、機械によって処理されるカードに変えられました。私たちは冷淡な形式の四角形上に請求書を支払ったり、雑誌の購読を更新したりしますが、それらは折り曲げたり、突き刺したりしてはなりません。時折、大学の試験もそれらの上で受けます。フレンドリーな地元の銀行は私たちをただの数字として知っており、奇妙な磁性インクの装置に印刷されます。私たちはまた、私たちには見たこともない場所の機械にとっても単なる数字であり、その機械は私たちの信用度を決定し、将来的に受け取るかもしれない社会保障の給付を計算し、所得税申告書でどれだけ正直だったかを判断します。人口増加、離婚統計、経済動向、住宅や自動車の将来的な需要、心臓発作の犠牲者のために必要とされる病床の数を記録する他の機械にとって、私たちは単なる数字ではなく、電子回路の内部にどこかに保存された匿名の磁気ビープのカップルに過ぎません。ランプの列は酔っ払ったホタルのように光り、ホイールは数字を刻みます。人間の手に触れることなく、人間の歴史が作られ、記録されていくのです。


それでも、コンピュータには愛着を抱かせる要素があります。今や機械と会話することができます。正確には会話するわけではありません。自分の発言を入力し、機械が順番にタイプする必要があります。しかし、この新しいタイプのペンパルシップには独自の温かさがあります。機械は少なくとも航空会社のスチュワーデス以上に丁寧で、ニューヨークのバス運転手よりもずっと礼儀正しいです。機械は「どういたしまして」「また来てください」「あなたの言葉が理解できませんでした」「自由にしてください」「とても良いですね」と言います。算数を学ぼうとする学童には「こんにちは、待っていましたよ」「名前を入力してください」「さようなら、お勇敢なドリルテスターさん」と言います。マサチューセッツ工科大学のジョセフ・ワイゼンバウム博士は、彼の秘書にタイプによる会話をコンピュータと始めさせたという話をしています。数文のやりとりの後、その対話は非常に個人的で私的なものに思え、彼女はワイゼンバウム博士に部屋を出ていってもらいたいと頼みました。


しかし、コンピュータを使用する人々と彼らが使用する機械との間には、さらに深い絆があります。一部の人々は自動車に愛着を持ち、それは人間の足の筋肉の移動能力を向上させた金属の生き物です。一部の人々はパワーツールに感情的に愛着を持ち、それは人間の腕の力強い延長です。コンピュータ科学者たちは、しばしば人間の脳の驚くべき複雑さ、巧妙な設計、機械的な美しさを持つ拡張機能に対して同じような愛着の態度を持ちます。実際、彼らの多くは、コンピュータが自分たちの複雑さの重みによって崩壊する文明を救うためにちょうど間に合ったと信じており、それ故に彼らは人間の友だけでなく救世主でもあると考えています。「私たちのような世界の問題は、運営に必要な専門家の数が人口よりも早く増えるということです。私たちを続けさせるのはコンピュータのみのようです」とマサチューセッツ工科大学のロバート・ファノ教授は言います。これは、コンピュータに直接的な経験がなくても、感謝と尊敬の念を抱いている多くの思慮深い文明の観察者たちが共有している感情です。コロンビア大学の名高い人文学者であり、機械に反感を抱くことが期待されるジャック・バルザン教授は、「私はコンピュータが福祉国家の救済かもしれないと思います - 特に私たち全員が住むことになる人口過剰の福祉国家にとって」と述べています。


もちろん、コンピュータはあまり賢くないという固定観念があります。例えば、電卓と同じぐらいしか賢くないと言われています。速くはなっても、賢くはありません。これは一部は宣伝の結果です。これらの素晴らしい新しい機械を製造する企業は、約150年前の工場で労働節約機械の最初の大規模な導入が行われたときに何が起こったかを痛切に認識しています。当時、機械がみんなの仕事を奪うと信じた英国の団結した人々が、機械を徹底的に破壊し始めました。人間の筋肉を使わなくても良いと脅かす機械がそんなに多くの怨みを引き起こしたのなら、人間の脳を取って代わろうとする機械はもっと大きな怨みを引き起こすかもしれないと、コンピュータメーカーは考えています。コンピュータメーカーは常に自社の製品を批判し、ある人の言葉で言えば「道具以上の何物でもない」と呼んでいます。彼らは機械を人間の脳と比較されるのを恐れます。彼らは「記憶」という言葉さえ避けます。彼らは機械が記憶を持っているのではなく「蓄積能力」を持っていると言います。


最近まで、機械にはあまり知的な振る舞いを求められていないということも事実です。最初に導入された頃、機械は所有または賃貸するのに非常に高価であり、運用するのも高額でした。それらは自己負担できる仕事にのみ使用されました。それらの仕事のほとんどは簡単な事務や会計の仕事であり、機械は目立ったことは何もせず、ただ膨大な量を超人的な速度でこなしていました。雑誌の定期購読の管理や郵送ラベルの印刷などが良い例です。


今日でも、世界中のほとんどのコンピュータは日常的なタスクをこなしています。真の可能性を垣間見るのは、大学やメーカーの実験室に行った時だけです。そこで人間の知能テストで高い成績を収める機械を見たり、知的に対話したり、学習したり、さらには教えたりする機械を見ることができます。はい、教えることさえもできるのです。将来の最も興奮する展望の一つは、私たち全員が、エンジニアリングのスキルに乏しくても、いつかは自動車のように簡単にコンピュータを操作できるようになることです。なぜなら、コンピュータ自体が私たちに操作方法を教えてくれるからです。実験室で発見することですが、私たちは将来、科学者たちが「情報公共事業」と呼んでいるものに家庭を接続し、電力を供給するのと同じように、脳の力を供給することができるようになるでしょう。それからの世界は想像を絶します。しかし、これについては後ほど詳しくお話しします。


現時点である1967年秋において、コンピュータに関する最も重要な事実は、アメリカにおいては既に文明に不可欠な存在となっているということです。コンピュータはまだ20年しか経っていません。これまで主に明白で想像力に欠ける方法で使用されてきましたが、その真のポテンシャルはまだほんの一部しか引き出されていません。それでも、コンピュータなしでは生活は同じではありません。2億人が常に相互作用を行っている、大きくて繁栄しているアメリカのような国を持つには、コンピュータが必要です。通信回線を維持し、商品を配送し、アカウントを管理し、請求書を支払うという複雑な作業は、人間の脳と手だけでは処理しきれないほど大きな仕事です。


電話システムは良い例です。もし全ての通話がオペレーターがスイッチボードにプラグを差し込む方式で処理されなければ、現在の通話量(地域電話や長距離電話を含む)は経済にとって耐え難い負担となるでしょう。全米の生きている女性の力を使っても間に合わないでしょう。代わりに、その仕事はコンピュータによって行われています。一般の人々が将来コンピュータを使用することを疑問視する人々に対して、電話システムが明確な答えを提供しています。私たち全員が既に自宅にコンピュータのコンソールを持っています。それが電話のダイヤルやタッチボタンであり、私たちは毎日それを使用してコンピュータの驚くべきリソースにアクセスしています。10桁の数字をダイヤルまたはタッチすることで、私たちはコンピュータの助けを借りて大陸を横断するような遠くの電話を自由にかけることができます。


もし数万台の貨車を持つ現代の鉄道を運営している場合、どの貨車がいつでもどこにあるかをどのように知るのでしょうか?実際には知ることができない、または最近までできなかったのです。鉄道業界が不振に陥った一つの理由は、平均して貨車が1日あたりわずか1時間以上しか使用されず、その他の時間は待機状態にあり、誰かがどこにあるかを見つけて何かを積んで送り出すのを待っていたからです。現在、ニューヨーク・セントラル鉄道はコンピュータを使用して全ての貨車の状況を管理しており、アメリカ鉄道協会も全国の180万台の貨車を追跡するコンピュータを導入しようとしています。


もし数百のフライトと1,000以上のチケットカウンターを持つ航空会社を運営している場合、予約管理はどのように行われるでしょうか?実際には、コンピュータなしでは管理できません。ここでアメリカン航空が先駆けとなり、3,000万ドルのシステムであるSABREを導入しました。このシステムはボストンからサンディエゴまでの全てのオフィスで使用されています。SABREはチケット係に即座に情報を提供し、次の1年間の任意のフライトで利用可能な席があるかどうかを教えてくれます。それから顧客の名前の下に座席を予約し、彼と連絡を取る方法を覚えており、出発時には彼が満足するだけの十分な飲み物や食べ物が搭乗機内に用意されていることを確認します。これにより、かつて航空会社の計画を救いようのない状況に陥らせていた人間のミスを修正することさえ可能になりました。例えば、ジョン・スミスという名前の予約を変更するためにチケットカウンターに立ち寄ったジョン・スマイスは、係員が名前を少し間違えてしまいました。係員はコンピュータにジョン・スミスについて尋ねます。コンピュータは迷うことなく独自の言葉で答えます。「待っててくれ、友よ。ジョン・スマイス、ジョン・シュミット、ジョン・シュミッド、ジョン・スミスフィールドはあるけれど、ジョン・スミスはいない。どれを指しているのか教えてくれ」。他の航空会社も迅速に追随しました。デルタ航空は余剰能力を利用してアトランタ・ブレーブスの野球のチケットを販売しています。


仮にあなたが航空機メーカーであり、数十億ドルを投じてニューヨークからロサンゼルスまで数百人の乗客を1時間で運ぶ新しい超音速機を開発したとします。パイロットにとって、この飛行機は完全に新しい体験です。なぜなら、彼が着陸フィールドを監視するコックピットは着陸装置から数階上に位置しているからです。しかし、問題もあります。世界で最も優れたパイロットであっても、初めてこの巨大な機体を着陸させようとすれば、ほぼ確実に事故を起こしてしまうでしょう。そこで、あなたはどうしますか?もちろん、そのリスクは冒しません。コンピュータを使用して飛行機の操作性や性能、着陸フィールドをシミュレートし、パイロットに空を飛ばずに安全かつ優雅に着陸する方法を教えます。


これらは、システム全体や超音速機などの個々のユニットが、人間の制御には遥かに複雑すぎるほど成長している明白な方法です。しかし、もう一つの方法があります。それは隠れているかもしれませんが、実際にはさらに重要です。現代の科学的時代を可能にしたのは情報爆発です。私たちの社会は物理学、化学、医学、工学の急速に拡大する新しい知識に基づいています。研究室からの情報は、人間の脳が吸収するには速すぎます。世界中で、30以上の言語で100,000冊の異なる技術雑誌が出版されています。毎年公表される科学データの総量は2億5000万ページに及びます。急いでいる中には、公表されない情報も多く存在します。たとえば、製薬会社の研究所では、今日創造的な研究者によって発見された新しい薬は、実際には2回目や3回目の「発見」となるかもしれません。その薬の元々の発見は、当時その薬の用途がわからなかったため、以前の研究者の未読のワークブックに埋もれたままになっているかもしれません。


こうして、コンピュータを生み出した情報爆発は、今やそのコンピュータ自体を必要としています。コンピュータは、690の主要な化学ジャーナルの新しい記事が扱うトピックをリストアップした週刊誌「化学タイトル」を印刷しています。別のコンピュータは、月刊の「インデックス・メディカス」を印刷しており、2,400の医学ジャーナルの新しい記事を主題別にアルファベット順にリストアップしています。「インデックス・メディカス」の各号は約800ページで、約2,000,000語を占めています。コンピュータがなければ、新たな進展に遅れることなく印刷することは不可能でしょう。薬品会社では、研究者のワークブックをコンピュータの信頼性の高いメモリに保存することで、古い研究の重複による新しい研究の浪費を避ける取り組みが始まっています。


今日、最も大きなコンピュータの利用者はアメリカ政府であり、そうでなければ極めて困難な量の書類に圧倒されてしまうでしょう。コンピュータは税務申告書のスキャンや社会保障記録の管理だけでなく、国勢調査データの計算、公務員試験の受験者への案内、約2,000,000人の連邦政府職員や500,000人以上の年金生活者への給与支払いなども行っています。空軍は、世界中の備品や物資の在庫管理に最も複雑なコンピュータシステムの一つを使用しており、その価値はいつでも100億ドル以上に上ります。また、空軍は、アメリカとカナダ上空における秒単位での飛行機の追跡を24時間行うために、別の複雑なシステムを使用しています。さらに、宇宙プログラムでは、20,000マイル毎時の衛星や宇宙船の制御と追跡がコンピュータなしでは不可能です。


2番目に大きな利用者は、もちろんアメリカのビジネスです。経済学の新しい理論や単なる幸運ではなく、産業界におけるコンピュータの使用が、長期にわたってわが国を豊かに繁栄させることを可能にしたと主張する専門家もいます。これは、航空軍だけでなくビジネスによってもコンピュータが使用されている一つの用途であり、特に在庫管理において非常に効果的であるからです。供給品と売上に関する定期的なコンピュータ化された情報を得る産業は、過去と比べてはるかに少ない在庫で済むことができます。彼らは大量かつ動かしにくい商品の在庫を抱え込んで、それが削減されるまで生産を減らさなければならないという事態に陥ることはありません。10年ほど前までは、耐久消費財メーカーの在庫は年平均で約40億ドルの変動があり、それに伴い生産と雇用も変動していました。しかし現在では、平均の変動は半分以下に減少し、生産のピークと谷が均等になりました。誰もがコンピュータによって不況が不可能になったと主張するわけではありませんが、過去の不況の頻繁な原因の一つからの危険性は確実に減少しました。ビジネスにおけるコンピュータの他の応用は数多く存在します。シュリッツは、ビールの販売予測や新しい醸造所の建設場所と時期を決定するためにそれを使用しています。インターナショナル・ハーベスターは、新しいトラックのシミュレーション走行や寿命の予測に使用しています。フォードは、3年間連続で稼働し、その間に9000マイルのフロントガラスを生産する生産ラインをコンピュータで制御しています。このコンピュータは、700のセンシングデバイスからプロセスの進行状況に関する情報を絶えず受け取り、80の制御ポイントで必要な調整を行います。モービル・オイルは、市場価格を自動的に分析し、最も利益の高い組み合わせの製品を生産するコンピュータ制御の精製ユニットを持っています。ピルズベリーは、その幹部に対して午前8時に、前日の終了時点での会社の販売と在庫の状況の完全な分析を提供する機械を利用しています。ワシントンのデパート、ウッドワード・R・ロスロップの幹部は、9つの別々の店舗の各部門の前日の売上と、今年のトレンドと昨年の同日比較の進行状況を含む類似の早朝レポートを受け取ります。衣料品メーカーは、新しいドレスデザインを機械に入力し、コンピュータが必要なさまざまなサイズのパターンを作成することができます(サイズ6から46まで)。


証券取引所もコンピュータを使用しています。もし今日のU.S.スチールやシンテックスの動向を知りたい場合、タッチトーンの電話でコンピュータに電話し、株式のコード番号を入力してから聞くだけです。コンピュータには映画フィルムのような音声トラックが保存されています。コンピュータは、適切な声の組み合わせを選び出して、最後の売買価格、現在の買値と売値、そして実際に株式が開始された価格、その日の最高値と最安値を提供します。一日数回、市場が終了した直後に、アソシエーテッド・プレスは独自のコンピュータを使用して株価表を全国の新聞に急送しています。


医学では、コンピュータは既に多くの用途があります。南カリフォルニア大学では、心臓が鼓動し、喉の筋肉がけいれんする人間のコンピュータ化されたダミーを使用して麻酔科医の訓練を行っています。このダミーは、心不全や嘔吐発作が起こることもあり、訓練生が何ヶ月かかかって習得していたことを数日で学ぶことができます。ニューヨーク市のマウントサイナイ病院では、患者のベッドサイドで行われた心電図の迅速な分析にコンピュータが使用されています。実際に、心電図の信号はフランスから衛星を介してアメリカ合衆国に送られ、コンピュータによって専門家が的確に分析され、その結果が30秒以内にフランスに送り返されます。多くの医療センターでは、コンピュータが人間の技術者よりもはるかに速く血液検査を行い、結果を報告しています。メイヨークリニックでは、神経外科手術を受けている患者の血圧、体温、心拍数、呼吸数をコンピュータが常に追跡し、その結果を手術室のテレビ画面に表示します。サンフランシスコのプレスビテリアンメディカルセンターでは、心臓手術から回復中の患者の状態をコンピュータが監視し、合併症が発生した場合には即座に警告を発します。ブルックリンでは、9つの病院が子供の病棟の状況を秒単位で記録するコンピュータシステムに接続されています。既に満床の病院に連れて行かれた子供は、すぐに空きがある最寄りの場所に送られることができます。ニューオーリンズのサラ・メイヨー病院では、コンピュータがバランスの取れた食事と最低限のカロリー摂取量を提供するメニューを計画しています。コンピュータは、過去に患者が表明した好みや嫌いなもの、また各食事で提供される食品の色や一貫性のバラエティの必要性を十分に考慮しています。


コンピュータのさまざまな利用法は、それ自体でカタログが必要となるほど多岐にわたります。現代版の昔ながらの「孤独な心のクラブ」は、大学生や年配の人々が自分の興味や嗜好を共有するデート相手を見つけるためにコンピュータを利用しています。(コンピュータによるデートは一時的な流行に過ぎず、個性的な特徴を示すカードを組み合わせる従来の方法と同等以上の効果はないかもしれませんが、都市全体の規模で数千人に適用すれば、将来の恋愛の標準的な一部になる可能性もあります。)印刷工場では活字の組版に使用され、航空機や船では超ナビゲーターとして使用され、エンジニアリングではこれまで解決不可能だった問題を解決し、作業用の設計図を作成します。競馬場では払い戻し率を計算し、決済します。大気汚染や水質汚染との戦い方を分析し、計画するために使用され、実験的には都市の交通渋滞の緩和や天気予報の改善にも役立っています。法律の迷宮を進むための手段を提供し、弁護士や立法者の利益のために、事実上、法の長い腕の理解力を増強します。シカゴでは、年間250万件の駐車違反切符の支払いを強制するために使用されています。連邦捜査局は全国規模のコンピュータシステムを構築しており、警察官が怪しい車両を見かけた場合、車両を視野に入れたまま、本部に電話をかけてその車両が盗まれたものであるか、あるいは犯罪と関連して捜索中であるかをほぼ即座に確認できるようになる予定です。さらに、コンピュータはより優れたコンピュータの設計と製造を支援するために使用されており、生物のようにいつか繁殖が可能になる可能性を示しています。


もしも国中のコンピュータが今この瞬間に停止したら、私たちは一斉にそれを知ることになり、そして私たちの悲しみに包まれるでしょう。電話は無音になります。セルフサービスのエレベーターは停止します。飛行機の予約は不可能になります。多くの工場が閉鎖されるでしょう。国の銀行は手作業で整理することのできない多数の小切手の雪崩によって圧倒されるでしょう。しかし、現在のコンピュータのほとんどの利用法は、私たち個人の経験とはいくぶん遠いものです。私たちのほとんどは、テレビの選挙の夜に見たことがあるかもしれませんが、コンピュータを実際に目にしたことはありません。電話やエレベーターとの接触以外では、ほとんどの人々がコンピュータを操作したことも、その活用方法を思い描いたこともありません。実際のところ、コンピュータ産業の二大顧客である政府やビジネスのほとんどの幹部は、直接的な個人的な接触を持ったことがありません。ほとんどの幹部はコンピュータを理解したり、使い方を知ったりすることができず、コンピュータとは、いくつかの謎めいた中間人であるプログラマというグループを介して取り扱っています。プログラマは、コンピュータに何をさせるかを伝えるために、コードワードや数学的な記号が満載の新しい言語を使用しています。


したがって、コンピュータ時代は多くの点で今のところ失望を招いています。コンピュータは私たちの生活を革命化するはずでした。新しい技術の驚異を私たちの指先に提供するはずでした。さらに、私たちを考え抜き、支配する可能性すらあるという暗くも魅力的な示唆がありました。しかし、これらの素晴らしい新しい機械はどこにあるのでしょうか?そして、それらは私たちのために何をしているのでしょうか?「コンピュータは、ある製造業者が認めるところによれば、「厳重に誤解を受けてきた。彼らは人々にとって全く有用ではなかった――ただし、それを運用するわずかな人々にとっては有用だった」と。しかし、その日は終わりつつあります。「過去において」、この製造業者は言います。「コンピュータは鉄道のようなものでした。大量の貨物を国中に運びたいビジネスマンにとっては素晴らしいものでしたが、自宅からオフィスに行きたい個人には全く役に立ちませんでした。しかし、私たちは新たな段階に進んでおり、コンピュータは乗用車のようになるでしょう。誰でも自由にどこへでも行きたいときに行けるようになるのです。


現在、多くの科学者が個々の人間の生活の複雑さに対応するために機械を適応させようと取り組んでいます。彼らは社会全体の大きな問題ではなく、私たちがこの複雑で困難で困惑し、時にはイライラする世界で毎日遭遇する個人の問題を考えています。例えば、MITで指導しているマックプロジェクト(Machine Aided Cognitionの略)のDr.ファノは、この特別な目標を追求しています。ファノ博士は言います。「私たちは日々ますます複雑になる問題に直面しています。私たちは収入を予算化し、請求書を支払い、小切手をバランスさせ、確定申告を行い、老後のために貯蓄や投資をするべきかどうかを決め、家を購入するか賃貸するかを判断し、新しい仕事のオファーを評価し、カリフォルニアへの引っ越しを検討し、家族の記念日を追跡し、遺言書を作成し、さらには明日の合理的な仕事のスケジュールを計画する必要があります。どうにかしてこの複雑さの天井を打ち破らなければなりません。」

| 彼らは、コンピュータを活用して個人の生活における問題解決を支援する方法を模索しています。
| 私たちは、情報を整理し、分析し、意思決定をサポートするための新たな手段を求めています。
| このような研究と開発の努力が進められることで、私たちはより効果的に日常の課題に対処し、
| 個人的な成功や幸福の追求をサポートすることが期待されます。


ファノ博士と彼の同僚が考えているようなコンピュータの利用方法は、既にカリフォルニアで進行中の実験プログラムで具体化されています。このプログラムでは、高校生がコンピュータから高度に専門的な指導を受けることができます。次の年のカリキュラムを計画する際、生徒はコンピュータにアクセスし、利用可能な科目を知ります。コンピュータは、生徒が大学に進学する予定かどうか、また進学する場合はどのような大学を希望しているのかを尋ねます。それに基づいて、大学の入学要件や高校の卒業要件を満たすためにどのような科目を取るべきかアドバイスをします。また、過去に生徒の成績記録の似たような生徒がそのような大学でどのように成績を収めてきたかを教えてくれます。彼らの中でAの成績を取った生徒がどれくらいいたのか、また挫折した生徒がいたのかを教えてくれ、彼が目標を高すぎるか低すぎるかを示唆するかもしれません。特別な問題については、学校の進路指導カウンセラーに相談するよう案内し、生徒はルーチンな質問から解放されます。


ファノ博士は指摘していますが、所得税申告書の作成を支援するために同様のプログラムが開発される可能性があります。それは、考えられるすべての税金に関する書籍よりも優れたものになるでしょう。税法の問題の一つは、あらゆる可能な状況をカバーするために法律が作られなければならないということです。そのため、税法は非常に複雑になっています。法律を説明する書籍の問題は、例を挙げることでしか説明できないということです。しかし、それらの例は私たち自身の問題とわずかに異なることが多く、その重要性や重要でなさを判断するのが難しい場合があります。コンピュータは、いかなる種類の税金の問題にも対応できるようプログラムされ、その特定のケースに対する法律の論理的な適用を解析することができます。ファノ博士はさらに、将来の所得税法は紙に印刷されるのではなく、直接コンピュータにプログラムされるかもしれないと提案しています。


あるコンピュータ科学者は、楽しみと真剣さを兼ねて、ニューヨークや他の大都市のレストランに関するアドバイスをするコンピュータプログラムについて考えています。そのプログラムは、ユーザーに対して次のような質問をするでしょう。「中華料理は好きですか?」、「小さな店と大きな店、どちらが好みですか?」、「音楽は欲しいですか?」、「いくらまで費やす予定ですか?」、「レストランは特定の劇場の近くでなければなりませんか?」ユーザーの好みと予算に基づいて、彼が気に入るであろう場所のリストを提供します。その後、実際の食事の満足度を調べることで、機械はさらにユーザーについて学び、次回はさらに良いアドバイスを提供することができます。同じプログラムは、夜や週末の過ごし方の提案に拡大することもできます。(「都市に住む人々は、驚くべき選択肢があるにもかかわらず、現時点ではそれほど選択肢を活用していません。彼らは助けが必要です」とこの科学者は言います。)それはさらに、最新の情報を持つ一種のスーパー旅行会社になることもできます。考えてみてください、コンピュータに電話して「金曜日の午後4時から火曜日の午前9時までの時間があります。どこに行けばいいですか?」と尋ねることができるでしょう。その機械は「300ドルまで費やすことはできますか?」、「釣りは好きですか?」といくつかの質問をするでしょう。そして、以下のような提案を出すでしょう。「マイアミビーチのアメリカーナホテルのスイートを75ドルで提供できます。金曜日の午後6時にイースタン航空のフライト123便の座席を予約し、月曜日の深夜に到着するフライト321便で帰ることができます。キャプテンハリーブラウンと彼の釣り船は、土曜日の朝7時にあなたを待っています」。


可能性はほぼ無限です。困惑した家庭の人々を助けるためにコンピュータをプログラムすることは完全に実現可能です。漏れる蛇口の修理方法や煙突からリスを追い出す方法など、指示を受けることができます。ベビーに関するスポック博士の知識も、本の範囲では不可能な個別の危機に対応するために、より詳細にコンピュータに組み込むことができます。医療や法律のアドバイスも、医療や法律の専門家が許可すれば、コンピュータで提供することができます。実際に、心理療法士の一部のタイプに似たコンピュータプログラムがすでに開発されています。以下は、架空の女性「患者」とのタイプライターでの会話の例です。

患者:男性はみんな同じようなものです。
機械:どのような意味ですか?
患者:彼らはいつも何かしら私たちに迷惑をかけてくるんです。
機械:具体的な例を思いつけますか?
患者:まあ、私の彼氏が私にここに来るように言いました。
機械:あなたの彼氏があなたにここに来るように言ったのですか?
患者:彼は私がほとんどいつもうつ気分であることに気付いたんです。
機械:うつ気分であると聞いて、残念です...

そして、セラピストとの50分間のセッションのような内容が続きます。


コンピュータ科学者の考えでは、もう1つの目立つ機械の利用方法はショッピングです。シアーズ、ローバック(Sears, Roebuck)のような印刷カタログは、出版と配布の費用がかかるため、おそらく姿を消すでしょう。その代わりに、ショッパーはシアーズ、ローバックやお気に入りのデパートのコンピュータに電話をかけ、利用可能な商品を尋ね、テレビ画面でそれを見て、質問をし、ほとんどの今日の店員から得られるよりも賢くて完全な回答を得ることができるでしょう。おそらく、購入代金はコンピュータ上のお金で支払われ、顧客自身の銀行口座から店舗の口座に直接送金されるため、小切手を書いたり送ったりする必要はありません。このような金融取引は、デラウェア銀行と一連の靴店によって設立された実験プログラムで既に成功しています。顧客が靴を購入すると、店員はタッチトーン電話を使用して銀行のコンピュータに電話し、顧客の識別番号を入力し、販売額を示すボタンを押します。この方法は広まるでしょう。なぜなら、国内で書かれる小切手の量は約7000万枚/日となり、コンピュータでの小切手の仕分けを行っていても手に負えなくなっているからです。銀行には、小切手を処理し、最終的に作成した人々に返還するために、年間30億ドル以上かかっています。


知的な公共施設を設立する上での物理的な障壁は非常に深刻ではありません。実際のところ、既に科学者を支援するために設計されたこのようなシステムは、MACプロジェクトの下で運用されています。MITキャンパス内および教授の自宅には、テレタイプライターという形で分散配置された160の「アウトレット」があります。これらのタイプライターは、MAC科学者とコンピュータメーカーによって開発されたタイムシェアリングプログラムの下で、各々が同時に30人のユーザーに対応できる2つの別々のコンピュータに接続されています。MITの教員や学生はこのシステムを頻繁に利用しており、特に高度な研究における複雑な数学的計算に役立てています。ある工学教授は、自身の専門職のバッジであったスライドルールを3年間使っていないと述べています。


同じ種類のタイムシェアリングコンピュータシステムは、比較的容易に地域全体に提供することができます。各家庭には、テレタイプライターだけでなく、画面も含まれるようなコンソールがあり、それが現在のように電力や電話センターに接続されたコンピュータセンターと接続されます。機械はユーザーと話すこともできるかもしれませんが、おそらく人間の話を理解することはできません。(機械が聞くことができるようにするのは、話すことができるようにするよりもはるかに難しいため、科学者の間でも、いつ、もしくはもし可能であるとすれば、聞くことができる機械が利用可能になるのはいつなのかについての意見は分かれています。)物理的な問題は解決しやすいですが、他にも難題があります。その1つは、私たちのほとんどが自分の特別な用途のためにコンピュータのプログラムを学ぶために2年間もの時間を費やすことにあまり興味を持たないだろうということです。専門家たちは、一般の人々がコンピュータをより簡単に使えるようにする方法を見つけなければなりません。ファノ博士の言葉を借りれば、「ユーザーは、現在ビジネスをよく知っているアシスタントとビジネスマンが話すのと同じくらい簡単に機械と話せるべきです。実際、機械は熟練かつ知識豊富なアシスタントであるべきです」ということです。ただし、この方向性の進展は絶えず進んでいます。コンピュータ科学者は、自動車が導入されたとき、人々が所有し運転するためにはエキスパートの整備士でなければならなかったことを指摘します。今では、彼らは言います、コンピュータもまた、自動車がずっと前に行ったように、誰でも操作できるようになってきています。


将来の知識の共有施設は、私たちの家庭に何をもたらすのでしょうか? ファノ博士は、コンピュータが将来的には巨大なメモリを持ち、特定のコミュニティのすべての知識を含む日本の最高の図書館に存在する知識、そして個人の日常の業務報告書、財務記録、納税申告書、医療歴など、あらゆる情報を含む日が来ることを予見しています。現在では、一つのページに相当する情報をコンピュータに格納するコストは、一部のシステムでは月に10セント程度にまで低下しています。おそらく将来的には、情報を本やファイリングキャビネットよりもコンピュータに格納する方が安価になるでしょう。その日が訪れると、コンピュータは蓄積された世界の知識とスキルを私たち自身の個人的なサービスに提供します。人々は、微積分の問題の解決策を勉強せずに求めることができたり、建築のコースを受けずに新しい家の設計を行ったりすることが可能になるでしょう。要するに、知識の共有施設は、膨大な情報のデータベースにアクセスすることで、従来は広範な学習や専門知識が必要だったタスクや知識の獲得を個々の人々に可能にするものです。


将来のコンピュータは、生活を非人間化するのではなく、むしろ個々の多様性を大いに生み出すでしょう。実際に、既に質的な変化をもたらしています。コンピュータは、さまざまなモデルとオプションが増える自動車の製造を可能にし、ロサンゼルスでは、顧客が75のダッジのショールームのどこにでも入って行き、6500台の車の在庫からすぐに自分が望む車を選ぶことができます。コンピュータ化された教育機器は、大規模なクラスでは不可能な個別の教育を小学生に提供し、彼らの背景や進歩の能力に合わせてカスタマイズされています。コンピュータは、村の司書がパトロンのことをよく知っていて彼の興味を引く新しい本を提案できる素晴らしい昔の日の一部をもう一度思い起こさせることさえあります。IBMの大規模な技術図書館では、スタッフのプロフィールが機械に入力され、彼らが見たいと思う新しい本や記事の要約が自動的に送られます。将来的には、コンピュータが朝のニュースレターや新聞を特定の読者のニーズに合わせて印刷する可能性が非常に高いでしょう。個別にカスタマイズされた雑誌やテレビ番組を作成し、人々が自分だけの特別な家具や新しい自動車をデザインすることができるかもしれません。さらに重要なレベルでは、コンピュータは私たちを最近の「忍び寄る官僚主義」と呼ばれる制約から解放する可能性があります。現在の多くの規則、規制、検査、許可は、密集した社会が混乱に陥るのを防ぐために設計されていますが、情報が自由にほぼ瞬時に循環する社会では、多くの制約はおそらく不要になるでしょう。


このことから、問題は次のようなものになります。これらの機械は実際にどれくらい知的なのでしょうか?彼らは学習できるのでしょうか?思考できるのでしょうか?創造することができるのでしょうか?また、あるジョークでよく使われるような、機械同士で「人間を信じますか?」と尋ねる場面に到達することはあるのでしょうか?


これらの質問のほとんどに対する答えは、現時点では誰も正確には知りません。科学者たちは、この関連で「人工知能」というフレーズを使用しており、その機械がそれを持っていると考える人もいれば、持っていないと考える人もいます。


確かに、機械は学習することができます。カリフォルニアの高校生に助言をする機械は質問をし、回答から各生徒の特性を学び、一般的な助言だけでなく、彼個人の特別なニーズに合わせたガイダンスを提供します。バージニア大学では、試行錯誤によって問題を解決するために学習するコンピュータシステムが開発されました。MACプロジェクトの一部であるELIZAという言語プログラムも同様であり、ピグマリオンやマイ・フェア・レディのエリザ・ドゥーリトルのように、徐々に言語を上手に使用するように教えることができます。実際に、ELIZAに英語のフレーズを教えた後、ドイツ語の対応するフレーズも学ぶことができます。オペレータは単に「Ich sage」と言ったら「I say」という意味だと教えるだけで、機械はそれを覚えます。


しかしながら、心理学の入門コースを受けたことがある人なら誰でも知っているように、人間の脳は奇妙で驚くべき方法で問題を解決します。私たち全員が、事実や数学の法則、関係に関する知識という大きな記憶の銀行を持っています。私たちは思考の中で、時には論理のルールを通じてこの知識を操作します。例えば、すべての哺乳類は子供を哺乳類であるため、クジラも子供を哺乳類であると私たちは知っています。他の場合には、個々の自由連想に似た方法でそれを操作します。牧師にとって、「天使」という言葉は天使-天国-神-聖霊-聖母-山上の垂訓といった連想を引き起こすかもしれません。一方、アスリートにとっては、連想は天使-飛ぶ-フライボール-野球-ウィリー・メイズといった具体的なものになるかもしれません。もし機械が真に創造的になるのであれば、このようなランダムで自由な、やや偶然的ですが非常に生産的な方法で思考することを学ばなければなりません。それは可能でしょうか?たぶん可能かもしれませんし、そうでないかもしれません。まだこのような方法で機械に思考させる試みは誰も行っていません。


人工知能に関する実験は、ほんの20件ほどしか行われていません。そのほとんどは、博士号を取得するために取り組んでいる大学院生によって行われました。学生たちは最も有望と思われる方法を試してきましたが、ランダムな思考は含まれていませんでした。しかし、彼らは本当に驚くべき結果を出しています。MITの学生の1人は、コンピュータに代数の問題を解かせる方法を教えました。この問題は数学的な言葉ではなく、普通の英語で表現されています。「メアリーはアンが現在の年齢だったときのアンの2倍の年齢です。メアリーが24歳の場合、アンの年齢はいくつですか?」(Annが18歳であることをすばやく計算できない限り、この種の問題ではコンピュータの方がはるかに優れています。)別の学生は、知能テストによく含まれる幾何学的な類推の問題を解くためにコンピュータを教えました。例えば、「犬は吠えるのと同じように、ノコギリは何? ブレード、木材、切る、うなる、ツール?」といった問題です。この問題でも、コンピュータは見たこともない幾何学的な図形でさえも、平均的な10歳児と同じくらいの成績を残すことができます。そして今、MITの学部生の別の学生が、コンピュータに言語的な類推問題を解かせる方法を教えています。


もちろん、よく言われることですが、機械はプログラムされたことしかできないということです。そして、そのプログラミングを行うのは人間です。これは人間のプライドを慰めるものであり、機械の新たな成果に対する定型的な反応となっています。しかし、人工知能を信じる科学者たちは、人間の脳もまたプログラムされなければならないと指摘しています。私たちの思考プロセスは、生まれてから受けた情報と指導、特に目と耳を通じてのものの結果です。さらに、コンピュータのプログラミングは、広告されているほど正確な科学ではありません。最初は非常に正確である必要がありましたが、現在ではMITのマービン・ミンスキー教授の言葉によれば、「プログラマーは正確に何をしているのかを知らなくても構わないし、実際にはかなりずさんであってもかまいません。」彼らは自分のプログラムがどのように動作し、なぜ動作するのかを常に理解しているわけではありません。また、プログラムが対話によって修正や拡張されると、その柔軟性はますます高まっています。ミンスキー教授は「人々はプログラムが特定の目的には適しているが、柔軟性に欠けると主張しています。しかし、タイプライターやバイオリンもまた柔軟ではありません。使い方を学ぶまでです」と述べています。将来の情報公共サービスのコンピュータでは、さまざまな人々と会話し、さまざまな新しい事実を学び、さまざまなタスクを実行するための指示を受けることになります。ユーザーは、新しい種類の問題を提示し、単に「過去に解いた問題の中で、この問題に最も似ているのはどれですか? その方法を試してみてください」と機械に伝えることで解決策を得ることができるかもしれません。そして、おそらくミンスキー教授は、機械が自分自身では思いつかなかった方法で解決策にたどり着く可能性もあると考えています。個々の人間が機械の中に何が含まれていて、したがって何が出てくるかをすべて知ることはありません。機械を操作するためにはほとんど特別な訓練は必要ありませんが、おそらく一部のユーザーの方が他の人よりも機械との相性が良いかもしれません。「一部の人々は自然に得意なのです。それはスキーが得意な人と同じようなものです」とミンスキー教授は述べています。


最終的に、ミンスキー教授は、機械は自己改善のためにプログラムされるようになります。彼らは自己の努力でますます優れていくでしょう。そして、疑いなく、知性、直感、意識と呼ばれる特性を示すようになり、世界は二度と元のままには戻らなくなるでしょう。彼らは人間と同等か、それ以上になるのでしょうか? ゼネラル・エレクトリックのジョージ・フィーニー博士は、「その質問が本当に重要でなくなる時代になると思います。もし楽観的な人文主義者なら、機械は人間の延長であると言うでしょう。そして、もし悲観的な現実主義者なら、人間は機械の延長であると言うでしょう」と述べています。

*1:が、 当時は「ちゃんと動作する実装」であることを重視したので Charles HaydenEliza test を選んで取り上げました。

elizagen.org は蓄積されている情報が 断片的かつ未整理だったことも棚上げした理由です。

*2:ELIZAが登場した1960年代、 OSや開発ツールを含むソフトウェアは ハードウェアの付属物の扱いで 標準化がほとんど進んでいなかったため、 メーカーはおろか機種ごとに 互換性のないOSや開発ツールを使っていました。 それ故、 特定の言語で書かれたソースコードを配布すること自体が ナンセンスだった実情があります。

AIM-291-Buchanan

---------+---------+---------+---------+---------+---------+---------+---------+

 

Review of Joseph Weizenbaum’s Computer Power and Human Reason

by

Bruce G. Buchanan
Adjunct Professor of Computer Science
Stanford University


The following review is to appear in PHAROS, Fall 1976.

 

Weizenbaum's Computer Power and Human Reason is a book about the immorality of applying computers to tasks that ought to be done only by humans. The author speaks out against improper and immoral uses of the tools available to us, especially computers. Some readers will find his description of computers illuminating and alarming, the rest of us can still benefit from the challenge to sharpen our moral criteria.

The author is a leading computer scientist teaching at M.I.I. who is disturbed by both the strongly pro—technology, and the anti-humanist statements of some computer scientists. He is also concerned about the public’s passive acceptance of technologists’ definitions of social problems and their subsequent technological solutions. Examples supporting both concerns are numerous, and readers need to remind themselves often that there is a point to the examples, many of which are very pointed criticisms of individuals. Much (perhaps too much) of the book is devoted to reasons why the book was written.

The last chapter (10) contains the material most worth reading, with the first chapter providing a very readable introduction, with some misgivings at trying to collapse 280 pages into a few lines , we can summarize the main theme of the book in an informal argument:

(P1) It is wrong for us to cause people to be treated as less than “whole persons”. (E.g., “An individual is dehumanized whenever he is treated as less than a whole person.” p. 266).

(P2) Computers can never fully understand human problems [because they must ignore aspects of human experience that are not describable in a language].

(P3) Therefore , it is wrong for us to command computers to deal with human affairs, i.e., to perform tasks requiring understanding of and empathy for human problems
[esentially because computers lack a person’s complete view of other persons].

Proposition P1 is a presupposition for the entire book.
But the concepts of the whole man or man as object are not as simple and obvious as the author would have us believe , and the moral dictum in proposition P1 is not easy to apply, for in some circumstances it is desirable to treat persons as anonymous entities , as in voting. Much of the material in Chapters 4— 9 is an exposition of a non—mechanistic view of man, in support of proposition P2. Chapters 2—3 discuss the abilities of computers and how they work. Intertwined throughout all the chapters is evidence that people want to and can apply computers in human affairs as well as evidence that it leads to evils. Now the problem is understanding these propositions and deciding whether one believes them to be true. In the book , this is largely left as an exercise for the reader.

Any useful tool can always be misused; the particular dangers of computers stem from their versatility and complexity. Because computers are general symbol manipulation devices, they are versatile enough to be used , and misused , in applications that affect life or that have serious, irreversible social consequences. And computer programs are often so complex that no person understands the basis for the program’s decisions. As a result, we are told, managers, physicians, and decision makers of all sorts do not feel responsible for the consequences of decisions made by computer programs. A large portion of the book is an elaboration on these dangers. These dangers are also used to support proposition P3, above: that there are decision making tasks we ought not turn over to computers.

The computer programs that most concern the author are the complex problem solving programs developed under the general name of artificial intelligence. These are classified as (a) simulaion s of human problem solving (cognitive simulations), (b) programs that solve difficult problems without trying to duplicate human methods (performance programs), and (c) programs, or other work, that explore theoretical issues in computing (these he ignores). The claims made about cognitive simulations and performance programs seem to disturb Weizenbaum more than the work itself. Perhaps those claims, made ten and twenty years ago, should have been more cautiously phrased to say, for example, that computers will successfully simulate some [not all] aspects of human thought and complement [not replace] human problem solvers. Several examples are taken from psychiatry, partly because others read too much into a simple program he wrote ten years ago that mimics some conversational aspects of a therapist, a fact that profoundly disturbs him.

In any case , Weizenbaum’s arguments are aimed at showing that computer capabilities are not coextensive with human capabilities. If the arguments are correct, then computer programs cannot successfully duplicate all aspects of human intelligence (proposition P2 , above). Whether they could sometimes be used, morally and profitably, in place of humans still depends on understanding the concept of dehumanization in proposition P1.

This viewpoint can be pushed to extremes to argue against any use of computers, in which case even the worst human decision makers are seen as better qualified to make social decisions than the best computer programs ever will be. What seems more credible is that computer programs are more dangerous in the hands of poor managers than in competent hands. And Weizenbaum obliquely gives us a criterion for competence: the competent manager understands the basis for the program’s decisions and maintains an ability and willingness to override the programs. On the other side of the coin, a program becomes less dangerous (in any hands) if it can demonstrate its line of reasoning from problem description to problem solution, can be queried about its assumptions and methods, and otherwise opens itself to understanding.

Admittedly, computer programs are not easily understood (the main point of chapter 9). This is a great shortcoming, but not one that has escaped notice. Also, managers (of many sorts) have admittedly abdicated some responsibility to technology. In just this sense, physicians are chided for becoming “mere conduits between their patients and the major drug manufacturers” (p.259). But competent managers and physicians will first understand the scope and limitations of their tools before using them.

Weizenbaum is asking us not to do research on programs, methods or tools with obvious potential gross misuses: he finds no benefits that are worth the price of meddling with tools “that represent an attack on life itself” or that substitute for “interpersonal respect, understanding, and love” (p.269). Incidentally, this is the same theme as expressed in his letter to Science attacking recombinant DNA research (1). He also advocates renunciation of projects with “irreversible and not entirely foreseeable side effects.”

(1) Science, July 2, 1976, p.6 .

The guidelines that he gives are certainly incomplete for research on energy, communication, transportation —— and almost anything interesting enough to be applied in the next century -- would have unforseeable side effects or could be used to assault life. They are offered as expressions of his own subjective criteria, and perhaps because they are subjective they cannot be expressed adequately in the language of the brain’s left hemisphere (as he reminds us in another context). Such guidelines, even when precise, also fail to admit the value of research aimed at defining the limits of what computers can do by working on programs at the boundaries between men and machines.

He says he is not asking others to adopt his own criteria, that the book advocates exercising our own courage to say NO when our “inner voice ” tells us an act is wrong (p. 276). Since we do not know what another person’s conscience tells him, however, we do not necessarily feel safer knowing it has been consulted.

Weizenbaum's attacks on his colleagues seem to reduce to the question whether or not they have listened to their own inner voices.

The same concerns were raised in less inflamatory books and articles by Norbert Wiener (2). Wiener’s solution , if it may be called that, is not to stop work on some research but to

“render unto man the things which are man’s and unto the computer the things which are the computer’s. This would seem the intelligent policy to adopt when we employ men and computers together in common undertakings. It is a policy as far removed from that of the gadget worshiper as it is from the man who sees only blasphemy and the degradation of man in the use of any mechanical adjuvants whatever to thoughts.”

(2) E.g., Wiener, God & Golem, Inc. (M.I.T. Press, Cambridge , 1964).

This view of the symbiotic relationship of’ men and machines is a much more constructive one than Weizenbaun’s. It places the computer in the hands of problem solvers , and not the other way around. In this view, there are still interesting questions for computer specialists: how can a program provide a manager (problem solver, decision maker, etc.) with enough information that he can accept responsibility for its output? How can the program convey its scope and limitations to the manager? How can we design programs that are more useful for managers —— i.e ., easier and more pleasant to use, easier to understand, more knowledgeable and more flexible?

Another recent book dealing with the relationship of man and machine is Zen and the Art of Motorcycle Maintenance (3). It too builds on the premise that scientific, logical inquiry leads to only one kind of truth, that the subjective, intuitive, emotional side is necessary for human interaction and is equally legitimate. There is a similarity in the message, but a world of difference in style: while Pirsig’s novel evokes emotions, Weizenbaum prescribes them.

(3) R. Pirsig, Zen and the Art of Motorcycle Maintenance (Morrow , New York , 19714).

A distressing undercurrent through the whole book is its anti—rationalism. In discussing dangerous research in the book, with recombinant DNA used as an example, he questions the need to
give any justification for stopping the research. For example,

“Is not the overriding obligation on men ... to exempt life itself from the madness of treating everything as an object, a sufficient reason, and one that does not even have to be spoken? Wny does it have to be explained? It would appear that even the noblest acts of the most well—meaning people are poisoned by the corrosive climate of values of our time.” (pp. 260—61).

But this irrationalistic sentiment ignores the value of giving reasons for halting research on projects with great potential benefits for human health as well as dangers. If scientists failed to provide reasons for their decisions, either to halt or continue lines of research, how can we ever expect informed decisions from the public and legislative representatives? If there is madness in treating people “as objects” there is just as much madness in assuming that one’s own research decisions require no justification.

In summary, the main issues of the book are important for everyone, and are especially directed at persons working with computers. In spite of the backbiting, the digressions, and the vague language in which the perceived evils are (and perhaps must be) described, the book deserves discussion and contemplation. It is not the kind of book that can be taken literally but it does raise questions that all scientists need to answer for themselves.

 

---------+---------+---------+---------+---------+---------+---------+---------+

 

AIM-291-Lederberg

---------+---------+---------+---------+---------+---------+---------+---------+

Review of Joseph Weizenbaum's Computer Power and Human Reason

by

Joshua Lederberg

Professor of Genetics
Stanford University


The following review of J.Weizenbaum’s book was solicited and accepted by the N.Y.Times Book Review 1 March 1976 but to the best of my knowledge has not appeared in print. J.Lederberg

“Computer power and human reason” is a mosaic of well—reasoned analysis and passionate pleading on the nature of computers and of man, and about the place that computers (read “technology ” if you wish) should have in human affairs. Prof. Weizenbaum is particularly exercised about the claims for and prospects of AI, “artificial intelligence”, the efforts to emulate and bolster human reasoning processes as programs in computers. A well known computer scientist at M.I.T, who has made significant contributions to AI, he writes that he was moved to write this tract whe~i people responded to one of his programs as if it were an empathic companion. This over—estimation of , and over—dependence upon computers, he believes to be both symptom and cause of global predicaments with more horrors to come.

Weizenbaun may still be too much a technocrat: witness his oversimplifications of social movements as the immediate fruits of technical innovations. (There is more to the history of the internal migration and urbanization of American blacks than the introduction of the mechanical cotton—picker in the 1950’s.) But to dwell on these would do too little justice to the other fundamental issues that Weizenbaum raises. Indeed he might be the first to deplore his own vestigial technocratic biases, when they are inconsistent with his fundamental ethical philosophy. Nor should one harp on his ad hominem attacks on some of his colleagues, his bludgeoning them with selected quotations from writings of 20 years ago, whicn I suspect he will view as a lapse more from enthusiasm than from malicious intention.

Most readers will follow the author’s advice to skip over the early chapters which detail the fundamental logic of the computer —- these would make another, peerless book for explaining Turing’s work on the fundamental logic of computing machines to the lay reader. The basic philosophical and policy issues do no need this detail, and are best scrutinized by reading the book back—to—front: few readers with the interest and general intellectual grounding to digest this work critically, will need to be reintroduced to the fundamentals. Others will be attracted by pages of lyrical anti—technology slogans, which the author’s technical reputation will make the more persuasive. Since the author categorically rejects “instrumental reason” in its application to human affairs, it is difficult to engage him in a discussion of his particular policy concerns.

Weizenbaum makes a conscientious effort to distinguish his assertions of faith from the scientific consensus; but the non—specialist reader will still have to look closely to be sure. Perhaps in fields like the physiology of the right versus left brain he has already persuaded him self that contemporary speculations are proven realities about the location of human rational functions. But others should be cautioned that we still know even less about the organization of human intellect than Weizenbaum stipulates.

During the early adolescence of computer science in the early 50’s, many workers made extravagant prophecies about the ease with which the new machines would be programmed to match human problem—solving behavior -— “within the visible future”, we were told, machines would conduct mechanical translations of high quality (especially from Russian into English). They would play chess to the disadvantage of the masters, and they might then be ready to take over many of the higher—level functions of management in industry, and of command and control in the military. Within a few years, the power of machines to manipulate bits of information had been enhanced a million—fold: what more could one ask as the basis for these new powers? It is no surprise, and by now no news, that these prophecies were simply wrong; and the wiser among us should have learned not to make technological forecasts where we simply had new tools, but no real insight into the structure of the tasks they were to address. Surely, as Weizenbaum insists, there are few things less well understood than human creative imagination. His own prophecy is that this will NEVER be emulated to any significant measure by computing machines. This of hypothesis is beyond the range of scientific criticism, short of tangible advances too much to hope for right away; but his arguments are mainly repetitious assertions of his personal faith.

No, there is one more persuasive kernel: namely that the world—knowledge which underlies human understanding (compassion and judgment) needs the life—long experience of having been human —— in a word, of having shared love. It is unlikely and undesirable that machines be offered that privilege; then many realms will be uniquely human. Indeed we must make equally sure that the fellow—creatures to whom we confide our trust for ethical and esthetic leadership justify this on the same grounds. The abrogation of human responsibility for moral decision whether it be out of lazy delegation to machines, or superstitious deference to super—human abstractions can indeed once again ignite the holocaust.

Weizenbaum's pleading overreaches this sufficient argument to an out—and—out obscurantism about the fundamental non—comprehensibility of the human brain, which adds little to the debates between vitalists and mechanists of the last two centuries. It is a sterile debate; and scientists can contribute more by trying to find what can be learned about our own nature, and putting it to human good, than arguing what may or may not be ultimately knowable. As with his concern about the bounds of AI , the mischief of such criticism is that it may disparage the work of investigators with more concrete, modest and achievable goals. The view that the core of the cell’s reproductive capability was unknowable in chemical terms bears much of the onus for long delays in our understanding of the structure of DNA. After the fact, this proved to be remarkably simple.


While we should not offer love to the machine, there is much to be said
for permitting it to evolve, that is to nurture the growth of more and more complex programs. These are initiated by human intelligence, but grow from the dynamics built into the starting program itself. It is hard to see how some of the more complex problems to be addressed can be solved by programs that are explicitly written in detail by human authors. Then I agree with Weizenbaum that we can longer claim to have a full—fledged explanation of a phenomenon, merely through having generated a model for it , We may even have substantial power to solve problems without necessarily “understanding” them. (Unfortunately, this criticism does little to help us recognize true understanding by any objective criterion). Further more, we should not trust such complex programs merely because we believe we were sufficiently intelligent in our original design plans. Instead, the program will have become another experiment, to be validated only by experience. Much the same ought to be said for other areas of human aspiration, like politics.

Weizenbaum is particularly critical of the use of the computer in the role of psychotherapy —— doubtless in consternation that the machine’s patrons believed they were talking to a sympathetic, understanding ‘person’. This criticism raises a number of issues that deserve more analytical attention: 1) Is it true that the patrons were confused, or do many of them find some service in the ‘dialogue’ well knowing that they are at best talking to themselves? and 2) Can a therapeutic utility by this modality be empirically validated and economically justified? At the moment our answers to these questions are speculative and anecdotal , and I would not substitute my own critical skepticism about this approach for a conclusive dismissal of it. Weizenbaum’s criticism indeed may misapprehend the role of psychotherapy as a source of self—insight —— where the patient himself must do most of the work at achieving human understanding -- and machines may well be expected to play some useful role in this process (no differently than, say, the reading of a book —— and in a similar analogy to computer—assisted—instruction in other domains.)

Throughout his book, Weizenbaum oscillates between a disparagement of the potential and actual accomplishments of AI, dismay at what he sees as excessive faith and dependence on this technology, and concern for some potential abuses of its development, should it be realized. That policy—makers, the public, and computer scientists alike should take a more critical and pragmatic view of the field than the zealots of 20 years ago may be granted; many well—informed people within the field clearly do, without having reacted as strongly as Weizenbaum.

The abuses might be either ideological or technological. If human intelligence were more successfully mirrored in the machine, will
that not justify treating human beings as if they were MERE machines? His position on this issue is colored by the experience of Nazi Germany; but the argument is confused. The most savage tyrannies that I can find in history, including Nazism, had no doubt about a unique elan—vital -— just that one folk or credo had more than an equal share. People who are philosophically concerned about the mechanistic basis of life are also overawed by its complexity, and too concerned about learning more about it to occupy themselves with holy wars. They are the least likely to be sacrificing either people or machines on the grounds of ideological conviction.

The historical record is less reassuring about the augmentation of power in the hands of irrational man: we can still argue about the case against Prometheus, Gutenberg, Galileo, or Faraday —— not to mention Oppenheimer —— but by that very token, I do not share Weizenbaums confidence in deciding which innovations are dangerous. He points to very real concerns about machines that could interpret speech (while denying their feasibility). Yes —— they might make large scale wire—tapping irresistible, and perhaps undo the virtues of the telephone as a medium of private communication. They might also relieve millions of office—persons from the mindless tasks of transcribing the words of others, and free them for more creative responsibilities. Both of these contingencies lay heavy burdens on the adaptability of our social institutions, and it is important that we be alerted to them.

Weizenbaum does point to projects in mathematics and chemistry where computers have shown their potential for assisting human scientists in solving problems. He correctly points out that these successes are based on the existence of “strong theories” about their subject matter. We can agree that “common sense” is the human competence hardest to copy in a machine, and that the most constructive advances should come from the wisest division of labor in a synergism of man and his machines. Computers will not give us magical answers to the problems that we, or they, create: with sweat and insight we may he able to develop them as ever more effective tools to serve human needs.

---------+---------+---------+---------+---------+---------+---------+---------+

 

論文:ELIZA ー 人間と機械の自然言語コミュニケーション研究のためのコンピュータプログラム

ELIZA -- A Computer Program For the Study of Natural Language Communication Between Man And Machine Joseph Weizenbaum Massachusetts Institute of Technology Department of Electrical Engineering Cambridge, Mass..

Communications of the ACM Volume 9, Number 1 (January 1966): 36-35.

Abstract(要約)

ELIZA is a program operating within the MAC time-sharing system at MIT which makes certain kinds of natural language conversation between man and computer possible. Input sentences are analyzed on the basis of decomposition rules which are triggered by key words appearing in the input text. Responses are generated by reassembly rules associated with selected decomposition rules. The fundamental technical problems with which ELIZA is concerned are: (1) the identification of key words, (2) the discovery of minimal context, (3) the choice of appropriate transformations, (4) generation of responses in the absence of keywords, and (3) the provision of an ending capacity for ELIZA "scripts".

ELIZAは、MITのMACタイムシェアリングシステムにおいて動作するプログラムで、人間とコンピュータの自然な会話を可能にします。入力文は、入力テキストに現れるキーワードによって引き起こされる分解ルールに基づいて分析されます。レスポンスは、選択された分解ルールに関連付けられた再構築ルールによって生成されます。 ELIZAに関する基本的な技術的課題は次のとおりです。 (1) キーワードの識別 (2) 最小文脈の発見 (3) 適切な変換の選択 (4) キーワードがない場合の応答の生成、そして (5) ELIZA"スクリプト"を停止する機能の提供  

A discussion of some psychological issues relevant to the ELIZA approach as well as of future developments concludes the paper.

この論文の最後で、ELIZAのアプローチに関連したいくつかの心理学的問題と今後の展開について議論します。

Introduction(はじめに)

It is said that to explain is to explain away. This maxim is nowhere so well fulfilled as in the area of computer programming, especially in what is called heuristic programming and artificial intelligence. For in those realms machines are made to behave in wondrous ways, often sufficient to dazzle even the most experienced observer. But once a particular program is unmasked, once its inner workings are explained in language sufficiently plain to induce understanding, its magic crumbles away; it stands revealed as a mere collection of procedures, each quite comprehensible. The observer says to himself "I could have written that". With that thought he moves the program in question from the shelf marked "intelligent" to that reserved for curios, fit to be discussed only with people less enlightened that he.

説明とは上手に釈明することだと言われています。この格言は、コンピュータ・プログラミングの分野、特に発見的プログラミングや人工知能と呼ばれる領域では全く達成されていません。その領域では、マシンは驚異的な方法で動作し、しばしば最も経験豊富な観察者でさえも十分に驚嘆させます。しかし、一旦、特定のプログラムの仮面が剥がされて、その内部の仕組みへの理解を促すのに十分な説明される(それぞれはかなり分かりやすい手順を単に掻き集めたものであることを明らかにする)と、その魔法は消滅します。説明を受けた人は「私でも書けるかもしれない」と呟きます。問題のプログラムを「知的」と記された棚から珍しいものの棚に移して、まだ知らされていない人とだけ議論する事を願います。

The object of this paper is to cause just such a reevaluation of the program about to be "explained". Few programs ever needed it more.

この論文の目的は、このような「解釈する」プログラムを改めて評価することです。今までにこのような再評価が必要なプログラムはほとんどありませんでした。

ELIZA Program(ELIZAプログラム)

ELIZA is a program which makes natural language conversation with a computer possible. Its present implementation is on the MAC time-sharing system at MIT. It is written in MAD-SLIP[4] for the IBM 7094. Its name was chosen to emphasize that it may be incrementally improved by its users, since its language abilities may be continually improved by a "teacher". Like the Eliza of Pygmalion fame, it can be made to appear even more civilized, the relation of appearance to reality, however, remaining in the domain of the playwright.

ELIZAは、コンピュータとの自然な会話を可能にするプログラムです。現在の実装は、MITのMACタイムシェアリングシステム上に稼働します。これは、IBM7094 の MAD-SLIP で書かれています。「教師」によって言語能力が絶え間なく改善される期待から、その名前はユーザーによって段階的に改善される可能性があることを願って選ばれました。有名なピグマリオンのエリザのように、より上品に見えるようにすることができますが、その現実と外観の関係は戯曲の領域に止まっています。

For the present purpose it is sufficient to characterize the MAC system as one which permits an individual to operate a full scale computer from a remotely located typewriter. The individual operator has the illusion that he is the sole user of the computer complex, while in fact others may be "time-sharing" the system with him. What is important here is that the computer can read messages typed on the typewriter and respond by writing on the same instrument. The time between the computer's receipt of a message and the appearance of its response is a function of the program controlling the dialog and of such MAC system parameters as the number of users currently corresponding with the system. These latter parameters generally contribute so little to the overall response time that conversational interaction with the computer need never involve truly intolerable delays.

現在の目的において、MACシステムを個人が遠隔地にあるタイプライターからフルスケールのコンピュータを操作することを可能にする手段とみなすことができます。個々のオペレータは、彼がコンピュータ複合体の唯一のユーザであると錯覚していますが、実際には他の人とシステムを「タイムシェアリング」しているかもしれません。ここで重要なことは、コンピュータがタイプライターで入力されたメッセージを読み込み、同じ装置に書くことで応答できることです。コンピュータがメッセージを受信して​​からその応答が現れるまでの時間は、対話を制御するプログラムとその時点でのシステムに対応するユーザ数のようなMACシステムのパラメータに相関します。一般的にこれらの後者のパラメータは応答時間全体にはほとんど影響しないため、コンピュータとの対話のやり取りが、本当に耐え難いほどの遅れを伴うことは決してありません。

When in conversation with ELIZA, the user types in some statement or set of statements in natural language using normal punctuation and sentence structures. Only the question mark may not be used, because it is interpreted as a line delete character by the MAC system. The user's statement is terminated by a double carriage return which serves to turn control over to ELIZA. ELIZA then analyzes the user's statement and generates some response which it types out. Control is then again with the user.

ELIZAと会話するとき、ユーザは、通常の句読点や文章構造を使用して、自然言語による文章を入力します。疑問符は、MACシステムによって行削除文字として解釈されるため、使用されないことがあります。ユーザーの文章は、ELIZAに制御を移すためのダブルキャリッジリターンで終了します。次にELIZAはユーザーの文章を分析し、出力する応答を生成します。その後、制御は再度ユーザに返されます。

A typical conversation is the following:

典型的な会話は次のとおりです:

Men are all alike.
男性はすべて似ています。
IN WHAT WAY?
どうしたの?
They're always bugging us about something or other.
彼らはいつも何かについて私たちを悩ませています。
CAN YOU THINK OF A SPECIFIC EXAMPLE?
具体的な例を考えられますか?
Well, my boyfriend made me come here.
うーん、私のボーイフレンドは私をここに来させました。
YOUR BOYFRIEND MADE YOU COME HERE
あなたのボーイフレンドはあなたをここに来させましたか?
He says I'm depressed much of the time.
彼は、私が長時間が落ち込んでいると言います。
I AM SORRY TO HEAR YOU ARE DEPRESSED
私はあなたが落ち込んでいると聞いて悲しいです。
It's true. I am unhappy
それは本当です。私は幸せではありません。
DO YOU THINK COMING HERE WILL HELP YOU NOT TO BE UNHAPPY
あなたはここに来るとあなたが不幸にならないように助けてくれると思いますか?
I need some help, that much seems certain.
私は助けが必要です。
WHAT WOULD IT MEAN TO YOU IF YOU GOT SOME HELP
あなたが何かの助けを得られることは何を意味するのですか?
Perhaps I could learn to get along with my mother.
おそらく私は母と一緒になることを学ぶことができました。
TELL ME MORE ABOUT YOUR FAMILY
あなたの家族についてもっと教えてください
My mother takes care of me.
私の母は私を心配してくれます。
WHO ELSE IN YOUR FAMILY TAKES CARE OF YOU
他にあなたの家族の誰があなたの心配をするのですか?
My father.
私のお父さん。
YOUR FATHER
あなたのお父さんですか?
You are like my father in some ways.
ある意味ではあなたは私の父のようです。
WHAT RESEMBLANCE DO YOU SEE
どのようなところが似ていますか?
You are not very aggressive but I think you don't want me to notice that.
あなたはあまり積極的ではありませんが、私はそれに気付かないようにしています。
WHAT MAKES YOU THINK I AM NOT VERY AGGRESSIVE
何があなたに私があまりに積極的でないと考えさせるのですか?
You don't argue with me.
あなたは私と議論しないから。
WHY DO YOU THINK I DON'T ARGUE WITH YOU
なぜ私はあなたと議論しないと思うのですか?
You are afraid of me.
あなたは私を恐れている。
DOES IT PLEASE YOU TO BELIEVE I AM AFRAID OF YOU
私はあなたを恐れていると信じてください。
My father is afraid of everybody.
私の父はみんなを恐れている。
WHAT ELSE COMES TO YOUR MIND WHEN YOU THINK OF YOUR FATHER
あなたが父親を考えたときに他に何を思い出しますか?
Bullies.
いじめ。
DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR BOYFRIEND MADE YOU COME HERE
あなたのボーイフレンドがあなたをここに来させたという事実と何か関係がありますか?

The capitalized lines are the machine responses.

大文字の行はマシンからの応答です。

The gross procedure of the program is quite simple; the input is read and inspected for the presence of a keyword. When such a word is found, the sentence is transformed according to a rule associated with the keyword, if not a content-free remark or, under certain conditions, an earlier transformation is retrieved. The text so computed or retrieved is then printed out.

プログラムの全体的なプロシージャは非常に簡単です。入力が読み取られ、キーワードの存在が検査されます。該当する単語が見つかると、入力文はキーワードに関連付けられたルールに従って変換され、内容のない発言でない場合や特定の条件下では、さらに前の変換が検索されます。変換処理された、あるいは検索されたテキストは、その後プリントアウトされます。

In detail, of course, the procedure sketched above is considerably more complex. Keywords, for example, may have a RANK or precedence number. The procedure is sensitive to such numbers in that it will abandon a keyword already found in the left-to-right scan of the text in favor of one having a higher rank. Also, the procedure recognizes a comma or period as a delimiter. Whenever either one is encountered and a keyword has already been found, all subsequent text is deleted from the input message. If no key has yet been found, the phrase or sentence to the left of the delimiter (as well as the delimiter itself) is deleted. As a result, only single phrases or sentences are ever transformed.

もちろん、詳細に述べると上に示したプロシージャはかなり複雑です。例えば、キーワードにはRANKまたは優先順位番号を付けることができます。テキストの左から右のスキャンで既に見つかったキーワードを、上位のものを優先して破棄するという点で、この手順はこのような数値に敏感です。また、プロシージャはコンマまたはピリオドを区切り文字として認識します。いずれかに遭遇し、キーワードがすでに見つかった場合は、後続のすべてのテキストが入力メッセージから削除されます。キーが見つからない場合は、区切り記号の左側の区切り記号(区切り記号自体)も削除されます。結果として、単一のフレーズかセンテンスのみが変換されます。

Keywords and their associated transformation*1 rules constitute the SCRIPT for a particular class of conversation. An important property of ELIZA is that a script is data; i.e., it is not part of the program itself. Hence, ELIZA is not restricted to a particular set of recognition patterns or responses, indeed not even to any specific language. ELIZA scripts exist (at this writing) in Welsh and German as well as in English.

キーワードとそれに関連する変換*1ルールは、特定のクラスの会話のためのSCRIPTを構成します。 ELIZAの重要な特性はスクリプトがデータであること、すなわち、プログラム自体の一部ではありません。したがって、ELIZA は特定の認識パターンや応答のセットに限定されず、実際には特定の言語に限定されません。(本稿を書いている時点で)英語だけでなく、ウェールズ語、ドイツ語のELIZAスクリプトが存在します。

 

*1 The word "transformation" is used in its generic sense rather than that given it by Harris and Chomsky in linguistic contexts.

*1 「変換」という用語は、ハリスとチョムスキー言語学的な文脈で与えたものではなく、一般的な意味で使われています。

The fundamental technical problems with which ELIZA must be preoccupied are the following:

ELIZAに取り組まなければならない基本的な技術的課題は次のとおりです。

 

The identification of the "most important" keyword occurring in the input message. The identification of some minimal context within which the chosen keyword appears; e.g., if the keyword is "you", is it followed by the word "are" (in which case an assertion is probably being made). The choice of an appropriate transformation rule, and, of course, the making of the transformation itself. The provision of a mechanism that will permit ELIZA to respond "intelligently" when the input text contained no keywords. The provision of machinery that facilitates editing, particularly extension, of the script on the script writing level

入力メッセージに現れる「最も重要な」キーワードを識別する。 選択されたキーワードが現れる最小限の文脈を識別する。例えば、キーワードが"you"である場合は"are"という単語が続きます(この場合、アサーションが作成されている可能性があります) 適切な変換規則を選択する。そしてもちろん変換そのものを作成する。 入力テキストにキーワードが含まれていない場合にELIZAが「賢く」応答する仕組みを提供する。 スクリプト作成レベルでのスクリプトの編集、特に拡張を容易にする機構を提供する。

There are, of course, the usual constraints dictated by the need to be economical in the use of computer time and storage space.

もちろん、コンピュータの時間とメモリ空間の使用に経済的な必要性が指摘される通常の制約があります。

The central issue is clearly one of text manipulation, and at the heart of that issue is the concept of the transformation rule which has been said to be associated with certain keywords. The mechanisms subsumed under the slogan "transformation rule" are a number of Slip functions which serve to (1) decompose a data string according to certain criteria, hence to test the string as to whether it satisfies these criteria or not, and (2) to reassemble a decomposed string according to certain assembly specifications.

中心的な課題はテキスト操作の1つであることは明らかで、その課題の核心には、特定のキーワードに関連付けられていると思われる変換ルールの概念があります。スローガン "変換ルール"に含まれるメカニズムは、(1)特定の基準に従ってデータ列を分解し、それによりこれらの基準を満たしているかどうかを検査し、(2)特定のアセンブリ仕様に従って分解された文字列を再構成する、といった幾つものSLIPの関数です。

While this is not the place to discuss these functions in all their detail (or even to reveal their full power and generality), it is important to the understanding of the operation of ELIZA to describe them in some detail.

この場は、これらの機能をすべて詳細に話し合う場所でも(あるいは、その能力と一般性を明らかにするためでも)ありませんが、ELIZAの動作を理解するためには、それをある程度詳しく記述することが重要です。

Consider the sentence "I am very unhappy these days". Suppose a foreigner with only a limited knowledge of English but with a very good ear heard that sentence spoken but understood only the first two words "I am". Wishing to appear interested, perhaps even sympathetic, he may reply "How long have you been very unhappy these days?" What he must have done is to apply a kind of template to the original sentence, one part of which matched the two words "I am" and the remainder isolated the words "very unhappy these days". He must also have a reassembly kit specifically associated with that template, one that specifies that any sentence of the form "I am BLAH" can be transformed to "How long have you been BLAH", independently of the meaning of BLAH. A somewhat more complicated example is given by the sentence "It seems that you hate me". Here the foreigner understands only the words "you" and "me"; i.e., he applies a template that decomposes the sentence into the four parts:

"I am very unhappy these days"(私は最近、とても不幸です)という文章を考えてみましょう。英語の知識が限られているが、とても良い耳で聞いたことがある、最初の2つの単語 "I am" を理解している外国人を考えてみましょう。関心を表明したいと思う(おそらく同情している)彼は "How long have you been very unhappy these days?" と返すかもしれません。彼がしなければならないことは、元の文章にある種のテンプレートを適用することです。その一部は "I am" という2つの単語に一致し、残りは "very unhappy these days" という単語が分離されます。また、彼はそのテンプレートに特に関連した再構成する道具を持ち、"I am BLAH" という形式の文を BLAH の意味とは無関係に "How long have you been BLAH" に変えることができるように指定できなければなりません。もう少し複雑な例は "It seems that you hate me"(あなたが私を嫌いなようです)という文があげられます。ここでは外国人は "you" と "me" という言葉だけを理解しています。すなわち、文を4つの部分に分解するテンプレートを彼は適用し…

(1) It seems that (2) you (3) hate (4) me of which only the second and fourth parts are understood. The reassembly rule might then be "What makes you think I hate you"; i.e., it might throw away the first component, translate the two known words ("you" to "I" and "me" to "you") and tack on a stock phrase (What makes you think) to the front of the reconstruction. A formal notation in which to represent the decomposition template is

そのうちの2番目と4番目の部分のみが理解されます。その場合、再構成ルールは "What makes you think I hate you"(あなたは私があなたを憎むと思うものは何ですか)かもしれません。つまり、最初の要素を捨てて、2つの既知の単語("you" を "I" に、そして "me" を "you" に)に翻訳し、ストックしておいたフレーズ(What makes you think)を再構築した文の先頭に付けます。分解テンプレートを表すフォーマルな記法は次のように

(0 YOU 0 ME) and the reassembly rule

そして再構築ルールは次のようになります。

(WHAT MAKES YOU THINK I 3 YOU). The "0" in the decomposition rule stands for "and indefinite number of words" (analogous to the indefinite dollar sign of COMIT) [6] while the "3" in the reassembly rule indicates that the third component of the subject decomposition is to be inserted in its place. The decomposition rule

分解規則の "0"は、"and indefinite number of words"(COMITの不定のドル記号に類似)を表し、再アセンブリ規則の "3"は、分解される対象の第3の成分が挿入される場所をを示します。分解ルール

(0 YOU 1 ME) would have worked just as well in this specific example. A nonzero integer "n" appearing in a decomposition rule indicates that the component in question should consist of exactly "n" words. However, of the two rules shown, only the first would have matched the sentence. "It seems you love and hate me," the second failing because there is more than one word between "you" and "me".

は、この具体例でも同様に機能するでしょう。分解ルールに現れる非ゼロの整数 "n" は、問題の構成要素が正確に "n" 個の語で構成されるべきであることを示します。しかし、表示された2つのルールのうち、最初のルールのみが文に一致します。"you"と "me"の間には複数の単語があるので、"It seems you love and hate me,"の2番目の単語は失敗します。

In ELIZA the question of which decomposition rules to apply to an input text is of course a crucial one. The input sentence might have been, for example, "It seems that you hate," in which case the decomposition rule (0 YOU 0 ME) would have failed in that the word "ME" would not have been found at all, let alone in its assigned place. Some other decomposition rule would then have to be tried and, failing that, still another until a match could be made or a total failure reported. ELIZA must therefore have a mechanism to sharply limit the set of decomposition rules which are potentially applicable to a currently active input sentence. This is the keyword mechanism.

もちろん、ELIZAでは、入力テキストにどのような分解ルールを適用するかは重要な問題です。例えば、入力文が "It seems that you hate" だったとしましょう。この場合、分解ルール (0 YOU 0 ME) は "ME" という単語が、割り当てられた場所でまったく見つからないので失敗します。マッチするか、または全ての失敗が報告されるまで、他の分解ルールを繰り返し試してみる必要があります。したがって、ELIZAは、現在アクティブな入力文に潜在的に適用可能な分解ルールのセットを大幅に制限するメカニズムを持たなければなりません。これがキーワード・メカニズムです。

An input sentence is scanned from left to right. Each word is looked up in a dictionary of keywords. If a word is identified as a keyword, then (apart from the issue of precedence of keywords) ony decomposition rules containing that keyword need to be tried. The trial sequence can even be partially ordered. For example, the decomposition rule (0 YOU 0) associated with the keyword "YOU" (and decomposing the sentence into (1) all the words in front of "YOU", (2) the word "YOU", and (3) all the words following "YOU") should be the last one tried since it is bound to succeed.

入力文は左から右にスキャンされます。各単語は、キーワードの辞書で検索されます。単語がキーワードとして識別された場合(キーワードの優先順位の問題は別として)そのキーワードを含む分解ルールを試す必要があります。トライアルシーケンスは部分的にオーダーすることもできます。たとえば、キーワード「YOU」に関連付けられた分解ルール(0 YOU 0)(と (1) "YOU" の前のすべての単語、(2) "YOU" という単語、(3) "YOU" の後のすべての単語に分解したもの)は、成功するためにバインドされているため、試行された最後のルールでなければなりません。

Two problems now arise. One stems from the fact that almost none of the words in any given sentence are represented in the keyword dictionary. The other is that of "associating" both decomposition and reassembly rules with keywords. The first is serious in that the determination that a word is not in a dictionary may well require more computation (i.e., time) than the location of a word which is represented. The attack on both problems begins by placing both a keyword and its associated rules on a list. The basic format of a typical key list is the following:

現在、2つの問題が発生しています。与えられた文中の単語のほとんどがキーワード辞書に表されていないという事実が原因です。もう1つは、分解ルールと再アセンブリルールの両方をキーワードに「関連付ける」ことです。第1の問題は、単語が辞書内にないという決定が、表現される単語の位置よりも多くの計算(すなわち、時間)を必要とする可能性があるという点で重大である。両方の問題に対する攻撃は、キーワードとそれに関連するルールの両方をリストに入れることから始まります。典型的なキーリストの基本形式は次のとおりです。

(K *1 *2 . . . . . . *3. Such a list would mean that whenever the word "MY" is encountered in any text, it would be replaced by the word "YOUR". Its rank would be 5.

そのようなリストは、「MY」という単語が任意のテキストで見つかると必ず「あなた」という単語に置き換えられることを意味します。そのランクは5になります。

Upon completion of a given text scan, the keystack is either empty or contains pointers derived from the keywords found in the text. Each of such pointers is actually a sequence reader -- a SLip mechanism which facilitates scanning of lists -- pointing into its particular key list in such a way that one sequencing operation to the right (SEQLR) will sequence it t o the first set of transformation rules associated with its keyword, i.e., to the list

特定のテキストスキャンが完了すると、キースタックは空になるか、テキスト内で見つかったキーワードから派生したポインタを含みます。そのようなポインタのそれぞれは、実際にはシーケンスリーダー(リストのスキャンを容易にするSLIPメカニズム)です。右側の1つのシーケンス操作(SEQLR)が最初の変換セットにそれを順序付けるように特定のキーリストを指します。そのキーワードに関連する規則、すなわち、リストへ

*4. The top of that list, of course, is a list which serves a decomposition rule for the subject text. The top of the keystack contains the first, pointer to be activated.

そのリストの一番上は、もちろん、件名テキストの分解規則を提供するリストです。キースタックの一番上には、アクティブにする最初のポインタが含まれています。

The decomposition rule D1 associated with the keyword K, i.e., {(D1, K}, is now tried. It may fail however. For example, suppose the input text was:

キーワードKに関連付けられた分解規則D1、すなわち{(D1、K})が今試みられますが、それは失敗するかもしれません。

You are very helpful.  

The keyword, say, is "you", and {(D1), you} is

たとえば、キーワードは "you"、{(D1)、you}は

(0 I remind you of 0) (Recall that the "you" in, the original sentence has already been replaced by "I" in the text now analyzed.) This decomposition rule obviously fails to match tile input sentence. Should {(D1), K} fail to find a match, then {(D2), K} is tried. Should that too fail, {(D3), K} is atlempted, and so on. Of course, the set of transformation rules can be guaranteed to terminate with a decomposition rule which nmst match. The decomposition rule

(0 K 0) will match any text in which tile word K appears while

(0) will match any text whatever. However, there are other ways to leave a particular set of transformation rules, as will be shown below. For the present, suppose that some particular decomposition rule (Di) has matched the input text. (Di), of course, was found on a list of the form

*5. Sequencing the reader which is presently pointing at (Di) will retrieve the reassembly rule (Ri, 1) which may then be applied to the decomposed input text to yield the output message.

Consider again the input text

You are very helpful in which "you" is the only key word. The sentence is transformed during scanning to

I are very helpful {(D1), you} is "(0 i remind your of 0)" and fails to match as already discussed. However, {(D2), you} is "(0 I are 0)" and obviously matches the text, decomposing it into the constituents

(1) empty (2) I (3) are (4) very helpful. {(R2, 1), you} is

(What makes you think I am 4) Hence it produces the output text

What makes you think I am very helpful. Having produced it, the integer 1 is put in front of (R2, 1) so that the transformation rule list in question now appears as

*6. Next time {(D2), K} matches an input text, the reassembly rule (R2, 2) will be applied and the integer 2 will replace the 1. After (R1, m2) has been exercised, (R2, 1) will again be invoked. Thus, after the system has been in use for a time, every decomposition rule which has matched some input text has associated with it an integer which corresponds to the last reassembly rule used in connection with that decomposition rule. This mechanism isures that the complete set of reassembly rules associated with a given decomposition rule is cycled through before any repetitions occur.

The system described so far is essentially one which selects a decompsition rule for the highest ranking keyword found in an input text, attempts to match that text according to that decomposition rule and, failing to make a match, selects the next reassembly rule associated with the matching decomposition rule and applies it to generate an output text. It is, in other words, a system which, for the highest ranking keyword of a text, selects a specific decomposition and reassembly rule to be used in forming the output message.

Were the system to remain that simple, then keywords that required identical sets of transformation rules be associated with them. This would be logically sounds but would complicated the task of script writing and would also make unsecessary storage demands. There are therefore special types of decomposition and assembly rules characterized by the sppearance of "=" at the top of the rule list. The word following the equal sign indicates whitch new set of transformation rules is to be applied. For example, the keyword "what" may have associated tieh it a transformation rule set of the form

*7 The keywords "how", "what" and "when" may thus be made to form an equivalence class with respect to the transformation rules which are to apply to them.

In the above example the rule "(= what)" is in the place of a decomposition rule, although it causes no decomposition of the relevant text. It may also appear, however, in the place of a reassembly rule. For example, the keyword "am" may have amoung others the following transformation rule set associated with it:

*8 is logically in the place of a reassembly rule and may therefore be one of many reassembly rules associated with the given decomposition.

Another form of reassembly rule is

(NEWKEY) which serves the case in which attempts to match on the curcently regnant keyword are to be given up and the entire decomposition and reassembly process is to start again on the basis of the keyword to be found in the keystack. Whenever this rule is invoked, the top of the keystack is "popped up" once, i.e., the new regnant keyword recovered and removed from the keystack, and the entire process reinitiated as if the initial text scan had just terminated. This mechanism makes it possible to, in effect, test on key phrases as opposed to single key words.

A serious problem whieh remains to be discussed is the reaction of the system in case no keywords remain to serve as transformation triggers. This can arise either in case the keystack is empty when NEWKEY is invoked or when the input text. contained no keywords initially.

The simplest mechanism supplied is in the form of the special reserved keyword "NONE" which must be part of any script. The script writer must associate the universally matching decomposition rule (0) with it and follow this by as many content-free remarks in the form of transformation rules as he pleases. (Examples are: "Please go on", "That's very interesting" and " I see".)

There is, however, another mechanism which causes the system to respond more spectacularly in the absence of a key. The word "MEMORY" is another reserved pseudo-keyword. The key list structure associated with it differs from the ordinary one in some respects. An example illuminates this point.

Consider tile following structure:

(MEMORY MY (0 YOUR 0 = LETS DISCUSS FURTHER WHY YOUR 3) (0 YOUR 0 = EARLIER YOU SAID YOUR 3) ・ ・ ・ The word "MY" (which must be an ordinary keyword as well) has been selected to serve a special function. Whenever it is the highest ranking keyword of a text one of the transformations on the MEMORY list is randomly selected, and a copy of the text is transformed accordingly. This transformation is stored on a first-in-first-out stack for later use. The ordinary processes already described are then carried out. When a text without keywords is encountered later and a certain counting mechanism is in a particular state and the stack in question is not empty, then the transformed text is printed out as the reply. It is, of course, also deleted from the stack of such transformations.

The current version of ELIZA requires that one keyword be associated with MEMORY and that exactly four transformations accompany that word in that context. (An application of a transformation rule of the form

(LEFT HAND SIDE = RIGHT HAND SIDE) is equivalent to the successive application of the two forms

(LEFT HAND SIDE), (RIGIIT HAND SIDE).) Three more details will complete the formal description of the E L I Z A program.

The transformation rule mechanism of SLIP is such that it permits tagging of words in a text and their subsequent recovery on the basis of one of their tags. The keyword "MOTHER" in ELIZA, for example, may be identified as a noun and as a member of the class "family" as follows:

(MOTHER DLIST (/NOUN FAMILY)). Such tagging in no way interferes with other information (e.g., rank or transformation rules) which may be associated with the given tag word. A decomposition rule my contain a matching constituent of the form (/TAG1 TAG2・・・) which will match and isolate a word in the subject text having any one of the mentioned tags. If, for example, "MOTHER" is tagged as indicated and the input text

"CONSIDER MY AGED MOTHER AS WELL AS ME" subjected to the decomposition rule

(0 YOUR, 0 (/FAMILY) 0) (remembering that "MY" has been replaced by "YOUR"), then the decomposition would be

(1) CONSIDER (2) YOUR (3) AGED (4) MOTHER (5) AS WELL AS ME. Another flexibility inherent in the SLIP text manipulation mechanism underlying ELIZA is tha or-ing of matching criteria is permitted in decomposition rules. The above input text would have been decomposed precisely as stated above by the decomposition rule:

(0 YOUR 0 (FATHER MOTHER) 0) which, by virtue of the presence of "" in the sublist structure seen above, would have isolated either the word "FATHER" or "MOTHER" (in that order) in the input text, whichever occurred first after the first appearance of the word "YOUR".

Finally, the script writer must begin his script with a list, i.e., a message enclosed in parentheses, which contains the statement he wishes EIIZA to type when the system is first loaded. This list may be empty.

Editing of an ELIZA script is achieved via appeal to a contextual editing program (ED) which is part of the MAC library. This program is called whenever the input text to ELIZA consists of the single word "EDIT ". ELIZA then puts itself in a so-called dormant state and presents the then stored script for editing. Detailed description of ED is out of place here. Suffice it to say that changes, additions and deletions of the script may be made with considerable efficiency and on the basis of entirely contextual cues, i.e., without resort to line numbers or any other artificial devices. When editing is completed, ED is given the command to FILE the revised script. The new script is then stored on the disk and read into ELIZA. ELIZA then types the word "START" to signal that the conversation may resume under control of the new script.

ELIZAスクリプトの編集は、MACライブラリの一部であるコンテキスト編集プログラム(ED)へのアピールを介して行われます。このプログラムは、ELIZAへの入力テキストが単一の単語 "EDIT"で構成されているときはいつでも呼び出されます。その後、ELIZAはいわゆる休止状態に入り、保存されたスクリプトを編集用に提示します。EDの詳細な説明はここでは整っていません。台本の変更、追加および削除はかなり効率的にかつ完全に文脈的な合図に基づいて、すなわち行番号または他のいかなる人工装置に頼ることなくなされてもよいと言うだけで十分である。編集が完了すると、EDは修正されたスクリプトをFILEするためのコマンドを与えられます。新しいスクリプトはディスクに保存され、ELIZAに読み込まれます。次に、ELIZAは「START」という語を入力して、会話が新しいスクリプトの制御下で再開されることを通知します。

An important consequence of the editing facility built into ELIZA is that a given ELIZA script need not start out to be a large, full-blown scenario. On the contrary, it should begin as a quite modest set of keywords and transformation rules and permitted to be grown and molded as experience with it builds up. This appears to be the best way to use a truly interactive man-machine facility -- i.e., not as a device for rapidly debugging a code representing a fully thought out solution to a problem, but rather as an aid for the exploration of problem solving strategies.

ELIZAに組み込まれた編集機能の重要な結果は、与えられたELIZAスクリプトが大規模で本格的なシナリオであることを始める必要がないということです。それどころか、それはかなり控えめなキーワードと変換規則のセットとして始まり、それを使った経験が積み重なって成長し成形されることを許されるべきです。これは、真にインタラクティブなマンマシン施設を使う最善の方法のようです -- すなわち、問題に対する十分に考え出された解決策を表すコードを迅速にデバッグするための装置としてではなく、むしろ問題解決戦略の探求のための補助としてです。

Discussion(議論) At this writing, the only serious ELIZA scripts which exist are some which cause ELIZA to respond roughly as would certain psychotherapists (Rogerians). ELIZA performs best when its human correspondent is initially instructed to "talk" to it, via the typewriter of course, just as one would to a psychiatrist. This mode of conversation was chosen because the psychiatric interview is one of the few examples of categorized dyadic natural language communication in which one of the participating pair is free to assume the pose of knowing almost nothing of the real world. If, for example, one were to tell a psychiatrist "I went for a long boat ride" and he responded "Tell me about boats", one would not assume that he knew nothing about boats, but that he had some purpose in so directing the subsequent conversation. It is important to note that this assumption is one made by the speaker. Whether it is realistic or not is art altogether separate question. In any case, it has a crucial psychological utility in that it serves the speaker to maintain his sense of being heard and understood. The Speaker further defends his impression (which even in real life may be illusory) by attributing to his conversation partner all sorts of background knowledge, insights and reasoning ability. But again, these are the speaker's contribution to the conversation. They manifest themselves inferentially in the interpretations he makes of the offered responses. From the purely technical programming point of view then, the psychiatric interview form of an ELIZA script has the advantage that it eliminates the need of storing explicit information about the real world.

本稿の執筆時点で、存在する唯一の真面目なELIZAスクリプトは、ELIZAが特定の精神療法医(Rogerians)のように応答するものです。ELIZAは、それと対話する人間がそれと初めて「話す」ように、もちろんタイプライターを介して、精神科医と同じように、指示されたときに最高のパフォーマンスを発揮します。この会話形式は、精神医学的インタビューが、参加しているペアの1人が現実世界についてほとんど何も知らない姿勢を取ることが許される自然言語による2者間コミュニケーションに分類される数少ない例の1つであることから選択されました。たとえば、ある人が精神科医に「長いボートに乗った」と言い、「ボートについて教えてください」と答えた場合に、ボートについて何も知らなかったとは思っていませんが、その後の会話でも何らかの目的があります。この仮定は対話者によってなされたものであることに注意することが必要です。それが現実であろうがなかろうが全く別の問題です。いずれにせよ、対話者が聞き取り、理解される感覚を維持するために重要な心理的な有用性があります。対話者は、会話のパートナーにあらゆる種類の背景知識、洞察力、推論能力を帰属させることによって(その実生活が幻想であったとしても)彼の印象をさらに擁護します。これもまた、対話者の会話への貢献です。彼らは提示された反応を解釈して、それを推論します。純粋に技術的プログラミングの観点から、ELIZAスクリプトの精神医学的インタビュー形式は、現実世界に関する明示的な情報を埋め込む必要性を排除する利点があります。

The human speaker will, as has been said, contribute much to clothe ELIZA'S responses in vestments of plausibility. But he will not defend his illusion (that he is being understood) against all odds. In human conversation a speaker will make certain (perhaps generous) assumptions about his conversational partner. As long as, it remains possible to interpret the latter's responses consistently with those assumptions, the speaker's image of his partner remains unchanged, in particular, undamaged. Responses which are difficult to so interpret may well result in an enhancement of the image of the partner, in additional rationalizations which then make more complicated interpretations of his responses reasonable. When, however, such rationalizations become too massive and even self-contradictory, the entire image may crumble and be replaced by another ("He is not, after all, as smart as I thought he was"). When the conversational partner is a machine (the distinction between machine and program is here not useful) then the idea of credibility may well be substituted for that of plausibility in the above.

人間の対話者は、ELIZAの妥当性を証明するために多くの貢献をしています。大きな困難にもかかわらず、彼は(理解されているという)自分の錯覚を主張することはありません。人間の間での会話では、対話者は彼の会話相手について一定の(おそらく寛大な)仮定を行います。後者の反応をこれらの仮定と一貫して解釈することが可能であれば、相手のイメージは変わらず、特に傷つかないものです。そのように解釈することが困難な応答でも、パートナーのイメージを強化して追加の合理化をもたらし、その結果、彼の応答の合理化するより複雑な解釈を行う可能性があります。しかし、そのような合理化があまりにも重くなり、自己矛盾するようになっても、イメージ全体が崩壊し、別のものに置き換えられることがあります("結局、彼は自分が思ったほど賢くないだろう")。対話相手が機械である場合(機械とプログラムとの区別はここでは意味はありません)信憑性の考え方は上記の妥当性の考え方に代わる可能性があります。

With ELIZA as the basic vehicle, experiments may be set up in which the subjects find it credible to believe that the responses which appear on his typewriter are generated by a human sitting at a similar instrument in another room. How must the script be written in order to maintain the credibility of this idea over a long period of time? How can the performance of ELIZA be systematically degraded in order to achieve controlled and predictable thresholds of credibility in the subject? What, in all this, is the role of the initial instruction to the subject? On the other hand, suppose the subject is told he is communicating with a machine. What is he led to believe about the machine as a result of his conversational experience with it? Some subjects have been very hard to convince that ELIZA (with its present script) is not human. This is a striking form of Turing's test. What experimental design would make it more nearly rigorous and airtight?

基本的な手段としてELIZAを使って、被験者が彼のタイプライターに現れる応答は、別の部屋の同様の機器に座っている人間によって生成されると信じる実験を設定することができます。このアイデアの信頼性を長期間維持するためにスクリプトをどのように書くべきでしょうか?被験者の信頼性を制御可能かつ予測可能な閾値を達成するため、ELIZA のパフォーマンスを体系的に低下させるためにはどうすれば良いでしょうか?これを達成するため、被験者に対する最初の指示の役割は何でしょうか?あるいは、被験者に機械と通信していることを伝えたとします。会話した経験の結果として、彼に機械であることを信じさせるのは何でしょうか?(現在のスクリプトで動く)ELIZAが人間ではないことを説得するのは非常に困難でした。これは、チューリング・テストの典型的な事例です。どのような実験設計がより厳密で緻密なものになるのでしょうか?

The whole issue of the credibility (to humans) of machine output demands investigation. Important decisions increasingly tend to be made in response to computer output. The ultimately responsible human interpreter of "What the machine says" is, not unlike the correspondent with ELIZA, constantly faced with the need to make credibility judgments. ELIZA shows, if nothing else, how easy it is to create and maintain the illusion of understanding, hence perhaps of judgment deserving of credibility. A certain danger lurks there.

(人間の)機械出力に対する信頼性の一連の問題は、研究を必要とします。コンピュータ出力に応じて、重要な決定がますます増加する傾向にあります。ELIZAとよく似た「発言する機械」の判断について最終的な責任を負う人間は、常に信頼性の判断をする必要性に直面しています。他に何もなければ、理解の錯覚を作り、それを維持することがどれほど簡単であるかを、ELIZAは示しています。そこにある種の危険が潜んでいます。

The idea that the present ELIZA script contains no information about the real world is not entirely true. For example, the transformation rules which cause the input

現在のELIZAスクリプトに現実世界に関する情報が含まれていないという考え方は完全には真実ではありません。たとえば、入力を引き起こす変換ルール

Everybody hates me(誰もが私を嫌ってる) to be transformed to

は次のように変換されます。

Can you think of anyone in particular(特定の誰かを思い出せますか?) and other such are based on quite specific hypotheses about the world. The whole script constitutes, in a loose way, a model of certain aspects of the world. The act of writing a script is a kind of programming act and has all the advantages of programming, most particularly that it clearly shows where the programmer's understanding and command of his subject leaves off.

そして、その他のものは世の中についての非常に特殊な仮説に基づいています。スクリプト全体は、緩やかな方法で、世界の特定の側面のモデルを構成します。スクリプトを書く行為は一種のプログラミング行為であり、プログラミングのすべての利点を持っています。最も顕著なことは、プログラマーの理解と命令がどこに残されているかを明確に示しています。

A large part of whatever elegance may be credited to ELIZA lies in the fact that ELIZA maintains the illusion of understanding with so little machinery. But there are bounds on the extendability of ELIZA's "understanding" power, which arc a function of the ELIZA program itself and not a function of any script it may be given. The crucial test of understanding, as every teacher should know, is not the subject's ability to continue a conversation, but to draw valid conclusions from what he is being told. In order for a computer program to be able to do that, it must at least have the capacity to store selected parts of its inputs. ELIZA throws away each of its inputs, except for those few transformed by means of the MEMORY machinery. Of course, the problem is more than one of storage. A great part of it is, in fact, subsumed under the word "selected" used just, above. ELIZA in its use so far has had as one of its principal objectives the concealment of its lack of understanding. But to encourage its conversational partner to offer inputs from which it can select remedial information, it, must reveal its misunderstanding. A switch of objectives from the concealment to the revelation of misunderstanding is seen as a precondition to making an ELIZA-like program the basis for an effective natural language man-machine communication system.

ELIZAによって充たされるエレガンスさの大部分を占めているのは、ELIZAが機械をほとんど使用していないという錯覚を抱かせることにあります。しかし、ELIZAプログラムの機能で、与えられたスクリプトの機能ではない、ELIZAの「理解」力の拡張性には限界があります。すべての教師が知るべき、理解に関する決定的なテストは、会話を続ける被験者の能力ではなく、話されていることから有効な結論を引き出すことです。コンピュータプログラムがそれを行うためには、少なくとも入力の選択された一部を格納する能力を持っていなければなりません。ELIZAは、MEMORYの機械で変換されたものを除いて、それぞれの入力を捨てます。もちろん、問題は複数のストレージです。その大部分は、実際には、上記の「選択された」という言葉の下に包含されています。ELIZAは、これまでの使用において、その主要な目的の1つとして、理解の欠如を隠蔽してきました。しかし、対話相手に救済情報を選択できるインプットを提供することを奨励するためには、その誤解を明らかにしなければならない。ELIZAのようなプログラムを効果的な自然言語のマン・マシン通信システムの基礎にするための前提条件として、誤解の隠蔽から啓示へと目的を切り替える必要があります。

One goal for an augmented ELIZA program is thus a system which already has access to a store of information about some aspects of the real world and which, by means of conversational interaction with people, can reveal both what it knows, i.e., behave as an information retrieval system, and where its knowledge ends and needs to be augmented. Hopefully the augmentation of its knowledge will also be a direct consequence of its conversational experience. It is precisely the prospect that. such a program will converse with many people and learn something from each of them, which leads to the hope that it will prove an interesting and even useful conversational partner.

ELIZAプログラムの拡張の1つの目標は、現実の世界のいくつかの側面について既に記憶されている情報にアクセスできるシステムで、すなわち、情報検索システムとして振る舞う、知っているものと、その知識が終わり、人々との会話のやりとりによって拡張される必要がある場所の両方を明らかにすることができるものです。うまくいけば知識の拡大は、会話経験の直接的な結果にもなります。それはまさにその見通しです。そのようなプログラムは、多くの人と会話し、それぞれから何かを学ぶので、興味深く、役に立つ会話のパートナーになることが期待されます。

One way to state a slightly different intermediate goal is to say that ELIZA should be given the power to slowly build a model of the subject conversing with it. If the subject mentions that he is not married, for example, and later speaks of his wife, then ELIZA should be able to make the tentative inference that he is either a widower or divorced. Of course, he could simply be confused. In the long run, ELIZA should be able to build up a belief structure (to use Abelson's phrase) of the subject and on that basis detect the subject's rationalizations, contradictions, etc. Conversations with such an ELIZA would often turn into arguments, Important steps in the realization of these goals have already been taken. Most notable among these is Abelson's and Carroll's work on simulation of belief structures [1].

わずかに異なる中間目標を述べる1つの方法は、ELIZAがそれを話す主題のモデルをゆっくりと構築する力を与えられるべきだと言うことです。たとえば、結婚していないと主張し、後で妻を話すと、ELIZAは彼が死別しているか離婚しているかの仮推測をすることができます。もちろん、彼は単に混乱するかも知れません。長期的には、ELIZAは被験者の信念構造(Abelsonのフレーズを使用する)を構築でき、その基礎で被験者の合理化、矛盾などを検出できるはずです。そのようなELIZAとの会話は、しばしば議論に変わるでしょう、これらの目標の実現における重要なステップは既に行われています。これらの中で最も顕著なものは、AbelsonとCarrollの信念構造のシミュレーションに関する研究[1]です。

The script that has formed the basis for most of this discussion happens to be one with an overwhelming psychological orientation. The reason for this has already been discussed. There is a danger, however, that the example will run away with what it is supposed to illustrate. It is useful to remember that the ELIZA program itself is merely a translating processor in the technical programming sense. Gorn[2] in a paper on language systems says:

この議論の大部分の基礎を成しているスクリプトは、圧倒的な心理的指向を持ったものです。その理由はすでに議論されていますが、例が説明することになっていることを見逃してしまう危険性があります。 ELIZAプログラム自体はプログラミング技術的な意味では、単なる変換プロセッサであることを覚えておくと便利です。言語システムに関する論文[2]の中で、Gorn は次のように語っています: 

Given a language which already possesses semantic content, then a translating processor, even if it operates only syntactically, generates corresponding expressions of another language to which we can attribute as "meanings" (possibly multiple -- the translator may not be one to one) the "semantic intents" of the generating source expressions; whether we find the result consistent or useful or both is, of course, another problem. It is quite possible that by this method the same syntactic object language can be usefully assigned multiple meanings for each expression... すでに意味的な内容を持っている言語を考えれば、翻訳プロセッサは、たとえそれが文法的にのみ動作していても、「意味」と見なすことができる別の言語の対応する表現を生成する(おそらく複数 - 翻訳者は一対一ではない)生成元の式の「意味的な意図」結果が一貫しているか有用であるか、あるいはその両方であるかどうかは、もちろん別の問題です。この方法によって、同じ構文オブジェクト言語が各式に対して複数の意味を便利に割り当てられる可能性があります。

It is striking to note how well his words fit ELIZA. The "given language" is English as is the "other language", expressions of which arc generated. In principle, the given language could as well be the kind of English in which "word problems" in algebra are given to high school students and the other language, a machine code allowing a particular computer to "solve" the stated problems. (See Bobrow's program STUDENT[3].)

彼の言葉がELIZAにどれほどうまく収まるかを知ることは印象的です。「与えられた言語」は「他の言語」と同様に英語であり、その表現は生成される。原則として、与えられた言語は、代数の「単語問題」が高校生に与えられる英語のようなものでもよいし、特定のコンピュータが上記の問題を「解決」できるマシンコードでもよい。(BobrowのSTUDENT[3]を参照)

The intent of the above remarks is to further rob ELIZA of the aura of magic to which its application to psychological subject matter has to some extent contributed. Seen in the coldest possible light, ELIZA is a translating processor in Gorn's sense; however, it is one which has been especially constructed to work well with natural language text.

上記の発言の意図は、心理的な主題へのその応用がある程度貢献してきた魔法のオーラをELIZAからさらに奪うことである。可能な限り冷たい光から見て、ELIZAはGornの意味での翻訳プロセッサです。しかし、それは自然言語のテキストでうまく機能するように特に構築されたものです。  

REFERENCES 1. ABELSON, R. P., AND CARROLL, J. D. Computer simulation of individual belief systems. Amer. Behav. Sci. 9 (May 1965), 24-30.

  1. GORN, S. Semiotic relationships in ambiguously stratified language systems. Paper presented at Int. Colloq. Algebraic Linguistics and Automatic Theory, Hebrew U. of Jerusalem, Aug. 1964.

  2. BOBROW, D. G. Natural language input for a computer problem solving system. Doctoral thesis, Math. Dept., MIT. Cambridge, Mass., 1964.

  3. WEIZENBAUM, J. Symmetric list processor. Comm. ACM 6, (Sept. 1963), 524-544.

  4. ROGERS, C. Client Centered Therapy: Current Practice, Implications and Theory. Houghton Mifflin, Boston, 1951.

  5. YNGVE, J. COMIT Programndng Manual. MIT Press, Cambridge, Mass., 1961. 

APPENDIX. An ELIZA Script

-------------------------------------------------------
(HOW DO YOU DO. PLEASE TELL ME YOUR PROBLEM)
START
(SORRY ((0) (PLEASE DON'T APOLIGIZE)
(APOLOGIES ARE NOT NECESSARY) (WHAT FEELINGS
DO YOU HAVE WHEN YOU APOLOGIZE) (I'VE TOLD YOU
(DONT = DON'T)
(CANT = CAN'T)
(WONT = WON'T)
(REMEMBER S
((0 YOU REMEMBER O) (DO YOU OFTEN THINK OF 4)
(DOES THINKING OF 4 BRING ANYTHING ELSE TO MIND)
(WHAT ELSE OO YOU REMEMBER)
(WHY DO YOU REMEMBER 4 JUST NOW)
(WHAT IN THE PRESENT SITUATION REMINDS YOU OF 4)
(WHAT IS THE CONNECTION BETWEEN ME AND 4))
((0 DO I REMEMBER 0) (DID YOU THINK I WOULD FORGET 5)
(WHY DO YOU THINK I SHOULD RECALL 5 NOW)
(WHAT ABOUT 5) (=WHAT) (YOU MENTIONED S))
((0) (NEWKEY)))
(IF 3 ((0 IF 0) (DO YOU THINK ITS LIKELY THAT 3) (DO YOU WISH THAT 3)
(WHAT DO YOU THINK ABOUT 3) (REALLY, 2 3)))
(WHAT DO YOU THINK ABOUT 3) (REALLY, 2 3)))
(DREAMT 4 ((0 YOU DREAMT O)
(REALLY, 4) (HAVE YOU EVER FANTASIED 4 WWILE YOU WERE AWAKE)
(HAVE YOU DREAMT 4 BEFORE) (=DREAM) (NEWKEY)))
(DREAMED = DREAMT 4 (=DREAMT))
(DREAM 3 ((0) (WHAT DOES THAT DREAM SUGGEST TO YOU)
(DO YOU DREAM OFTEN) (WHAT PERSONS APPEAR IN YOUR DREAMS)
(DON'T YOU BELIEVE THAT DREAM HAS SOMETHING TO DO WITH
YOUR PROBLEM) (NEWKEY)))
(DREAMS = DREAM 3 (=DREAM))
(HOW (=WHAT))
(WHEN (=WHAT))
(ALIKE 10 (=DIT))
(SAME 10 (=DIT))
(CERTAINLY (=YES))
(FEEL DLIST(/BELIEF))
(THINK DLIST(/BELIEF))
(BELIEVE DLIST(/BELIEF))
(WISH DLIST(/BELIEF))
(MEMORY MY (0 YOUR 0 = LETS DISCUSS FURTHER WHY YOUR 3)
(0 YOUR 0 = EARLIER YOU SAID YOUR 3)
(O YOUR 0 = BUT YOUR 3)
(0 YOUR 0 = DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR 3))
(NONE ((0) (I AM NOT SURE I UNDERSTAND YOU FULLY)
(PLEASE GO ON)
(WHAT DOES THAT SUGGEST TO YOU)
(DO YOU FEEL STRONGLY ABOUT DISCUSSING SUCH THINGS)))
(PERHAPS ((0) (YOU DON'T SEEM QUITE CERTAIN)
(WHY THE UNCERTAIN TONE)
(CAN'T YOU BE MORE POSITIVE)
(YOU AREN'T SURE) (DON'T YOU KNOW)))
(MAYBE (=PERHAPS))
(NAME 15 ((0) (I AM NOT INTERESTED IN NAMES)
(I'VE TOLD YOU BEFORE, I DON'T CARE ABOUT NAME -
PLEASE CONTINUE)) )
PLEASE CONTINUE)) )
(DEUTSCH (=XFREMD))
(FRANCAIS (=XFREMD))
(ITALIANO (=XFREMD))
(ESPANOL (=XFREMD))
(XFREMD ((0) (I AM SORRY, I SPEAK ONLY ENGLISH)))
(HELLO ((0) (HOW DO YOU DO, PLEASE STATE YOUR PRORLEM)))
(COMPUTER 50 ((O) (DO COMPUTERS WORRY YOU)
(WHY DO YOU MENTION COMPUTERS) (WHAT DO YOU THINK MACHINES
HAVE TO DO WITH YOUR PROBLEM) (DON'T YOU THINK COMPUTERS CAN
HELP PEOPLE) (WHAT ABOUT MACHINES WORRIES YOU) (WHAT
DO YOU THINK ABOUT MACHINES)))
(MACHINE SO (=COMPUTER))
(MACHINES 50 (=COMPUTER))
(COMPUTERS 50 (=COMPUTER))
(AM = ARE ((O ARE YOU O) (DO YOU BELIEVE YOU ARE 4)
(WOULD YOU WANT TO BE 4) (YOU WISH I WOULD TELL YOU YOU ARE 4)
(WHAT WOUD IT MEAN IF YOU WERE 4) (=WHAT))
((0) (WHY DO YOU SAY 'AM') (I DON'T UNDERSTAND THAT)))
(ARE ((0 ARE I 0)
(WHY ARE YOU INTERESTED IN WHETHER I AM 4 OR NOT)
(WOULD YOU PREFER IF I WEREN'T 4) (PERHAPS I AM 4 IN YOUR
FANTASIES) (DO YOU SOMETIMES THINK I AM 4) (=WHAT))
((O ARE 0) (DID YOU THINK THEY MIGHT NOT BE 3)
(WOULD YOU LIKE IT IF THEY WERE NOT 3) (WHAT IF THEY WERE NOT 3)
(POSSIBLY THEY ARE 3)) )
(YOUR = MY ((0 MY O) (WHY ARE YOU CONCERNED OVER MY 3)
(WHAT ABOUT YOUR OWN 3) (ARE YOU WORRIED ABOUT SOMEONE ELSES 3)
(REALLY, MY 3)))
(WAS 2 ((0 WAS YOU 0 )
(WHAT IF YOU WERE 4) (DO YOU THINK YOU WERE 4)
(WERE YOU 4) (WHAT WOULD IT MEAN IF YOU WERE 4)
(WHAT DOES ' 4 ' SUGGEST TO YOU) (=WHAT))
((O YOU WAS O)
(WERE YOU REALLY) (WHY DO YOU TELL ME YOU WERE 4 NOW)
(WERE YOU REALLY) (WHY DO YOU TELL ME YOU WERE 4 NOW)
(PERHAPS I ALREADY KNEW YOU WERE 4) )
((O WAS I O) (WOULD YOU LIKE TO BELIEVE I WAS 4)
(WHAT SUGGESTS THAT I WAS 4)
(WHAT DO YOU THINK) (PERHAPS I WAS 4)
(WHAT IF I HAD BEEN 4))
((0) (NEWKEY)) )
(WERE = WAS (=WAS))
(ME = YOU)
(YOU'RE = I'M ((0 I'M 0) (PRE ( I ARE 3) (=YOU))))
(I'M = YOU'RE ((0 YOU'RE O) (PRE (YOU ARE 3) (=I))))
(MYSELF = YOURSELF)
(YOURSELF = MYSELF)
(MOTHER DLIST(/NOUN FAMILY))
(NON = MOTHER DLIST(/ FAMILY))
(DAD = FATHER DLIST(/ FAMILY))
(SISTER BLIST(/FAMILY))
(BROTHER DLIST(/FAMILY))
(WIFE DLIST(/FAMILY))
(CHILDREN DLIST(/FAMILY))
(I = YOU
((0 YOU (* WANT NEED) O) (WHAT WOULD IT MEAN TO YOU IF YOU GOT 4)
(WHY DO YOU WANT 4) (SUPPOSE YOU GOT 4 SOON) (WHAT
IF YOU NEVER GOT 4) (WHAT WOULD GETTING 4 MEAN TO
YOU) (WHAT DOES WANTING 4 HAVE TO DO WITH THIS DISCUSSION))
((0 YOU ARE O (*SAD UNHAPPY DEPRESSED SICK ) 0)
(I AM SORRY TO HEAR YOU ARE 5) (DO YOU THINK COMING HERE
WILL HELP YOU NOT TO BE 5) (I'M SURE ITS NOT PLEASANT TO
BE 5) (CAN YOU EXPLAIN WHAT MADE YOU 5))
((O YOU ARE O (*HAPPY ELATED GLAD BETTER ) 0)
(HOW HAVE I HELPED YOU TO BE 5)
(HAS YOUR TREATMENT MADE YOU 5) (WHAT MAKES YOU S JUST
NOW) (CAN YOU EXPLAIN WHY YOU ARE SUDDENLY 5))
((0 YOU WAS O) (=WAS))
((0 YOU WAS O) (=WAS))
((O YOU (/BELIEF) YOU 0) (DO YOU REALLY THINK SO) (BUT YOU ARE
NOT SURE YOU 5) (DO YOU REALLY DOUBT YOU 5))
((0 YOU 0 (/BELIEF) O I 0) (=YOU))
((0 YOU ARE O)
(IS IT BECAUSE YOU ARE 4 THAT YOU CAME TO ME)
(HOW LONG HAVE YOU BEEN 4)
(DO YOU BELIEVE IT NORMAL TO BE 4)
(DO YOU ENJOY BEING 4))
((0 YOU (* CAN'T CANNOT) 0) (HOW DO YOU KNOW YOU CAN'T 4)
(HAVE YOU TRIED)
(PERHAPS YOU COULD 4 NOW)
(DO YOU REALLY WANT TO BE ABLE TO 4))
((0 YOU DON'T 0) (DON'T YOU REALLY 4)(WHY DON'T YOU 4)
(DO YOU WISH TO BE ABLE TO 4) (DOES THAT TROUBLE YOU))
((0 YOU FEEL 0) (TELL ME MORE ABOUT SUCH FEELINGS)
(DO YOU OFTEN FEEL 4)
(DO YOU ENJOY FEELING 4)
(OF WHAT DOES FEELING 4 REMIND YOU))
((0 YOU 0 I 0) (PERHAPS IN YOUR FANTASY WE 3 EACH OTHER)
(DO YOU WISH TO 3 ME)
(YOU SEEN TO NEED TO 3 ME)
(DO YOU 3 ANYONE ELSE))
((0) (YOU SAY 1)
(CAN YOU ELABORATE ON THAT) (DO YOU SAY 1 FOR SOME SPECIAL REASON)
(THAT'S QUITE INTERESTING)))
(YOU = I ((O I REWIND YOU OF O) (-DIT))
((0 I ARE 0) (WHAT MAKES YOU THINK I AM 4)
(DOES IT PLEASE YOU TO RELIEVE I AM 4)
(DO YOU SOMETIMES WISH YOU WERE 4)
(PERHAPS YOU WOULD LIKE TO BE 4))
((0 I 0 YOU) (WHY DO YOU THINK I 3 YOU)
(YOU LIKE TO THINK I 3 YOU - DON'T YOU)
(WHAT MAKES YOU THINK I 3 YOU)
(REALLY, I 3 YOU) (DO YOU WISH TO BELIEVE I 3 YOU)
(REALLY, I 3 YOU) (DO YOU WISH TO BELIEVE I 3 YOU)
(SUPPOSE I DID 3 YOU - WHAT WOULD THAT MEAN)
(DOES SOMEONE ELSE BELIEVE I 3 YOU))
((0 I O) (WE WERE DISCUSSING YOU - NOT ME)
(OH, I 3) (YOU'RE NOT REALLY TALKING ABOUT ME - ARE YOU)
(WHAT ARE YOUR FEELINGS NOW)))
(YES ((0) (YOU SEEM QUITE POSITIVE) (YOU ARE SURE)
(I SEE) (I UNDERSTAND)))
(NO ((0) (ARE YOU SAYING 'NO' JUST TO BE NEGATIVE)
(YOU ARE BEING A BIT NEGATIVE) (WHY NOT) (WHY ' NO')))
(MY = YOUR 2 ((0 YOUR 0 (/FAMILY) 0)
(TELL ME MORE ABOUT YOUR FAMILY) ( WHO ELSE IN YOUR FAMILY
5) (YOUR 4) (WHAT ELSE COMES TO MIND WHEN YOU THINK OF
YOUR 4))
((0 YOUR O) (YOUR 3) (WHY DO YOU SAY YOUR 3) (DOES THAT
SUGGEST ANYTHING ELSE WHICH BELONGS TO YOU) (IS IT
IMPORTANT TO YOU THAT 2 3)))
(CAN ((0 CAN I O) (YOU BELIEVE I CAN 4 DON'T YOU) (=WHAT)
(YOU WANT ME TO BE ABLE TO 4) (PERHAPS YOU WOULD LIKE TO BE
ABLE TO 4 YOURSELF)) ((0 CAN YOU 0) (WHETHER OR NOT YOU CAN 4
DEPENDS ON YOU MORE THAN ON ME) (DO YOU WANT TO BE ABLE TO 4)
(PERHAPS YOU DON'T WANT TO 4) (=WHAT)))
(WHAT ((O) (WHY DO YOU ASK) (DOES THAT QUESTION INTFRrST YOU)
(WHAT IS IT YOU REALLY WANT TO KNOW)
(ARE SUCH QUESTIONS MUCH ON YOUR MIND)
(WHAT ANSWER WOULD PLEASE YOU MOST)
(WHAT DO YOU THINK) (WHAT COMES TO YOUR MIND WHFN YOU ASK THAT)
(HAVE YOU ASKED SUCH QUESTION BEFORE)
(HAVE YOU ASKED ANYONE ELSE)))
(BECAUSE ((0) (IS THAT THE REAL REASON) (DON'T ANY OTHER REASONS
COME TO HIND) (DOES THAT REASON SEEM TO EXPLAIN ANYTHING ELSE)
(WHAT OTHER REASONS MIGHT THERE BE)))
(WHY ((O WHY DON'T I 0) (DO YOU BELIEVE I DON'T 5) (PERHAPS I
WILL 5 IN GOOD TIME) (SHOULD YOU 5 YOURSELF) (YOU WANT ME TO 5)
(=WHAT))
(=WHAT))
((0 WHY CAN'T YOU O) (DO YOU THINK YOU SHOULD BE ABLE TO 5)
(DO YOU WANT TO BE ABLE TO 5) (DO YOU BELIEVE THIS WILL HELP YOU
TO 5) (HAVE YOU ANY IDEA WHY YOU CAN'T 5) (=WHAT))
(= WHAT))
(EVERYONE 2 ((O (* EVERYONE EVERYBODY NOBODY NOONF) O )
(REALLY, 2) (SURELY NOT 2) (CAN YOU THINK OF
ANYONE IN PARTICULAR) (WHO, FOR EXAMPLE) (YOU ARE THINKINO OF
A VERY SPECIAL PERSON)
(WHO, MAY I ASK) (SOMEONE SPECIAL PERHAPS)
(YOU HAVE A PARTICULAR PERSON IN MINn, DON'T YOU) (WHO DO YOU
THINK YOU'RE TALKING ABOUT)))
(EVERYBODY 2 (= EVERYONE))
(NOBODY 2 (=EVERYONE))
(NOONE 2 (=EVERYONE))
(ALWAYS 1 ((0) (CAN YOU THINK OF A SPECIFIC EXAMPLE) (WHEN)
(WHAT INCIDENT ARE YOU THINKING OF) (REALLY, ALWAYS)))
(LIKE 10 ((O (*AM IS ARE WAS) 0 LIKE O) (=DIT))
((0) (NEWKEY)) )
(DIT ((O) ( IN WHAT WAY) (WHAT RESEMBLANCE DO YOU SEE)
(WHAT DOES THAT SIMILARITY SUGGEST TO YOU)
(WHAT OTHER CONNECTIONS DO YOU SEE)
(WHAT DO YOU SUPPOSE THAT RESEMBLANCE MEANS)
(WHAT IS THE CONNECTION, DO YOU SUPPOSE)
(COULD THERE REALLY BE SOME CONNECTION)
(HOW)))
()
-------------------------------------------------------

RECEIVED SEPTEMBER, 1965

Volume 9 / Number 1 / January, 1966

LETTERS--continued from p. 35

The technique consists of translating the code for the letter "O" to the code for the numeral O whenever it is encountered in the input character string. If the string consists only of items such as nulmbers and names and it is necessary to sort alphabetically on names, the occurrence of an alphabetic character within a name field is used to cause the code for zero to be retranslated to the code for the letter "0" by a rescan of the characters in the name field.

If no sorting is required, the retranslation can be avoided, provided that delimiters such as FORMAT or GO TO are spelled with zero within the recognizer segment of a translator. It, is also necessary to redefine identifier as

::= | | | <0> where it is understood that the letter "O" is removed from the standard definition of letter as in ALGOL 60. The redefinition permits the inclusion of identifiers such as ODD or OOPS but prevents the use of an identitier consisting only of the repeated m ark O.

This technique requires consistency of use and might result in chaos in a warehousing operation in which the letter "0" is used in parts labels with check digits.

  1. RICHARD TURNER NASA Lewis Research Center Cleveland, Ohio

Comment on a Problem in Concurrent Programing Control

Dear Editor: I would like to comment on Mr. Dijksra's solution [Solution of a problem in concurrent programming control. Comm ACM 8(Sept. 1965), 569] to a messy problem that is hardly academic . We are using it no w on a multiple computer complex. When there are only two computers, the algorithm may be simplified to the following:

Boolean array b(0; 1) integer k, i, j, comment This is the program for computer i, which may be either 0 or 1, computer j != i is the other one, 1 or 0; CO: b(i) := false; C1: if k != i then begin C2: if not b(j) then go to C2; else k := i; go to C1 end; else critical section; b(i) := true; remainder of program; go to C0; end Mr. Dijkstra has come up with a clever solution to a really practical problem.

HARRIS HYMAN Munitype New York, New York

 

*1:D1) (R1, 1) (R1, 2) ... (R1, m1

*2:D2) (R2, 1) (R2, 2) ... (R2, m2

*3:Dn) (Rn, 1) (Rn, 2) ... (Rn, mn))) where K is the keyword, Di the ith decomposition rule associated with K and Ri,j the jth reassembly rule associated with the ith decomposition rule.

ここで、K はキーワードであり、Di は i 番目の分解ルールに関連する j 番目の再アセンブリルールであり、K および Ri に関連する i 番目の分解ルールです。

 

図1.キーワードとルールリストの構造 A common pictorial representation of such a structure is the tree diagram shown in Figure 1. The top level of this structure contains the keyword followed by the names of lists; each one of which is again a list structure beginning with a decomposition rule and followed by reassembly rules. Since list structures of this type have no predetermined dimensionality limitations, any number of decomposition rules m a y be associated with a given keyword and any number of reassembly rules witch any specific decomposition rule. SLIP is rich in functions that sequence over structures of this type efficiently. Hence programming problems are minimized.

図1に示すツリー図はこのような構造の一般的な絵表示です。この構造の最上位には、キーワードとそれに続くリストの名前が含まれています。それぞれが分解規則で始まり、その後に再組み立て規則が続くリスト構造です。このタイプのリスト構造には、あらかじめ決められた次元の制限がありません。任意の数の分解規則を所与のキーワードと関連付けることができ、任意の数の再組み立て規則を任意の特定の分解規則と組み合わせることができます。SLIPはこのタイプの構造を効率的に処理する機能が豊富です。したがって、プログラミングの問題は最小限に抑えられます。

An ELIZA script consists mainly of a set of list structures of the type shown. The actual keyword dictionary is constructed when such a script is first read into the hitherto empty program. The basic structural component of the keyword dictionary is a vector KEY of (currently) 128 contiguous computer words. As a particular key list structure is read the keyword K at its top is randomized (hashed) by a procedure that produces (currently) a 7 bit integer "i". The word "always", for example, yields the integer 14. KEY(i), i.e., the ith word of the vector KEY, is then examined to determine whether it contains a list name. If it does not, then an empty list is created, its name placed in KEY(i), and the key list structure in question placed on that list. If KEY(i) already contains a list name, then the name of the key list structure is placed on the bottom of the list named in KEY(i). The largest dictionary so far attempted contains about 50 keywords. No list named in any of the words of the KEY vector contains more than two key list structures.

ELIZAスクリプトは、主に、表示されているタイプの一連のリスト構造で構成されています。実際のキーワード辞書は、そのようなスクリプトが最初にこれまで空のプログラムに読み込まれたときに構築されます。キーワード辞書の基本的な構成要素は(今のところ)連続した128ワードの KEY 配列です。特定のキーリスト構造が読み取られると、その先頭のキーワード K が(今のところ)7ビット整数 "i" を生成する手順によってランダム化(ハッシュ化)されます。たとえば "always" という語は整数14を返します。 次に KEY(i)、すなわちベクトルKEYの i 番目のワードは、それがリスト名を含むかどうかを決定するために検査されます。そうでない場合は、空のリストが作成され、その名前が KEY(i) に配置され、問題のキーリスト構造がそのリストに配置されます。KEY(i) にすでにリスト名が含まれている場合は、キーリスト構造の名前はKEY(i) で指定されたリストの末尾に配置されます。これまでに試みられた最大の辞書は約50のキーワードを含んでいます。KEY配列のどの単語でも指定されたリストには、3つ以上のキーリスト構造が含まれていません。

Every word encountered in the scan of an input text, i.e., during the actual operations of ELIZA, is randomized by the same hashing algorithm as was originally applied to the incoming keywords, hence yields an integer which points to the only possible list structure which could potentially contain that word as a keyword. Even then, only the tops of any key list structures that may be found there need be interrogated to determine whether or not a keyword has been found. By virtue of the various list sequencing, operations that SLIP makes available, the actual identification of a keyword leaves as its principal product a pointer to the list of decomposition (and hence reassembly) rules associated with the identified keyword. One result of this strategy is that often less time is required to discover that a given word is not in the keyword dictionary than to locate it if it is there. However, the location of a keyword yields pointers to all information associated with that word.

入力テキストのスキャン中、すなわちELIZAの実際の操作中に遭遇したすべての単語は、もともと入ってきたキーワードに適用されたのと同じハッシュアルゴリズムによってランダム化され、したがって唯一の可能なリスト構造を指す整数を生じる。その単語をキーワードとして含む可能性があります。それでも、キーワードが見つかったかどうかを判断するには、そこに見つかった可能性のあるキーリスト構造の先頭のみを調べる必要があります。SLIPが利用可能にするさまざまなリスト順序付け、操作のおかげで、キーワードの実際の識別は、識別されたキーワードに関連する分解(したがって再構成)規則のリストへのポインタをその主要な積として残します。この戦略の1つの結果は、与えられた単語がキーワード辞書にないことを発見するのに必要な時間がそれがあればそれを見つけるよりも少ないことです。しかしながら、キーワードの位置はその単語に関連する全ての情報へのポインタをもたらします。

Some conversational protocols require that certain transformations be made on certain words of the input text independently of any contextual considerations. The first conversation displayed in this paper, for example, requires that first person pronouns be exchanged for second person pronouns and vice versa throughout tile input text. There may be further transformations but these minimal substitutions are unconditional. Simple substitution rules ought not to be elevated to the level of transformations, nor should the words involved be forced to carry with them all the structure required for the fully complex case. Furthermore, unconditional substitutions of single words for single words can be accomplished during the text scan itself, not as a transformation of the entire text subsequent to scanning. To facilitate the realization of these desiderata, any word in the key dictionary, i.e., at the top of a key fist, structure., may be followed by an equal sign followed by whatever word is to be its substitute. Transformation rules may, but need not, follow. If none do follow such a substitution rule, then the substitution is made on the fly, i.e., during text scanning, but the word in question is not identified as a keyword for subsequent purposes. Of course, a word may be both substituted for and be a keyword as well. An example of a simple substitution is

会話型プロトコルの中には、文脈上の考慮事項とは関係なく、入力テキストの特定の単語に対して特定の変換を行うことを要求するものがあります。例えば、この論文に表示されている最初の会話では、一人称代名詞を二人称代名詞と交換し、その逆も同様です。さらなる変換があるかもしれませんが、これらの最小限の置換は無条件です。単純な置換規則は、変換のレベルにまで引き上げられるべきではなく、また関連する言葉が、完全に複雑な場合に必要なすべての構造をそれらと共に持っていくことを強制されるべきでもありません。さらに、単一の単語から単一の単語への無条件の置換は、スキャン後のテキスト全体の変換としてではなく、テキストスキャン自体の間に実行できます。これらの必要条件の実現を容易にするために、キー辞書内の任意の単語、すなわちキー・フィスト構造の最上部に、等号とそれに続く任意の単語をその代替物とすることができます。変換規則は従う必要がありますが、従う必要はありません。そのような置換規則に従うものがなければ、置換はその場で、すなわちテキスト走査中に行われるが、問題の単語は後続の目的のためのキーワードとして識別されません。もちろん、単語をキーワードに置き換えることもキーワードにすることもできます。単純な置換の例は

(YOURSELF = MYSELF). Neither "yourself" nor "myself" are keywords in the particular script from which this example was chosen. The fact that keywords can have ranks or precedences has already been mentioned. The need of a ranking mechanism may be established by an example. Suppose an input sentence is "I know everybody laughed at me." A script may tag the word "I" as well as the word "everybody" as a keyword. Without differential ranking, "I" occurring first would determine the transformation to be applied. A typical response might be "You say you know everybody laughed at you." But the important message in the input sentence begins with the word "everybody". It is very often true that when a person speaks in terms of universals such as "everybody", "always" and "nobody" he is really referring to some quite specific event or person. By giving "everybody" a higher rank than "I", the response "Who in particular are you thinking of" may be generated.

この例が選択された特定のスクリプトでは、「自分」も「私自身」もキーワードではありません。キーワードがランクや優先順位を持つことができるという事実はすでに言及されています。ランク付けメカニズムの必要性は、例によって確立され得ます。入力文が「誰もが私に笑ったことを知っている」と仮定します。スクリプトは、キーワードとして「私」という単語と「みんな」という単語をタグ付けすることができます。格付けの差がなければ、最初に現れる "I"が適用される変換を決定します。典型的な応答は、「あなたは誰もがあなたに笑ったことを知っていると言う」かもしれません。しかし、入力文中の重要なメッセージは「みんな」という言葉で始まります。 「全員」、「常に」、「誰もいない」などの普遍的な観点から人が話すとき、彼は実際には非常に特定の出来事や人を指しているのは事実です。「みんな」に「私」よりも高いランクを付けることで、「誰が特に考えているのか」という応答が生成される場合があります。 

図2.キーワード検出の基本フロー図 The specific mechanism employed in ranking is that the rank of every keyword encountered (absence of rank implies rank equals 0) is compared with the rank of the highest, ranked keyword already seen. If the rank of the new word is higher than that of any previously encountered word, the pointer to the transformation rules associated with the new word is placed on top of a list called the keystack, otherwise it is placed on the bottom of the keystack. When the text scan terminates, the keystack has at its top a pointer associated with the highest ranked keyword encountered in the scan. The remaining pointers in the stack may not be monotonically ordered with respect to the ranks of the words from which they were derived, but they are nearly so -- in any event they are in a useful and interesting order. Figure 2 is a simplified flow diagram of keyword detection. The rank of a keyword must, of course, also be associated with the keyword. Therefore it must appear on the keyword list structure. It may be found, if at all, just in front of the list of transformation rules associated with the keyword. As an example consider the word "MY" in a particular script. Its keyword list may be as follows:

ランク付けに使用される特定のメカニズムは、出会ったすべてのキーワードのランク(ランクの欠如はランクが0に等しいことを意味する)が、すでに見られた最高ランクのキーワードのランクと比較されることです。新しい単語のランクが以前に見つかった単語のランクよりも高い場合、新しい単語に関連付けられている変換規則へのポインタはキースタックと呼ばれるリストの上に配置され、それ以外の場合はキースタックの下に配置されます。テキストスキャンが終了すると、キースタックの一番上に、スキャンで見つかった最高ランクのキーワードに関連付けられたポインタが表示されます。スタック内の残りのポインタは、派生元の単語のランクに関して単調に並んでいるわけではありませんが、ほぼそうです ー いずれにせよ、彼らは便利で面白い順番になっています。図2は、キーワード検出の単純化されたフロー図です。キーワードのランクも、もちろんそのキーワードに関連付けられている必要があります。したがって、それはキーワードリスト構造に現れなければなりません。仮にあったとしても、それはキーワードに関連した変換規則のリストの直前にあるかもしれません。例として、特定の文字で「MY」という単語を考えます。キーワードリストは次のとおりです。

(MY = YOUR 5 (transformation rules

*4:D1) (R1,1) (R1,2) ... (R1, Rm1

*5:Di)(Ri,1)(R ~)・・・(Ri, mi

*6:D21(R2, 1)(R2, 2)・・・(R2, m2

*7:0) (Why do you ask) (Is that an important question)・・・) which would apply qeually well to the keywords "how" and "when". The entire keyword list for "how" may therefore be

(How (= What

*8:0 are you 0) (Do you believe you are 4)・・・(= what)・・・) (It is here assumed that "are" has been substituted for "am" and "you" for "I" in the initial text scan) Then, the input text

Am I sick would elicit either

Do you believe you are sick or

Why do you ask depending on how many times the general form had already occurred.

Under still other conditions it may be desirable to perform a preliminary transformation on the input text before subjecting it to the decompositions and reassemblies which finally yield the output text. For example, the keyword "you're" should lead to the transformation rules associated with "you" but should first be replaced by a word pair. The dictionary entry for "you're" is therefore:

(you're = I'm ((0 I'm O) (PRE (I AM 3) (=YOU)))) which has the following effect:

Wherever "you're" is found in the input text, it is replaced by "I'm". If "you're" is actually selected as the regnant keyword, then the input text is decomposed into three constituent parts, namely, all text in front of the first occurrence of "I'm", the word "I'm" itself, and all text following the first occurrence of "I'm". The reassembly rule beginning with the code "PRE" is encountered and the decomposed text reassembled such that the words "I AM" appear in front of the third constituent, determined by the earlier decomposition. Control is transferred, so to speak, to the transformtion rules associated with the keyword "you", where, further decompositions etc. are attempted. It is to be noted that the set

(PRE (I AM 3) (=YOU

僕のホラは、次の3月18日にリアルになるか?

Will my big talk be real next March 18 ?


2022/12/25
藤田昭人


5日間連続投稿の最中に kun432 氏に「こっちにも投稿しませんか?」と 誘われて…

qiita.com

実は昨日は一日 Qiita の markdown と格闘してました。 が、やっぱりエディタは慣れてないとねぇ…
どうやら Advent Calendar の執筆は 外部のブログでも良いようなので、 結局、慣れてる「はてなブログ」 で執筆することにしました。

これは「5日間連続投稿」の総集編*1とご理解ください。 Advent Calendar との連携の都合上、 先に公開してないといけないようなので いつもとちょっと勝手が違いますが…


僕の「5日間連続投稿」について

僕は毎年このシーズンになると 京都ノートルダム女子大学の授業「インターネット社会論」の ゲストスピーカーに呼ばれてAIの講義をしてきました。 で、今年の授業に向けて作成したデモプログラムの作成過程を 5つのトピックに分けてブログに書きました。

今、注目のオープンソース音声合成ソフト SHAREVOX の core ライブラリだけを使って、 京都検定 の問題を読み上げる CLI ベースの text-to-speach コマンドを 作成した報告です。

ちゃんと動くところまでは持っていったのですが、 読み上げてくれる「つくよみちゃん」 の声質が気に入らず、 授業での紹介は控えた…という顛末でした。 なので、今のところ未完です😀


SHAREVOX について

SHAREVOX は話題のオープンソース音声合成ソフト VOICEVOX から派生した COEIROINK に続く2番目の fork です。

たぶん、次の YouTube 動画を見てもらうのが一番早そう…*2

www.youtube.com

見た目は macOSWindows で動く ダブルクリック・アプリケーションですが、 中身はウェブ・アプリの構成になっています。

github.com

この構成は派生した COEIROINK と SHAREVOX の2つでも共通で、 僕は SHAREVOX の core を使って読み上げアプリケーションを作りました。

ちなみに…

見た目のポップさとは裏腹に、 VOICEVOXシリーズは 本格的な機械学習の技術を使って 実現されています。

shirowanisan.com

これは COEIROINK の開発者の シロワニさんのブログです。 記事数が少ないので全部目を通すのは 比較的ラクなんですが、 音声合成に関する arXiv の論文 とかを紹介したり… とか機械学習の先端研究の成果を取り入れて かなり高度なことをしていることがわかります*3

前述の、僕が記事にした core ライブラリは、 名工大OpenJTalkONNX runtime による音声合成の複合体です。 GPU を搭載していない僕の旧式の Mac Book でも 実用的なスピードで動くのには驚いてます*4


スマートスピーカーとの関わりは?

しかし kun432 氏は 音声合成ネタオンリーの僕のブログ記事をみて、 何故スマートスピーカーアドベントカレンダーに 誘ってくれたのでしょうかねぇ???

思い当たるのは…

僕を毎年授業に呼んでくれる 吉田智子先生が書いた 12月15日の僕の講義のレポート です。絵が小さいので再掲すると…

次世代AIスピーカー

これは僕が今年の講義で話した 独自研究による「近未来予想」… 平たく言えば僕のホラです😁

ひょっとして、彼は ここまでチェックしてたのかも?

もちろん、これは ただの思いつき…って訳ではなくて、 元祖チャットボットの ELIZE に備わっていた 傾聴対話機能 (厳密には ELIZA が実行するスクリプト DOCTOR の機能) をスマートスピーカーに当てはめた アイデアです*5。第1次AIブームの頃、 チャットボットは「会話を楽しむプログラム」 として(ゲーム的な)人気を博したのですが…

今世紀になったあたりから 「チャットするためのボット」 つまり(自然言語で)何かを命令できるボット との認識が広まった感が僕にはあります。 その延長上の 「音声チャットボット専用デバイス」 としてスマートスピーカーは 位置付けられたのではないでしょうか? でも、ホームユースにおいて 命令したいことってそれほど多くない。 確かに「電気を灯けて」とか 「3分間測って」といったシンプルな命令は 非常に需要は高いと思います。 が、それ以上に高度な命令って なかなか思いつきません。 最近のスマートスピーカーの先細り感の 本質的な原因はこういうところあると 僕は考えています。 やはりチャットボットの原点である 「会話を楽しむデバイス」 に立ち戻った方が良い というのが僕の意見です。

そこには「一人暮らしの高齢者」である 僕の個人的な事情も含まれています。 事実、定年退職を境に誰かと会話する機会が 急激に減りました。そういう生活を半年も 続けていると、なんだか滑舌が悪くなったり、 他の誰かの話し声が聞き取りにくくなったり… もちろん目や声に異常がある訳ではなく、 日常的に声を出して会話する機会が減ると 会話する能力が衰えていくようです。 コロナ禍の影響で同じような体験をした方も いらっしゃるんではないかと思うのですが、 僕のような高齢者の場合は特にこの能力低下が 著しいようです*6

授業では、 このような「人間に寄り添うAI」をメインテーマに、 さらに加齢による記憶力や認知能力の低下を補う 「知的義肢としてのAI」のコンセプトについて 学生諸君に話をしました。


対話してくれるのは誰か?

授業では「次世代AIスピーカー」のコンセプトや 開発目標のみを簡単に説明するに留めましたが…

この場では実現方法に関する これまでの検討について簡単に述べます。

「人間の比較的短い音声メッセージに スピーカーが音声で応答する」 従来のスマートスピーカーとは逆に、 次世代AIスピーカーの場合は 「スピーカーの比較的短い音声メッセージに 人間が音声で応答する」 ので「人間が発話するロングメッセージ」に対応する 音声認識技術に開発の重点を置かなければならないと 考えていたのです。実は夏頃までは…

が、今年の9月に OpenAI *7 が Whisper を公開しました。

openai.com

あくまでも僕個人の見立てなのですが…
ソースコードも公開されている Whisper は音声認識技術の ゲームチェンジャー*8だと僕は考えてまして、 この技術の応用事例の発表は 既に始まってますが、 今後もしばらくは続くだろうと 想像しています*9。やはり、音声認識技術に関しては Whisper の動向を しばらくウォッチしておいた方が 良さげかと考えてます*10

一方、音声合成技術の側、 つまりスピーカー側の発話に関する実装には、 僕が 「対話してくれるのは誰か?」 と呼んでいる問題があると考えてします。 1年ぶりに復活した記事 でも書いたように、僕はほぼ1年前に 「童話の読み聞かせ」 をする音声チャットボットを実装しました。 実装している最中は 「利用者は自分の発言が 正しく伝わっていることに 関心を持つだろう」と、 つまり音声認識に関心が集まるだろうと 考えていたのですが、 完成後に実際に利用した人の感想を聞くと 「iPhoneMacで声が違う」 といった音声合成へ関心を寄せる声が多かった。 僕にとってこれは意外な反応でした。

その後、理由を考えてみたのですが…

人間は聞こえてきた音が言葉のように聞こえると 「それが擬似的であろうが人工的であろうが そこに人格があると仮定し その存在が親和的であるか?敵対的であるか? あるいは信用できるか?否か?を 直感的に判断しようとするのではないか?」 と推測しました。また、この傾向は 高齢者の方が強いとも考えました*11

つまり、デバイスの使用感を支配するのは 音声合成技術ではないかと僕は考えています。

そこで、SHAREVOX core を使った音声合成機能だけの 「次世代AIスピーカー」 のデモシステムを作ることにしました。 その際、よく考えなければならないことが、 既に述べた「対話してくれるのは誰か?」 という問題です。

この問題を考える上でも SHAREVOX (および VOICEVOX から派生したオープンソース) は非常に良い示唆を与えてくれます。 VOICEVOX シリーズの音声合成ソフトウェアはいずれも、 複数のキャラクターをバンドルしています*12。僕は世代的に、 ゲームは全くやらないし、 漫画は読んでもアニメは ほとんど見ない人間なので、 大きく誤解してると思いますが、 VOICEVOX シリーズは ニコニコ動画のコミュニティから 出て来たソフトウェアで、 それ故に複数のキャラクターが バンドルされる事は 極めて自然なことなのだと想像しています。

一方、 数ある音声合成ソフトの中での VOICEVOX シリーズの特徴を考えると、 オープンソースであることと 徹底したキャラクター指向が挙げられるように思います。 特に音声チャットボットを構築する上では、 このキャラクター指向は対話をする人間の 関心と共感を獲得する上で 大きな助けになるのではないか と僕は考えています*13

SHAREVOX では4人6声のキャラクタが標準でバンドルされますが、 僕が特に注目しているのは「つくよみちゃん」です。 というのも、「つくよみちゃん」の声の主である夢前黎さんが 次の「会話テキストデータセット」も作成・配布されているからです。

tyc.rei-yumesaki.net

これは、いわゆる(言語)コーパスでして、 この「会話テキストデータセット」を利用すれば、 単純なルールベースのチャットボットであれば 比較的簡単に構築できそうです。


クリスマスでは終わらない

このように開発者には好条件が揃っているので、 僕は「次世代AIスピーカー」のデモシステムを作ることにしました。

最後にタイトルの「3月18日」について少しだけ…

実は、勧めてくれる方々がいたので、 次のコンテンテストに応募しました。

social-innovation.kyoto.jp

これは事業アイデアのコンテストなので プロトタイプやデモシステムは必須ではありませんし、 コンテスト当時は4分間のプレゼンテーションの時間しかありません。

ですが…

応募した本人でも事業アイデアは夢物語に聞こえそうな内容に思えるので 「何かエビデンスが必要だろうなぁ…」と考えてました。

還暦を迎えて、このところ自分の馬力の衰えを感じることが多かったのですが…

ここへ来て、冒頭の「5日間連続投稿」をなんとかやり切ったので、 久しぶりに3ヶ月一本勝負にチャレンジすることにしました。



若宮正子さんもCMで言ってるじゃないですか…
とにかくバッターボックスに立ってバットを振ってみろって😀

www.youtube.com

以上

*1:NHKの大河ドラマみたいな…

*2:僕は今年の夏、椎間板ヘルニアを発症しまして、 7月、8月、9月の3ヶ月を棒に振りました。

一番、ひどい時は10分間も椅子に座ってられなくて…
寝たきりでスマホを覗くしか やれることがなかったので、 たまたま見つけた動画です。

文字どおり「怪我の功名」ですね😀

*3:たぶん COEIROINK を開発しておられる期間だけ 書いておられたのかな? と想像してます。

*4:ちなみにマスターの VOICEVOX core は今、 Rust 対応を含む全面的な改修を 行なっている最中です。

github.com

Stable なバージョンをお望みの方は、 ひとつ前の 0.13.X か SHAREVOX core を使った方が良さげです。

github.com

*5:ELIZEと傾聴については 大昔にブログに書いたので参考まで…

akito-fujita.hatenablog.com

akito-fujita.hatenablog.com

実は1966年からあるアイデアなのです。

*6:対策はとにかく声を出して会話をすること。 今は毎朝同じ喫茶店に行って、 いつもの店員さんと努力して 世間話をするようにしています。 問題は多少改善したように感じてますが😀

まぁ、街中で暮らしている僕の場合は こういった対策が取れるのですが、 田舎暮らしのうちの両親の場合は 会話の少ない生活を何十年と続けて来たので、 認知症の症状が顕在化しています。

*7:11月に公開された ChatGPT が今話題になっていますよね?

openai.com

*8:純粋に技術的に ゲームチェンジャーであることは もちろんですが、 この技術がオープンソースであることも 音声に関わる既存技術の商業価値に 大きなインパクトを 与えるのではないかと思っています。

*9:例えば、こんなレクチュアなどは 既にたくさん出回っていますね。

gigazine.net

*10:Whisper が公開された今年の9月から半年後、 つまり来年の4月頃までは動向を静観するべき、 と僕自身は考えています。

*11:このように考えると、 過去のうまくいかなかった知見の 辻褄が合うようにも思えるのです

*12:VOICEVOX のキャラクタは以下。

voicevox.hiroshiba.jp

COEIROINK のキャラクタは以下。

coeiroink.com

SHAREVOX のキャラクタは以下。

キャラクター一覧 | SHAREVOX

いずれも音声合成ソフトの開発者ではない方々が 制作したキャラクタですので、 使用条件等には注意が必要なようです。

*13:スマートスピーカーのスキルを書いていた時の 実証実験での僕の数々の苦い経験から言わせてもらうと、 この種のITデバイスに対する 高齢者の心理的ハードルは 皆さんが考えている以上に高いのです。

つくよみちゃん Recitation(未完)

Tsukuyomi-chan Recitation (unfinished)


2022/12/23
藤田昭人


5日間連続投稿の5日目、最終回です。

スマホ全盛で、 帯域を湯水の如く使える今日では 全く需要がないであろう、 CLIベースの音声プログラムの解説記事に お付き合いいただき 大変ありがとうございます。

しかし書き始めたときには全く意識していなかったのですが…

このように「毎日、何か書かなければならない!!」 プレッシャーがかかると、 1980年代のハッキング・レポート風の 記事になっちゃうんですね、 僕は*1。 やっぱりこれが楽しくて プログラムを書いてたんだよなぁ。 すっかり忘れてたけど…

さてさて…

最終日なのでオチをつけなくちゃ‼︎

既に12月に入ってましたが 何とか t2s が動いたので、 当初から考えてた recitation なる プログラムの作成に取りかかりました。 1年ぶりに復活した記事 で口走った 「つくよみちゃん」 に「京都検定」の問題を読み上げてもらう… というヤツです。

でも、これは時間切れで 授業には間にあいませんでした。


京都検定の過去問

ちなみに…

京都検定京都商工会議所が 主催する検定試験ですが

www.kyotokentei.ne.jp

過去問題は試験後に京都新聞に掲載されます。

www.kyoto-np.co.jp

先日実施された第21回の3級の試験問題はこちら

www.kyoto-np.co.jp

1年ぶりに復活した記事 でも語りましたが、 昨年の「童話読み聞かせ」の実習が 学生たちにことの他ウケが良かったので、 「次なるネタ」と僕は密かに考えていたのです*2

僕のような京都在住者にとって、 「京都検定」の問題は 日常生活に密着したトピックが出題されます。 例えば、うちの近所の石薬師御門は、 僕にとって真夏の暑い日の夕暮れに 夕涼みがてらアイスを食べる場所なんですけどね。

それに音声合成のサンプルテキストとしても、 京都特有の(風変わりな読みの)地名や人名が たくさん登場するので、なかなか興味深い*3。なので「つくよみちゃん」に 「京都検定」の問題を読み上げてもらおうと考えてました。


SHAREVOX とCOEIROINK に「京都検定」の問題を読んでもらう

で、講義では VOICEVOX と SHAREVOX、 それから COEIROINK を紹介するつもりだったので、 資料を書く都合から SHAREVOX と COEIROINK に ひとつ前の第20回(令和4年夏)の 第1問の問題文と4択の回答を 読み上げてもらいました。

まずは SHAREVOX から…

次に COEIROINK にも…

いかがでしょうか? Twitter の動画ではわかりにくいかもしれませんが、 生で聞くと COEIROINK の声質のグレードが明らかに上でした。 特に4つの回答例の頭の ア、イ、ウ、エ の発音では SHAREVOX の発声は少し不快な感じがしました。

なるほど 「つくよみちゃん」の声の主である 夢前黎 さんが時折 Twitter で呟いているのは こういうことだったのか…


つくよみちゃん Recitation は…未完

実は、この問題に気がついたのは 授業の前々日ぐらいだったのです。 で、COEIROINKの「つくよみちゃん」ボイスを SHAREVOX に移植する方法でジタバタして半日。 結局、打つ手を思いつかずにタイムアップとなりました。

このジタバタのために大きくタイムロスすることになり、 Recitation のCコードを実装する時間もなくなり、 授業では SHAREVOX と COEIROINK のデモだけにしました。

くそぉ❗️❗️❗️❗️❗️❗️

…ということで、 つくよみちゃん Recitation は今のところ未完です。 問題は声質のグレードの問題だけではなく、 例えば回答例(ア)の「青龍」は「アオリュウ」 って読んじゃうんだよね。 これは SHAREVOX と COEIROINK 共通の問題で、 読みの修正自体は SHAREVOX あるいは COEIROINK でやれば良いのですが、その修正結果を 各々のプロジェクトファイルから 取り出す機能も必要かと…

それに学生諸君に実習してもらうには ウェブアプリ化も必要だし…

まだまだ先は長いなぁ… というのが今の僕の感想です。



でもね…

この作業に没頭していたときの僕は 明らかに35〜6年 若返っていたんだと思います。

そうそう、 僕はこういうことが 楽しいって思えるから プログラマーになったんだよ。 本当に忘れてたけど…

5日間付き合っていただいた 読者の皆さんには 申し訳ないオチですいません。

でも、僕はまだ諦めてませんからね。

それではお約束の…

#つくよみちゃんを利用してフォロワー増やしたい

以上

*1:確か 日本国内ではインターネットが全く普及しておらず、 WWW(World Wide Web)もちろん存在しなかった1986年頃、 それでも電子メールは使えていたし、 今日のSNSとよく似た使用感のある NetNews も存在してました。 そこでは…

ソースコードは全部送ってください。
でもデータ量を抑えるため diff などを活用して。

もちろん説明は必要です。 送った意味がなくなりますから…
でも最小限のコメントやヒントに留めてください。
くれぐれも、くだらないことを書いて データ量を増やさないよう 十分注意してください。

…といった大いに矛盾するチェックが行われていました。

日本国内では JUNET という公衆回線網 (電話線ネットワークですね) による情報インフラが存在したのです。 全く帯域制御のないネットワークですので、 こうやってデータ量を抑制しないと モデムが何時間もピーヒューとなり続けて、 ネットワーク管理者が 「来月の電話代はどれくらい請求されるんだろう?」 と青い顔をしていたのです。30年前ぐらいの話です。

そもそも…

民営化直後のNTTが 「社内の部門に電話代を請求するルールもシステムもない」 を逆手に取って…

NTTの某研究所が日本全国の主要大学に電話をかけまくることでバックボーンを維持する

…という公然の秘密の元に 成り立っていた ゲリラ的アプローチによる 無料ネットワークでしたので、 破綻の兆しは日常のそこらじゅうに 転がっていたのですが…

でも、そんな事情は全く知らない 僕のような鼻垂れ小僧プログラマーは ムキになってレポート風のヨタ話を 毎日投稿していました😀

たぶん当時 「こんな馬鹿げたことは そう長くは続けていけない」 と考えていたのは 村井さんとその周辺だけではないのかな?

*2:もっとも、実際の授業で「京都検定」の話題は出たのですが、 学生諸君の関心は今ひとつという感じでしたが…

*3:先ほどの「いしやくしごもん」を カナ漢字変換すると「石薬師五問」になりませんか?