論文:コンピュータによるコンテキストの理解
1967年に発表された Joseph Weizenbaum の ELIZA に関する2本目の論文 "Contextual Understanding by Computers" の全文および僕が機械翻訳を使って訳した(へっぽこ)翻訳です。
オリジナルは https://cse.buffalo.edu/~rapaport/572/S02/weizenbaum.eliza.1967.pdf から入手できます。ちなみにオリジナルの論文では見出しが全くありません。 (だからムッチャ読みにくい) 下記にある見出しは翻訳の際に便宜的に僕が挿入したものを残しました。 読み手によっては違和感があるかも…異論や修正についてはこの記事のコメントでお願いします。
さて…
概ね 1967 年の段階での ELIZA の開発状況の中間報告的な内容が述べられています。 が、結果的に Weizenbaum 自身が ELIZA を扱った最後の論文となりました。
特に注目するべきは表題のとおり「コンピュータによる文脈理解」に関する Weizenbaum の考察で、 「人間の間の会話と理解」と比較して論じています。 「そもそも人間の間でも絶対的な理解は不可能である」 と Weizenbaum が明快に言い切ってしまっているところが、 僕は目からウロコでした。
そのあたりを是非お楽しみください。
- Akito
JOSEPH WEIZENBAUM
Massachusetts Institute of Technology, Cambridge, Mass.
A further development of a computer program (ELIZA) capable of conversing in natural language is discussed. The importance of context to both human and machine understanding is stressed. It is argued that the adequacy of the level of understanding achieved in a particular conversation depends on the purpose of that conversation, and that absolute understanding on the part of either humans or machines is impossible.
本稿では自然言語で会話できるコンピュータープログラム(ELIZA)のさらなる開発について説明します。 人間と機械の両方の理解に対するコンテキストの重要性が強調されています。 特定の会話で達成される理解レベルの妥当性は、その会話の目的に依存し、人間または機械のいずれかの絶対的な理解は不可能であると主張されています。
はじめに
We are here concerned with the recognition of semantic patterns in text.
ここでは、テキストにおける意味パターンの認識について考察します。
I compose my sentences and paragraphs in the belief that I shall be understood -- perhaps even that what I write here will prove persuasive. For this faith to be at all meaningful, I must hypothesize at least one reader other than myself. I speak of understanding. What I must suppose is clearly that my reader will recognize patterns in these sentences and, on the basis of this recognition, be able to recreate my present thought for himself. Notice the very structure of the word "recognize," that is, know again! I also use the word "recreate." This suggests that the reader is an active participant in the two-person communication. He brings something of himself to it. His understanding is a function of that something as well as of what is written here. I will return to this point later.
私は理解されるだろうと信じて文章を書いています(たぶん、私がここに書いていることも説得力があると証明するでしょう)。 この信仰が意味のあるものにするためには、私以外の少なくとも一人の読者を仮定しなければなりません。 私は理解について話しています。 読者がこれらの文のパターンを認識し、この認識に基づいて、自分の現在の思考を自分自身で再現できることは明らかです。 「認識する」という言葉の構造に注目してください。つまり、もう一度知ってください。 「作り直す」という言葉も使用します。 これは、読者が二者間のコミュニケーションの積極的な参加者であることを示唆しています。 彼は彼自身に何かをもたらします。 彼の理解は、その何かとここに書かれていることの機能です。 後でこの点に戻ります。
Much of the motivation for the work discussed here derives from attempts to program a computer to understand what a human might say to it. Lest it be misunderstood, let me state right away that the input to the computer is in the form of typewritten messages -- certainly not human speech. This restriction has the effect of establishing a narrower channel of communication than that available to humans in face-to-face conversations. In the latter, many ideas that potentially aid understanding are communicated by gestures, intonations, pauses, and so on. All of these are unavailable to readers of telegrams -- be they computers or humans.
ここで議論された仕事の動機の多くは、人間が発言するかもしれないことを理解するためにコンピュータをプログラムする試みから派生します。 (人間の言葉ではないことは明らかですが)誤解されないように、コンピュータへの入力はタイプされたメッセージの形式であることとします。 この制限は、対面での会話で人間が利用できるものよりも狭い通信チャネルが確立する効果があります。 後者では、理解に役立つ可能性のある多くのアイデアが、ジェスチャー、イントネーション、ポーズなどによって伝えられます。 (コンピューターであれ人間であれ)これらはすべて、電報の読者には利用できません。
Further, what I wish to report here should not be confused with what is generally called content analysis. In the present situation we are concerned with the fragments of natural language that occur in conversations, not with complete texts. Consequently, we cannot rely on the texts we are analyzing to be grammatically complete or correct. Hence, no theory that depends on parsing of presumably well-formed sentences can be of much help. We must depend on heuristics and other such impure devices instead.
さらに、ここで断っておきたいことは、一般に内容分析と呼ばれるものと混同しないでください。 現在の状況では、完全なテキストではなく、会話で発生する自然言語の断片に関心があります。 その結果、分析しているテキストを文法的に完全であるか正しいと頼ることはできません。 したがって、私たちが解析している文章が文法的に完全であったり正確であったりすることに依存することができません。 代わりにヒューリスティックと他のそのような誤りのあるデバイスに私たちは依存しなければなりません。
オリジナルのELIZAについて
The first program to which I wish to call attention is a particular member of a family of programs which has come to be known as DOCTOR. The family name of these programs is ELIZA. This name was chosen because these programs, like the Eliza of Pygmalion fame, can be taught to speak increasingly well. DOCTOR causes ELIZA to respond roughly as would certain psychotherapists (Rogerians). ELIZA performs best when its human correspondent is initially instructed to "talk" to it, via the typewriter, of course, just as one would to a psychiatrist.
最初に注意を喚起したいプログラムは、DOCTORとして知られるようになったプログラム群の特定のメンバーです。 これらのプログラムのファミリーネームは ELIZA です。 この名前が選ばれた理由は、これらのプログラムが、ピグマリオンの名声のように、ますます上手に話すように教えられるからです。 DOCTORは、ある種の心理療法士(ロジャー学派)とほぼ同じように ELIZA に反応させます。 ELIZA は、精神科医と同じように(もちろんタイプライターを介して)人間の対話者が初めてに「話す」ように指示されたときに最高のパフォーマンスを発揮します。
I chose this mode of conversation because the psychiatric interview is one of the few examples of categorized dyadic natural language communication in which one of the participating pair is free to assume the pose of knowing almost nothing of the real world. If, for example, one were to tell a psychiatrist "I went for a boat ride" and he responded "Tell me about boats," one would not assume that he knew nothing about boats, but that he had some purpose in so directing the subsequent conversation. It is important to note that this assumption is one made by the speaker. Whether it is realistic or not is an altogether separate question. In any case, it has a crucial psychological utility in that it serves the speaker to maintain his sense of being heard and understood. The speaker further defends his impression (which even in real life may be illusory) by attributing to his conversational partner all sorts of background knowledge, insights and reasoning ability. But again, these are the speaker's contribution to the conversation. They manifest themselves inferentially in the interpretations he makes of the offered responses. From the purely technical programming point of view, the psychiatric interview has the advantage that it eliminates the need for storing explicit information about the real world.
私がこの会話モードを選んだのは、精神医学のインタビューが、二者間の自然言語コミュニケーションのカテゴリー化された数少ない例の1つであり、参加するペアの1人が自由に実世界のほとんど何も知らないポーズを取ることができるためです。 例えば、精神科医に「私はボートに乗りに行きました」と言ったときに「ボートについて教えてください」と返答したとしても、船のことは何も知らないとは思わず、その後の会話を誘導するために何らかの目的があるのだと思われるでしょう。 この仮定は、話し手によってなされたものであることに注意することが重要です。 それが現実的かどうかは全く別の問題です。 いずれにしても、話し手が聞いて理解されているという感覚を維持するのに役立つという点で、これにはきわめて重要な心理的効用があります。 さらに、話し手は、あらゆる種類の背景知識、洞察力、および推論能力を会話相手に帰属させることによって、(現実の生活が幻想的であっても)自分の印象を擁護します。 しかし、繰り返しますが、これらは話し手の会話への貢献です。 それらは、彼が提示された応答の解釈で推論的に現れます。 純粋に技術的なプログラミングの観点からは、精神科の面接には現実の世界に関する明確な情報を保存する必要がないという利点があります。
The human speaker will contribute much to clothe ELIZA's responses in vestments of plausibility. However, he will not defend his illusion (that he is being understood) against all odds. In human conversation a speaker will make certain (perhaps generous) assumptions about his conversational partner. As long as it remains possible to interpret the latter's responses to be consistent with those assumptions, the speaker's image of his partner remains undamaged. Responses which are difficult to so interpret may well result in an enhancement of the image of the partner, by additional rationalizations which then make more complicated interpretations of his responses reasonable. When, however, such rationalizations become too massive and even self-contradictory, the entire image may crumble and be replaced by another ("He is not, after all, as smart as I thought he was".) When the conversational partner is a machine (the distinction between machine and program is not useful here), the idea of credibility may well be substituted for that of plausibility in the above.
人間の話し手は、ELIZAの反応をもっともらしく見せるために大いに貢献するでしょう。 しかし、彼は(彼が理解されているという)彼の幻想に対してすべての可能性を擁護するわけではありません。 人間の会話では、話し手は会話相手についてある種の(おそらく寛大な)仮定をします。 相手の応答をこれらの仮定と一致するように解釈することが可能である限り、話し手相手のイメージは損なわれません。 そのように解釈することが困難な応答には、その応答のより複雑な解釈ができる追加的な合理化によって、パートナーのイメージを向上させることになります。 しかし、そのような合理化が非常に大規模になり、自己矛盾さえするようになると、イメージ全体が崩れ、別のものに置き換わる可能性があります(「結局のところ、彼は思っていたほど賢くない」)。 会話の相手が機械である場合(ここでは機械とプログラムの区別は無意味です)上記の妥当性の考えを信頼性の考えに置き換えることができます。
ELIZAのしくみ
"When in conversation with ELIZA, the user types in some statement or set of statements in natural language using normal punctuation and sentence structures, "The user's statement is terminated by a double carriage return which serves to turn control over to ELIZA. ELIZA then analyzes the user's statement and generates some response which it types out. Control is then again with the user.
ELIZAと会話するとき、ユーザーは通常の句読点と文構造を使用して自然言語でいくつかのステートメントまたはステートメントのセットを入力します。ユーザーのステートメントはELIZAに制御を渡すのに役立つ二重のキャリッジ・リターンで終了します。 その後、ELIZAはユーザーのステートメントを分析し、入力された応答を生成します。ユーザーが再び制御できるようになります。
"A typical conversation is the following:
一般的な会話は次のとおりです:
C: Men are all alike. E: IN WHAT WAY C: They're always bugging us about something or other. E: CAN YOU THINK OF A SPECIFIC EXAMPLE C: Well, my boyfriend made me come here. E: YOUR BOYFRIEND MADE YOU COME HERE C: He says I'm depressed much of the time. E: I AM SORRY TO HEAR YOU ARE DEPRESSED C: It's true. I am unhappy. E: DO YOU THINK COMING HERE WILL HELP YOU NOT TO BE UNHAPPY C: I need some help, that much seems certain. E: WHAT WOULD IT MEAN TO YOU IF YOU GOT SOME HELP C: Perhaps I could learn to get along with my mother. E: TELL ME MORE ABOUT YOUR FAMILY C: My mother takes care of me. E: WHO ELSE IN YOUR FAMILY TAKES CARE OF YOU C: My father. E: YOUR FATHER WHAT RESEMBLANCE DO YOU SEE C: You are not very aggressive but I think you donTt want me to notice that. E: WHAT MAKES YOU THINK I AM NOT VERY AGGRESSIVE C: You don't argue with me. E: WHY DO YOU THINK I DON'T ARGUE WITH YOU C: You are afraid of me. E: DOES IT PLEASE YOU TO BELIEVE I AM AFRAID OF YOU C: My father is afraid of everybody. E: WHAT ELSE COMES TO MIND WHEN YOU THINK OF YOUR FATHER C: Bullies. E: DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR BOYFRIEND MADE YOU COME HERE The capitalized lines are the machine responses. 大文字の行は、マシンからの応答です。
I described the original ELIZA program in some detail in [6]. For the present it is sufficient to recall that ELIZA's conversational powers are governed by a script. A script consists of a set of key words and key phrases each of which is associated with a set of so-called decomposition and reassembly rules. A decomposition rule is a data structure which searches a text for specified patterns, and, if such patterns are found, decomposes the text into disjoint constituents. A reassembly rule is a specification for the construction of a new text by means of recombinations of old and possible addition of new constituents. From one point of view, an ELIZA script is a program and ELIZA itself an interpreter. From another perspective, ELIZA appears as an actor who must depend on a script for his lines. The script determines the contextual framework within which ELIZA may be expected to converse plausibly.
オリジナルのELIZAプログラムについては [6] で詳しく説明しました。 現時点では、ELIZAの会話能力はスクリプトによって管理されていることを思い出せれば十分です。 スクリプトは、キーワードとキーフレーズのセットで構成され、各キーフレーズは、いわゆる分解ルールと再構成ルールのセットに関連付けられます。 分解ルールは、テキストから特定のパターンを検索し、そのようなパターンが見つかった場合には、テキストを別々の構成要素に分解するデータ構造です。 再構成ルールとは、古い構成要素と新しい構成要素の可能な追加を再結合することによって新しいテキストを構成するための仕様です。 ある観点からみると、ELIZAスクリプトはプログラムであり、ELIZA自体はインタープリターです。 別の見方をすれば、ELIZAは台本に頼らなければならない俳優として登場します。 スクリプトは、ELIZAが適切に会話すると予想されるコンテキストのフレームワークを決定します。
"The gross procedure of the program is quite simple; the text is read and inspected for the presence of a key word. If such a word is found, the sentence is transformed according to a rule associated with the key word; if not, a content-free remark or, under certain conditions, an earlier transformation is retrieved. A rule cycling mechanism delays repetition of responses to identical keys as long as possible. The text so computed or retrieved is then printed out."
「プログラムの大まかな手順は非常に単純です。 テキストが読み取られ、キーワードの有無が検査されます。 そのような単語が見つかった場合、そのキーワードに関連付けられた規則に従って文が変換されます。 そうでない場合は、内容のない注釈、または特定の条件の下で、以前の変換が検索されます。 ルール循環メカニズムは、可能な限り同一のキーに対する応答の繰り返しを遅らせます。 このようにして計算または取得されたテキストが出力されます。」
対話フレームワークとしてのELIZA
One of the principle aims of the DOCTOR program is to keep the conversation going -- even at the price of having to conceal any misunderstandings on its own part. We shall see how more ambitious objectives are realized subsequently. In the meanwhile, the above discussion already provides a framework within which a number of useful points may be illuminated.
DOCTORプログラムの主な目的の1つは(誤解を隠すという代償を払ってでも)会話を続けることです。 その後、私たちはもっと野心的な目標がどのように実現されるかを確認できるでしょう。 一方で、上記の議論は既に多くの有用な点があるフレームワークであることを明らかにしています。
By far the most important of these relates to the crucial role context plays in all conversations. The subject who is about to engage in his first conversation with the DOCTOR is told to put himself in a role-playing frame of mind. He is to imagine that he has some problem of the kind one might normally discuss with a psychiatrist, to pretend he is actually conversing with a psychiatrist, and under no circumstances to deviate from that role. While some of the responses produced by the program are not very spectacular even when the subject follows his instructions, it is remarkable how quickly they deteriorate when he leaves his role. In this respect, the program mirrors life. Real two-person conversations also degenerate when the contextual assumptions one participant is making with respect to his partner's statements cease to be valid. This phenomenon is, for example, the basis on which many comedies of error are built.
これらの中で最も重要なのは、すべての会話においてコンテキストが果たす重要な役割です。 DOCTOR との最初の会話をしようとしている被験者は、ロールプレイングの中に身を置くように言われます。 彼は、精神科医と実際に会話しているふりをするために、精神科医と通常話し合うかもしれない種類の問題を抱えていることを想像します。 このプログラムの反応の中には、被験者が指示に従っていてもそれほど目を見張るものはないものもありますが、 彼がその役割から外れると、その反応がいかに急速に悪化するかは注目に値します。 この点で、プログラムは実生活を反映しています。 実際の2人の会話は、一方の参加者がパートナーの発言に関して行っている文脈上の仮定が無効になった場合にも悪化します。 この現象は、例えば、多くの喜劇的な失敗が作られる基礎になります。
会話の構造
These remarks are about the global context in which the conversation takes place. No understanding is possible in the absence of an established global context. To be sure, strangers do meet, converse, and immediately understand one another (or at least believe they do). But they operate in a shared culture -- provided partially by the very language they speak -- and, under any but the most trivial circumstances, engage in a kind of hunting behavior which has as its object the creation of a contextual framework. Conversation flows smoothly only after these preliminaries are completed. The situation is no different with respect to visual pattern recognition -- a visual pattern may appear utterly senseless until a context within which it may be recognized (known again, i.e., understood) is provided. Very often, of course, a solitary observer arrives at an appropriate context by forming and testing a number of hypotheses. He may later discover that the pattern he "recognized" was not the one he was intended to "see," i.e., that he hypothesized the "wrong" context. He may see the "correct" pattern when given the "correct" context. It doesn't mean much to say that the pattern "is" such and such. We might, for example, find a string of Chinese characters beautiful as long as we don't know what they spell. This, an apparent impoverishment, i.e., really a broadening, of context will enhance the esthetic appeal of a pattern. Similarly, many people think anything said in French is charming and romantic precisely because they don't understand the language.
ここから気付くことは、会話が行われるグローバルなコンテキストに関するものです。 確立されたグローバルな文脈がなければ、理解は不可能です。 確かに、知らない人は会ったり会話したりして、すぐにお互いを理解します(少なくとも信用します)。 しかし、彼らは共通の文化の中で活動しており(その一部は彼らが話す言語によって提供されています)、どんな些細な状況でも、文脈的な枠組みの創造を目的とした一種のハンティングの行動に関与しています。 これらの準備が完了して初めて、会話がスムーズに進みます。 視覚パターンの認識に関しても状況は同じで、認識できるコンテキスト(既知の、すなわち理解されている)が提供されるまで、視覚パターンはまったく無意味に見えることがあります。 後になって、彼は「認識した」パターンが彼が意図した「確認した」パターンではないこと、すなわち彼が「間違った」文脈を仮定したことを発見するかもしれません。 パターン "is" は「カクカクしかじかだ」などと言っても大した意味はありません。 たとえば、何を綴っているのかわからなければ、きれいな漢字の文字列が見つかるだけかもしれません。 これはパターンの美的魅力を高めますが、明らかな貧困化、すなわち実際にはコンテキストの拡大解釈です。 同様に、フランス語で何を言っても、それが魅力的でロマンチックだと思っている人が多いでしょう。 それは、フランス語を理解していないからです。
会話ツリー
In real conversations, global context assigns meaning to what is being said in only the most general way. The conversation proceeds by establishing sub-contexts, sub-sub-contexts within these, and so on. It generates and, so to speak, traverses a contextual tree. Beginning with the topmost or initial node, a new node representing a sub-context is generated, and from this one a new node still, and so on to many levels. Occasionally the currently regnant node is abandoned -- i.e., the conversation ascends to a previously established node, perhaps skipping many intermediate ones in the process. New branches are established and old ones abandoned. It is my conjecture that an analysis of the pattern traced by a given conversation through such a directed graph may yield a measure of what one might call the consequential richness of the conversation. Cocktail party chatter, for example, has a rather straight line character. Context is constantly being changed -- there is considerable chaining of nodes -- but there is hardly any reversal of direction along already established structure. The conversation is inconsequential in that nothing being said has any effect on any questions raised on a higher level. Contrast this with a discussion between, say, two physicists trying to come to understand the results of some experiment. Their conversation tree would be not only deep but broad as well, i.e., they would ascend to an earlier contextual level in order to generate new nodes from there. The signal that their conversation terminated successfully might well be that they ascended (back to) the original node, i.e., that they are again talking about what they started to discuss.
実際の会話では、グローバルコンテキストは、最も一般的な方法でのみ発言に意味を当てはめます。 会話は、サブコンテキスト、サブコンテキスト内のサブ・サブ・コンテキストなどを確立することにより進行します。 (その結果)コンテキストツリーを生成し、いわばトラバースします。 最上位のノードまたは最初のノードから始めて、サブコンテキストを表す新しいノードが生成され、このノードから多くのレベルに新しいノードが作成されます。 時々、現在の状態のノードが放棄されることがあります。 すなわち、会話は以前に確立されたノードへと進み、おそらくプロセス中の多くの中間ノードをスキップします。 新しいブランチが確立され、古いブランチは放棄されます。 私の推測では、このような有向グラフを使って、ある会話によって追跡されたパターンを分析することで、その会話の結果としての豊かさを測る尺度が得られるかもしれません。 例えば、カクテルパーティーのおしゃべりは直線的な傾向があります。 コンテキストは絶えず変更されています(ノードにはかなりの連鎖があります)が、すでに確立された構造に沿った方向の逆転はほとんどありません。 会話は、何も言われても、より高いレベルで提起された質問に影響を与えないという点で重要ではありません。 これを、たとえば、ある実験の結果を理解しようとする2人の物理学者間の議論と比較してみましょう。 彼らの会話ツリーは、深いだけでなく広いものになります。つまり、そこから新しいノードを生成するために、以前のコンテキストレベルに上昇します。 会話が正常に終了したというシグナルは、元のノードに戻った(元に戻った)こと、つまり、(最初に)話し始めた内容について再び話していることです。
会話ツリーとアベルソンの信念構造
For an individual the analog of a conversation tree is what the social psychologist Abelson calls a belief structure. In some areas of the individual's intellectual life, this structure may be highly logically organized -- at least up to a point; for example, in the area of his own profession. In more emotionally loaded areas, the structure may be very loosely organized and even contain many contradictions. When a person enters a conversation he brings his belief structures with him as a kind of agenda.
個々の会話ツリーに類似するものは、社会心理学者のアベルソンが信念構造と呼ぶものです。 個人の知的生活の一部の領域では、この構造は非常に論理的に組織化されている場合があります(少なくともある程度まで、たとえば、彼自身の職業の分野では)。 より感情的に負荷の高い領域では、構造が非常に緩やかに編成され、多くの矛盾が含まれることもあります。 人が会話に入ると、彼は信念構造を一種の議題として持ち込みます。
A person's belief structure is a product of his entire life experience. All people have some common formative experiences, e.g., they were all born of mothers. There is consequently some basis of understanding between any two humans simply because they are human. But, even humans living in the same culture will have difficulty in understanding one another where their respective lives differed radically. Since, in the last analysis, each of our lives is unique, there is a limit to what we can bring another person to understand. There is an ultimate privacy about each of us that absolutely precludes full communication of any of our ideas to the universe outside ourselves and which thus isolates each one of us from every other noetic object in the world.
人の信念の構造は、その人の生涯にわたる経験の産物です。 すべての人々は共通の成長の経験を持っています。 例えば、皆、母親から生まれました。 したがって、2人の人間の間には、人間だからという理由だけで、何らかの理解の基礎があります。 しかし、同じ文化の中で生きている人間であっても、それぞれの生活が根本的に異なるところでは、互いを理解するのは難しいものです。 最新の分析では、私たちの人生はそれぞれ独特なものなので、他人に理解してもらうには限界があります。 私たち一人一人には究極のプライバシーがあり、私たちの考えを自分たちの外の宇宙に完全に伝達することを完全に妨げ、それによって私たち一人一人を世界の他のすべての宗教的対象から隔離しているのです。
There can be no total understanding and no absolutely reliable test of understanding.
完全な理解はあり得ないし、完全に信頼できる理解のテストもありません。
To know with certainty that a person understood what has been said to him is to perceive his entire belief structure and that is equivalent to sharing his entire life experience. It is precisely barriers of this kind that artists, especially poets, struggle against.
自分に対する他者の発言を理解したことを確実に知ることは、その人の信念の構造全体を理解することであり、それは彼の人生経験全体を共有することに等しいでしょう。 芸術家、特に詩人が戦うのは、まさにこの種の障壁です。
機械が「理解」するということ
This issue must be confronted if there is to be any agreement as to what machine "understanding" might mean. What the above argument is intended to make clear is that it is too much to insist that a machine understands a sentence (or a symphony or a poem) only if that sentence invokes the same imagery in the machine as was present in the speaker of the sentence at the time he uttered it. For by that criterion no human understands any other human. Yet, we agree that humans do understand one another to within acceptable tolerances. The operative word is "acceptable" for it implies purpose. When, therefore, we speak of a machine understanding, we must mean understanding as limited by some objective. He who asserts that there are certain ideas no machines will ever understand can mean at most that the machine will not understand these ideas tolerably well because they relate to objectives that are, in his judgement, inappropriate with respect to machines. Of course, the machine can still deal with such ideas symbolically, i.e., in ways which are reflections -- however pale -- of the ways organisms for which such objectives are appropriate deal with them. In such eases the machine is no more handicapped than I am, being a man, in trying to understand, say, female jealousy.
機械の「理解」が何を意味するかについて合意がある場合、この問題に対処する必要があります。 上記の議論が明らかにしようとしているのは、その文が発声した時点でその文の話者に存在していたものと同じイメージをその機械が呼び出す場合にのみ、その機械が文章(あるいはシンフォニーや詩)を理解すると主張するのは言い過ぎであるということです。 というのは、この基準では人間も他の人間を理解していないからです。 しかし、人間は許容範囲内で互いを理解しているということには同意します。 最適な言葉で表現すると、それが意味ある目的に達するために「許容できる」というものです。 したがって、機械的理解とは、ある目的によって制限された理解を意味しなければならないのです。 「機械には理解できないアイデアがある」と主張する人物は、せいぜい、機械に関してこれらのアイデアが、その人物の判断では不適切である目標に関連しているため、機械がこれらのアイデアを許容できるほど(そのアイデアを)よく理解していないことを意味します。 もちろん、機械はこのような考えを象徴的に扱うことができます。 すなわち、たとえそのような目的が適切であっても、生物がその考えをどのように扱っているかを(たとえどんなに青ざめるものであっても)反映しているのです。 このように緩めて考えると、機械は私と同じように、男性であること、たとえば女性の嫉妬を理解しようとすることにおいて、障害を持つことはありません。
A two-person conversation may be said to click along as long as both participants keep discovering (in the sense of uncovering) identical nodes in their respective belief structures. Under such circumstances the conversation tree is merely a set of linearly connected nodes corresponding to the commonly held parts of the participants' belief structures. If such a conversation is interesting to either participant, it is probably because the part of the belief structure being made explicit has not been consciously verbalized before, or has never before been attached to the higher level node to which it is then coupled in that conversation, i.e., seen in that context, or because of the implicit support it is getting by being found to coexist in someone else.
二人の参加者がそれぞれの信念構造の中で同一のノードを(何かを明らかにするという意味で)発見し続ける限り、二人の会話は意気投合すると言えるでしょう。 このような状況下では、会話ツリーは、参加者の信念構造の共通に保持される部分に対応する線形に接続されたノードの集合にすぎません。 もしそのような会話がどちらかの参加者にとって興味があるならば、それはおそらく、明らかにされている信念構造の一部が、それまで意識的に言葉にされたことがなかったか、あるいはその会話の中でそれが結合される上位レベルのノードに結び付けられたことがなかったからでしょう。 つまり、その文脈の中で見られるか、あるいは他者と共存することによって得られる暗黙のサポートのためです。
Backtracking over the conversation tree takes place when a new context is introduced and an attempt is made to integrate it into the ongoing conversation, or when a new connection between the present and a previous context is suggested. In either case, there is a need to reorganize the conversation tree. Clearly the kind of psychotherapist initiated by the DOCTOR program restricts himself to pointing out new connectivity opportunities to his patients. I suppose his hope is that any reorganization of the conversation tree generated in the therapy session will ultimately reflect itself in corresponding modifications of his patients' belief structures.
会話ツリーのバックトラックは、新しいコンテキストが導入され、それを進行中の会話に統合しようとするとき、または現在のコンテキストと以前のコンテキストの間の新しい接続が提案されるときに行われます。 いずれの場合も、会話ツリーを再編成する必要があります。 DOCTORプログラムによって起動されるセラピストのたぐいは、明らかに患者に新たな繋がりの機会を指摘することに限定されています。 私が思うに、治療セッションで生み出された会話の系統樹の再編成が、最終的には患者の信念構造の対応する修正に反映されることが彼の望みでしょう。
ELIZA による会話構造の再現
I now turn back to the program reproduced earlier. I hope the reader found the conversation quoted there to be smooth and natural. If he did, he has gone a long way toward verifying what I said earlier about the investment a human will make in a conversation. Any continuity the reader may have perceived in that dialogue -- excepting only the last machine response -- is entirely illusionary. A careful analysis will reveal that each machine response is a response to the just previous subject input. Again with the exception of the last sentence, the above quoted conversation has no sub-contextual structure at all. Nor does the description of the program given in [6] give any clues as to how sub-contexts might be recognized or established or maintained by the machine.
ここで以前、再現したプログラムに戻ります。 そこで引用された会話がスムーズで自然なものであることを読者が理解してくれることを願っています。 もしそうなら、彼は人間が会話で行う投資について私が先に言ったことを検証するのに長い道のりを歩んできまたことになります。 読者がその対話で知覚した連続性は(最後のマシンの応答を除いて)すべて完全に幻想です。 注意深く分析をすれば、機械の各々の応答が直前の主題の入力に対する応答であることを明らかです。 繰り返しになりますが、最後の文を除いて、上に引用した会話にはサブコンテキスト構造がまったくありません。 また、 [6] で与えられたプログラムの記述は、マシンによってサブコンテキストがどのように認識され、確立され、維持されるかについてのいかなる手掛かりも与えません。
To get at the sub-context issue, I want to restate the overall strategy in terms somewhat different from those used above. We may think of the ELIZA script as establishing the global context in which subsequent conversations will be played out. The DOCTOR script establishes the Rogerian psychiatric context. The key word listings are guesses about what significant words might appear in the subject's utterances. The appearance of any of these words in an actual input tentatively directs the system's attention to decomposition rules associated with the identified word. These rules are hypotheses about what an input containing such words might mean. An important property of the system is that just as the entire set of key words need not be searched in the analysis of every input sentence, neither does the whole list of hypotheses about what any input might mean have to be tested in order to generate a response to a specific sentence. Should the set of hypotheses associated with the currently regnant key word be exhausted without success, there is a way (although not here described) to go to decomposition rules associated with lower ranking key words that may have appeared in the input string.
サブコンテキストの問題を理解するために、私は全体的な戦略を、上で使用したものとは少し異なる用語で再度述べたいと思います。 ELIZAスクリプトは、後続の会話が行われるグローバルコンテキストを確立するものと考えることができます。 DOCTORスクリプトは、ロジャー学派の精神医学的な背景を確立します。 キーワードの一覧は、被験者の発話にどのような重要な単語が現れるかについての推測です。 実際の入力にこれらの単語のいずれかが現れると、一時的に識別された単語に関連付けられた分解ルールにシステムの注意が向けられます。 これらのルールは、そのような単語を含む入力が意味することについての仮説です。 このシステムの重要な特性は、すべての入力文の分析においてキーワードの集合全体を検索する必要がないのと同様に、特定の文に対する応答を生成するために、入力が何を意味するかについての仮説のリスト全体をテストする必要もないということです。 現在の優勢なキーワードに関連付けられた仮説のセットが成功せずに使い果たされた場合、(ここでは説明しませんが)入力文字列に現れる可能性のある下位ランクのキーワードに関連付けられた分解ルールに進む方法があります。
Much is known about an input sentence once it matches a decomposition rule. If, for example, the rule
(O MY (/FAMILY) DRINKS O)
matches a sentence, then we know that the subject matter is a family member, and that this person drinks. (The notation "(/A B C)" means that in that position a word "tagged" with any of the symbols A or B or C is looked for. Words are tagged as part of the script. This mechanism is not further discussed here.) A reassembly rule can subsequently identify the family member in question, e.g.,father. The successful matching of a decomposition rule -- hence, the verification of a hypothesis -- is therefore an opportunity not only to generate a plausible response but also to establish a sub-contextual node. The laying down of such a node does not mean merely remembering what is now being talked about, but what is more important, making hypotheses about what is likely to be said next within the new contextual framework.
入力文が分解ルールに一致することがよく知られています。 たとえば、次のルールが文章とマッチすれば
(O MY (/FAMILY) DRINKS O)
その主題が家族の一員であり、その人が酒を飲むことがわかります。 ("(/A B C)" という表記は、その位置で、記号A、B、またはCのいずれかを持つ「タグ付き」の単語が検索されることを意味します。 単語はスクリプトの一部としてタグ付けされます。 このメカニズムについて、ここでは詳しく説明しません)。 後に、再組立ルールは問題の家族、例えば父親を同定できます。 したがって、分解ルールのマッチング、つまり仮説の検証は、もっともらしい応答を生成するだけでなく、サブコンテキストのノードを確立する機会でもあります。 そのようなノードの設定は、現在話していることを単に覚えていることを意味するのではなく、新しいコンテキストフレームワーク内で次に発話される可能性のあることについて仮説を立てて、より重要なことを覚えています。
The realization of such a mechanism in an ELIZA script involves attaching a substructure to decomposition rules which says, in effect, that if a so modified decomposition rule matches an input sentence and a suitable sub-context exists, then control is transferred to a set of decomposition and reassembly rules appropriate to that sub-context. The details of mechanization are not important here. I will, however, show its effect by exhibiting the following conversational fragment from the DOCTOR program:
-------------------------------------------------------------------------------- C: Because you are so stubborn. E: IS THAT THE REAL REASON C: Maybe E: WHAT IS A BETTER REASON THEN C: My stomach hurts. E: TELL ME ABOUT YOUR PAINS IN GENERAL C: My head bothers me, too. E: YOU SEE SOME PSYCHOLOGICAL REASON WHY YOUR HEAD SHOULD PAIN YOU C: Maybe. E: YOU THINK COMING HERE MIGHT HELP ALLEVIATE YOUR HEAD PAIN C: Certainly. E: LET'S TALK ABOUT YOUR FEELINGS WHEN YOU THINK OF YOUR HEAD AND ITS PAINS -------------------------------------------------------------------------------- We are here in the middle of a dialog. The first sentence is an input to the program, the next a machine response, and so on in alternation.
The word "because" was the key that triggered the first machine response. At the same time the reason sub-context, so to speak, was established. Notice that the next subject input, i.e., the word "maybe", was interpreted as meaning "no," as is appropriate in that particular context, and that a contextually correct machine response was produced. The next input serves to establish a "hurt" sub-context. I believe the conversation is self-explanatory from that point on. Notice, however, that in the new sub-context the word "maybe" which was earlier interpreted to mean "no" is now seen as meaning "yes." Under still other circumstances it would be understood as indicating uncertainty.
ELIZAスクリプトでこのようなメカニズムを実現するには、分解ルールにサブコンテキストを添付する必要があります。実際には、そのように修正された分解ルールが入力文と一致し、適切なサブコンテキストが存在する場合、制御はそのサブコンテキストに適した一連の分解および再構築ルールに転送されます。 機械化の詳細はここでは重要ではないですが、DOCTORプログラムからの以下の会話の断片を示すことによって、その効果を示すことにします。
-------------------------------------------------------------------------------- C: なぜなら、あなたはとても頑固だから。 E: それが本当の理由なのですか? C: たぶん E: その方が良い理由は何ですか? C: お腹が痛い E: 痛み全般について教えてください。 C: 頭も痛い E: 頭が痛くなる心理学的な理由があるのですか? C: たぶんね E: ここに来れば頭の痛みが和らぐかも C: そのとおり E: 頭とその痛みを考えたときの気持ちを話しましょう。 -------------------------------------------------------------------------------- 対話中は、 最初の文はプログラムへの入力、次の文はマシンの応答、以下同様に交互に続きます。
"because" という言葉が、最初のマシンの応答の引き金となりました。 同時に、いわば、理由のサブコンテキストが確立されました。 次のサブジェクト入力、すなわち、単語 "maybe" は、その特定の文脈において適切であるように、"no," を意味するものとして解釈され、文脈的に正しい機械応答が生成されたことに注目してください。 次の入力は、"hurt" サブコンテキストを確立する役割を果たします。 私はその会話がその時点から自明だと信じてます。 しかし、新しいサブコンテキストでは、以前は "no" を意味すると解釈されていた単語 "maybe" が、現在では "yes" を意味すると解釈されていることに注意してください。 さらに他の状況では、不確実性を示すと理解されるでしょう。
My secretary watched me work on this program over a long period of time. One day she asked to be permitted to talk with the system. Of course, she knew she was talking to a machine. Yet, after I watched her type in a few sentences she turned to me and said "Would you mind leaving the room, please?" I believe this anecdote testifies to the success with which the program maintains the illusion of understanding. However, it does so, as I've already said, at the price of concealing its own misunderstandings. We all do this now and then, perhaps in the service of politeness or for other reasons. But we cannot afford to elevate this occasional tactic to a universal strategy. Thus, while the DOCTOR program may be useful as an instrument for the analysis of two-person conversations, and while it is certainly fun, its aim must be changed from that of concealment of misunderstanding to its explication.
私の秘書は私が長い間このプログラムに取り組んでいるのを見ました。 ある日、彼女はシステムと話せるように頼んできました。 もちろん、彼女は機械と話していることを知っていました。 それでも、私は彼女のタイプを数文で見た後、彼女は私に向き直り「部屋を出てくれませんか?」と言いました。 この逸話は、プログラムが理解しているという幻想を維持することに成功していることを証明していると思います。 ただし、既に述べたように、誤解を隠すという代価を払ってそうしているのです。 私たちは皆、時折、丁寧さやその他の理由でこれを行います。 しかし、この時折の戦術を普遍的な戦略に引き上げることはできません。 したがって、DOCTORプログラムは二人の会話を分析するための手段として有用である可能性がありますし、それは確かに楽しいものですが、その目的は誤解の隠蔽からその説明に変更する必要があります。
新しいELIZAについて
Another difficulty with the system currently under discussion is that it can do very little other than generate plausible responses. To be sure, there are facilities for keeping and testing various tallies as well as other such relatively primitive devices, but the system can do no generalized computation in either the logical or numerical sense. In order to meet this and other deficiencies of the original ELIZA system, I wrote a new program, also called ELIZA, which has now replaced its ancestor.
現在議論中のシステムのもう1つの難点は、もっともらしい応答を生成する以外にほとんど何もできないことです。 確かに、さまざまな集計やその他の比較的原始的なデバイスを保持・テストする機能がありますが、システムは論理的にも数値的にも一般化された計算を行うことはできません。 オリジナルの ELIZA システムのこの欠陥やその他の欠陥に対処するために、ELISAと呼ぶ新しいプログラムを作成しました。 このプログラムは現在、元のプログラムに取って代わられています。
The ELIZA differs from the old one in two main respects. First, it contains an evaluator capable of accepting expressions (programs) of unlimited complexity and evaluating (executing) them. It is, of course, also capable of storing the results of such evaluations for subsequent retrieval and use. Secondly, the idea of the script has been generalized so that now it is possible for the program to contain three different scripts simultaneously and to fetch new scripts from among an unlimited supply stored on a disk storage unit, intercommunication among coexisting scripts is also possible.
ELIZAは主に2つの点で古いものと異なります。 まず、無限の複雑さの数式(プログラム)を受け入れ、それらを評価(実行)することができる評価器が含まれています。 もちろん、その後の検索と使用のために、このような評価結果を保存することもできます。 次に、スクリプトの概念が一般化されたため、プログラムに3つの異なるスクリプトを同時に含めることができ、ディスク・ストレージ・ユニットに格納されている無制限の供給から新しいスクリプトをフェッチできるようになり、共存するスクリプト間の相互通信も可能になりました。
スクリプトの階層化
The major reason for wishing to have several scripts available in the core (i.e., high speed) memory of the computer derives from the arguments about contexts I made above. The script defines, so to speak, a global context within which all of the subsegment conversation is to be understood. We have seen that it is possible for a single script to establish and maintain sub-contexts. But what is a sub-context from one point of view is a major (not to say global) one as seen from another perspective. For example, a conversation may have as its overall framework the health of one of the participants but spend much time under the heading of stomach disorders and headache remedies.
(高速な)コンピューターのコアメモリでいくつかのスクリプトを使用できるようにしたい主な理由は、上記で作成したコンテキストに関する引数に由来します。 スクリプトは、いわば、すべてのサブセグメントの会話が理解されるグローバル・コンテキストを定義します。 単一のスクリプトでサブ・コンテキストを確立し維持することが可能であることがわかりました。 しかし、ある観点から見るとサブ・コンテキストとは、別の観点から見た場合の主要な(グローバルとは言えない)サブ・コンテキストです。 たとえば、会話の全体的なフレームワークとして、ある参加者の健康状態ではありますが、胃の病気や頭痛の治療の見出しの下で多くの時間を費やすことがあります。
In principle one large, monolithic ELIZA script could deal with this. However, such a script would be very long and extremely difficult to modify and maintain. Besides, long exposure to computer programming should at least instill a healthy respect for subroutines, their power and utility. In the new ELIZA system scripts are in fact very much like subroutines. One script plays the role of the so-called "main program," i.e., it is the one far calling in and replacing subscripts. This is the one which, in an important sense, governs the computer's role in the conversation. Such a script may, for example, play the role of an initial interviewer in a hospital, i.e., a person who knows just enough about the field of medicine and the organization of the hospital to be able to determine, by means of appropriate questions, to whom the incoming patient is to be directed. A more highly specialized script then plays the role of that person. It may call on still further levels of scripts -- and each script, except for the "main" one, can return the issue up one or more levels with information "explaining" that action.
原則として、1つの大きな一体型のELIZAスクリプトでこれを処理できます。 しかし、このようなスクリプトは非常に長く、変更や保守が非常に困難です。 また、コンピュータープログラミングに長時間さらされると、少なくともサブルーチンの、そのパワーと利便性が健全に尊重されるようになります。 新しいELIZAシステムでは、スクリプトは実際にはサブルーチンに非常によく似ています。 1つのスクリプトは、いわゆる「メインプログラム」の役割を果たします。つまり、サブスクリプトを呼び出して置き換えるスクリプトです。 これは、本来の意味で、会話におけるコンピュータの役割を管理するものです。 このようなスクリプトは、たとえば、病院の最初のインタビュア、つまり、適切な質問によって、医療の分野と病院の組織について十分に知っている人が、入ってくる患者が誰に向けられるか?といった役割を果たします。 次に、より高度に専門化されたスクリプトがその人物(専門家)の役割を果たします。 さらにレベルの高いスクリプトを呼び出す場合があります。「メイン」スクリプトを除く各スクリプトは、そのアクションを「説明」する情報とともに1つ以上のレベルに問題を返すことができます。
We saw earlier how the word "maybe" was differentially interpreted in what might be called different micro contexts. The hierarchy of scripts now under discussion makes much more nearly global contextual distinctions possible. For example, the word "tone" probably means muscle tone to the internist but audio tone to the ear specialist. The occurrence of that word as a key word would establish an entirely different contextual mode, or call in a different sub-script, depending on whether it was identified in an internist or an ear specialist script.
私たちは以前 "maybe" という言葉が、異なるマイクロ・コンテキストと呼ばれるものでどのように区別して解釈されるかを見てきました。 現在議論中のスクリプトの階層構造により、よりグローバルに近いコンテキストの区別が可能になります。 たとえば、"tone" という言葉は、おそらく内科医には筋肉の調子を意味しますが、耳の専門家には音調を意味します。 その単語がキーワードとして出現すると、完全に異なるコンテキストモードが確立されるか、内科医または耳鼻科医のスクリプトで識別されたかどうかに応じて、異なるサブスクリプトが呼び出されます。
Of course, another important advantage of this kind of subscripting is that scripts (sub or otherwise) can presumably be written by specialists in a very narrow field. The fact that scripts now tend to be rather short means that a specialist might actually find the time to produce one as part of a larger cooperative effort.
もちろん、この種のサブスクリプトのもう1つの重要な利点は、非常に狭い分野の専門家がスクリプト(サブまたはその他)を作成できることです。 現在、スクリプトがかなり短くなる傾向があるということは、専門家が実際に大きな共同作業の一環としてスクリプトを作成する時間を見つけられることを意味します。
数式評価器の導入
The conversations reproduced below were governed by a script in the new ELIZA system. This script was designed to illustrate the power of the evaluator to which ELIZA has access. The key word and other such mechanisms are not very different from those described above. The important departure is that expressions can be turned over to the evaluator, evaluated, and the results displayed and stored.
以下に再現された会話は、新しいELIZAシステムのスクリプトによって管理されています。 このスクリプトは、ELIZAがアクセスできる評価器の力を示すために設計されました。 キーワードおよびその他の類似のメカニズムは、上記のメカニズムとそれほど変わりません。 重要な違いは、式を評価器に引き渡し、評価し、結果を表示および保存できることです。
-------------------------------------------------------------------------------- C: The area of a circle is pi times the radius of the circle squared. C: The area of a sphere is pi times the diameter of the sphere squared. C: The area of a square is the side of the square squared. C: The diameter of an object is twice the radius of the object. C: The radius of a ball is 10. C: What is the area oi the ball. E: THE ASSUMPTION THAT BALL IS CIRCLE IS CONSISTENT -- SHALL I GO ON? no E: THE ASSUMPTION THAT BALL IS SPHERE AND OBJECT IS CONSISTENT -- SHALL I GO ON? yes E: IT'S 1256.6359 C: What is the diameter of the ball. E: IT'S 20 C: The radius of a dish is 10. C: What's the area of the dish. E: THE ASSUMPTION THAT DISH IS CIRCLE IS CONSISTENT -- SHALL I GO ON? yes E: IT'S 314.15899 C: The radius of a globe is 10. C: A globe is a sphere. A sphere is an object. C: What is the area of the globe. E: IT'S 1256.6359 C: The side of a plate is 10. C: What is the area of the plate. E: THE ASSUMPTION THAT PLATE IS SQUARE IS CONSISTENT -- SHALL I GO ON? yes E: IT'S 100 C: When I say board I mean plate. C: What is 3 times the side of the board. E: It's 30. C: Please call that x. C: Let f(z) be z squared minus z. C: Compute f(x). E: It's 870. C: When I say ich sage I mean I say. C: When ich sage meine ich I mean I mean. C: When ich sage wieviel ist meine ich what is. C: When ich sage quadrat meine ich squared. C: Nun, sagen sie mir bitte, wieviel is x quadrat. E: I DIDN'T UNDERSTAND YOU. C: Ja, tut mir leid, ich sollte fragen wieviel IST x quadrat. E: IT'S 900. C: Thank you. E: YOU'RE QUITE WELCOME, COME AGAIN --------------------------------------------------------------------------------
The particular example shown here is one in which the system is asked not merely to entertain but to perform some useful service. The script is one which establishes a context in which a few terms can be interpreted as giving directions about the evaluation of certain expressions. The number of keys which actually lead to decomposition rules is very small. They are as follows:
ここに示されている特定の例は、単に楽しませるだけでなく、何らかの有用なサービスを実行するようにシステムに求められるものです。 このスクリプトは、特定の表現の評価に関する指示を与えるものとしていくつかの用語を解釈できるコンテキストを確立するものです。 実際に分解規則につながるキーの数は非常に少なく、 次のとおりです。
I mean Is (* a an) Of (* a an the) What (* the is) Where Call Let Define Compute Also Thanks
(A key of the form "Is ( a an)" will match either "Is a" or "Is an".) In addition, there are 1/substitution keys like "Twice = 2". The effect of that particular one is to substitute the symbols "2*" whenever the word "twice" appeared in the input text. Of course, the evaluator sitting behind ELIZA, so to speak, recognizes words like "SQRT", "LOG", etc. The function of this script is to interpret the user's wishes with respect to the evaluation of expression, perform certain translation functions on these expressions, and control the traffic between the input/output system of ELIZA and that of the evaluator.
("Is ( a an)" という形式のキーは、"Is a" または "Is an" のいずれかに一致します) さらに "Twice = 2" のような 1/substitution があります。 その結果、入力テキストに単語「twice」が現れるたびに記号 "2*" を置き換えることができます。 もちろん、ELIZA の背後にある評価器は、いわば "SQRT" や "LOG" などの単語を認識します。 このスクリプトの機能は、表現の評価に関するユーザーの要望を解釈し、これらの表現に対して特定の翻訳機能を実行し、ELIZAの入出力システムと評価器の入出力システム間のトラフィックを制御することです。
Consider the dozen keys shown above. The sentence "Let me try to define what the call of the sea means" contains five of these keys. It could perhaps be understood by the DOCTOR but not by the program we are now considering. It would reply "I didn't understand you."
上記の12個のキーを考慮して見てください。 "Let me try to define what the call of the sea means" という文には、これらのキーが5つも含まれています。 おそらくDOCTORには理解できますが、現在検討中のプログラムには理解できません。 "I didn't understand you." と答えるでしょう。
I call attention to this contextual matter once more to underline the thesis that, while a computer program that "understands" natural language in the most general sense is for the present beyond our means, the granting of even a quite broad contextual framework allows us to construct practical language recognition procedures.
このコンテキストに関わる問題についてもう一度注意を喚起し、次の命題を強調します。 最も一般的な意味で自然言語を「理解」するコンピュータープログラムは、現時点では私たちには手に負えませんが、 非常に広範なコンテキスト・フレームワークさえも付与すれば、実用的な言語の認識手順を構築することができます。
The present script is designed to reveal, as opposed to conceal, lack of understanding and misunderstanding. Notice, for example, that when the program is asked to compute the area of the ball, it doesn't yet know that a ball is a sphere and that when the diameter of the ball needs to be computed the fact that a ball is an object has also not yet been established. Appropriate questions are therefore asked. But when, later on, the area of the globe is required, all the parameters are known and no questions are asked. The transcript also makes clear that the program now has memory and, of course, that it can compute.
現在のスクリプトは、隠蔽とは対照的に、理解の欠如と誤解を明らかにするように設計されています。 たとえば、プログラムがボールの面積を計算するように要求されても、ボールが球体であることは認識されず、ボールの直径を計算する必要があるときには、ボールがオブジェクトであるという事実もまだ確立されていないことに注意してください。 したがって、適切な質問が求められます。 しかし、その後、地球の面積が必要になった場合、すべてのパラメーターは既知であり、質問されることはありません。 上記で再現されたログは、プログラムにメモリがあり、もちろん計算できることも明らかにしています。
対話システムの応用について
I can imagine at least two questions that might have arisen in the mind of the reader in response to the above material. First, but least important, is what role the kind of psychiatric program shown here has in serious psychotherapy. My answer to that must be that psychotherapy is not my field and that I have no intention to pursue any therapeutic implications of this work. It is clear that there is considerable psychological material to be exploited here, material that may conceivably lead to some therapeutic developments. There may also be some use in this kind of technique in simulation of the neurotic processes. K. M. Colby, a practicing psychoanalyst, does propose to use conversational programs as psychotherapeutic tools vis-a-vis real patients. I believe the unsolved technical problems in the computer realm alone are so enormous as to guarantee the postponement of the realization of such a goal for yet a very long time.
上記の質問に答えて読者の心に浮かんだ疑問は、少なくとも二つは想像できます。 第一に、さほど重要ではありませんが、ここに示したような精神医学プログラムが重篤な精神療法においてどのような役割を果たしているかです。 それに対する私の答えは、精神療法は私の専門分野ではなく、この研究の治療的意味合いを追求するつもりはないということでなければならないでしょう。 ここで利用されるべき相当な心理学的材料があることは明らかであり、この材料は治療の発展につながる可能性はあります。 この種の技術は、神経過程のシミュレーションにも利用できるかもしれません。 精神分析医の K.M.Colby は、実際の患者に対する心理療法ツールとして会話プログラムを使うことを提案しています。 私は、コンピュータの分野だけでも、解決されていない技術的な問題は非常に大きいので、そのような目標の実現が、まだ非常に長い間延期されることを保証できると信じています。
The second question concerns itself with the implications of this work on so-called teaching machines. Here I feel on much firmer ground. It is my belief that the kind of programmed teaching that is based on multiple choice testing of the student is best done without the use of computers. With the techniques described here, it becomes possible to instruct the student in a corner of some field and then, the contextual framework having been established, to have the student interact with the machine in natural language. The following conversation, based on a script written by Dr. Edwin Taylor of the Education Research Center of MIT, makes the point very well.
第二の問題はいわゆる教育用マシンに対するこの研究の意味に関係しています。 ここではもっとしっかりした足場を感じます。 私の考えでは、生徒の複数選択テストに基づいたプログラム化された授業は、コンピュータを使わずに行うのが最善だと思います。 ここで説明した技術により、ある分野の片隅で学生に指示し、その後、文脈的枠組みが確立され、学生に自然言語で機械と対話させることが可能になります。 以下の会話は、MIT教育研究センターの Edwin Taylor 博士によって書かれたスクリプトに基づいており、この点を非常にうまく指摘しています。
-------------------------------------------------------------------------------- PLEASE CONSIDER HOW WE MIGHT SYNCHRONIZE TWO CLOCKS TO READ THE 'SAME TIME'. ONE OF THESE CLOCKS IS IN SAN FRANCISCO, THE OTHER IS IN NEW YORK. AS YOU THINK ABOUT THE PROBLEM, ASK ME ANY QUESTIONS THAT OCCUR TO YOU. WHEN YOU ARE READY TO PROPOSE A SYNCHRONIZATION METHOD, TYPE 'READY'. THEN I WILL QUIZ YOU ABOUT YOUR PROPOSED METHOD. what do you mean by synchronize FOR THE PRESENT MAKE USE OF THE EVERYDAY MEANINGS OF SUCH PHRASES AS 'SAME TIME' AND 'SYNCHRONIZE'. LATER WE WILL DISCUSS THE MEANING OF THESE TERMS MORE CAREFULLY may i use telegraph, signals CERTAINLY, FEEL FREE TO USE TELEGRAPH ready NOW I WILL QUIZ YOU ON YOUR SYNCHRONIZATION METHOD DOES YOUR METHOD OF SYNCHRONIZATION INVOLVE THE PROPAGATION OF SOME SIGNAL -- OR MATERIAL OBJECT -- FROM ONE PLACE TO ANOTHER yes WHAT KIND OF PROPAGATING SIGNAL OR TRAVELING OBJECT DO YOU PROPOSE TO USE a watch WILL YOUR WATCH MOVE AT A SPEED VERY MUCH SMALLER THAN THE SPEED OF LIGHT of course GOOD. TRAVELLING CLOCKS CAN BE USED TO SYNCHRONIZE DISTANT CLOCKS TO ARBITRARILY HIGH ACCURACY IF THEY TRAVEL SLOWLY ENOUGH. YOU MAY LEAVE THE PROBLEM BY PUSHING THE 'QUIT' BUTTON TWICE. IF YOU WOULD LIKE TO EXPLORE FURTHER THE MATTERS OF PRINCIPLE ASSOCIATED WITH OTHER METHODS, CHOOSE ANOTHER WAY TO COMMUNICATE BETWEEN THE DISTANT CLOCKS. WHAT KIND OF PROPAGATING SIGNAL OR TRAVELING OBJECT DO YOU PROPOSE TO USE. light WELL, OF COURSE THE LIGHT SIGNAL WILL NOT FOLLOW THE CURVATURE OF THE EARTH. SO LET US ASSUME THAT SOME SYSTEM OF RELAY TOWERS IS USED. NOW LET ME ASK, WILL THE LIGHT SIGNAL TRAVEL DIRECTLY BETWEEN NEW YORK AND SAN FRANCISCO OR WILL THE LIGHT SIGNAL TRAVEL TO OR FROM SOME INTERMEDIATE POINT it will travel from St. Louis in both directions IS YOUR INTERMEDIATE POINT EQUIDISTANT FROM NEW YORK AND SAN FRANCISCO let's say it is, yes MY UNDERSTANDING IS THAT YOU EXPECT TO USE TWO SIGNALS AND THAT THESE SIGNALS WILL EITHER CONVERGE ON OR BE SENT OUT FROM A POINT EQUIDISTANT FROM NEW YORK AND SAN FRANCISCO. IS MY UNDERSTANDING ON THIS POINT CORRECT? yes WILL THIS PAIR OF SIGNALS CONVERGE ON THE INTERMEDIATE POINT OR BE SENT OUT FROM THIS POINT they will be sent from the point WILL THE TWO SIGNALS LEAVE THE INTERMEDIATE POINT AT THE SAME TIME? certainly AHA, I'VE GOT YOU. YOU ARE TRYING TO SYNCHRONIZE THE NEW YORK AND SAN FRANCISCO CLOCKS TO READ THE 'SAME TIME'. HOW CAN IT BE VALID TO ASSUME A 'SAME TIME' FOR THE DEPARTURE OF A PAIR OF SIGNALS FROM THE MIDPOINT? because the pair of signals leave from the same point RIGHT, THE PHRASE 'SAME TIME' HAS AN UNAMBIGUOUS MEANING WHEN APPLIED TO EVENTS THAT OCCUR NEAR THE SAME POINT IN SPACE. NOW YOU ARE GOING TO CONTINUE YOUR ARGUMENT BY SAYING THAT THE TWO SIGNALS THAT START FROM THE MIDPOINT AT THE SAME TIME WILL PRESUMABLY REACH NEW YORK AND SAN FRANCISCO AT THE SAME TIME. THESE SIGNALS CAN THUS BE USED TO SYNCHRONIZE THE NEW YORK AND SAN FRANCISCO CLOCKS. IS THIS THE WAY YOUR ARGUMENT WILL CONTINUE? yes ONE FINAL QUESTION. WHAT ASSUMPTION ARE YOU MAKING ABOUT THE SPEEDS OF THE TWO SIGNALS THAT TRAVEL IN OPPOSITE DIRECTIONS that these speeds are equal VERY GOOD. YOU HAVE DEVISED A VALID METHOD FOR SYNCHRONIZING TWO CLOCKS, ONE IN NEW YORK AND ONE IN SAN FRANCISCO. I AM NOW RETURNING YOU TO THE CTSS SYSTEM --------------------------------------------------------------------------------
-------------------------------------------------------------------------------- E: 「同じ時刻」を読み取るために2つのクロックを同期する方法を検討してください。これらの時計の1つはサンフランシスコにあり、もう1つはニューヨークにあります。あなたが問題について考えると、あなたに起こったどんな質問でも私に尋ねてください。同期方法を提案する準備ができたら、「準備完了」と入力します。次に、提案されたメソッドについてクイズします。 C: 同期するとはどういう意味ですか E: 現在、このようなフレーズの日常的な意味を「同じ時間」および「同期」として使用してください。後で、これらの条件の意味をさらに慎重に説明します C: 電信、信号機を使用できますか E: 確かに、電信を自由に使用できます C: 準備完了 E: 今から私はあなたの同期方法をあなたにクイズします。あなたの同期方法は、ある場所から別の場所へのいくつかの信号(または材料オブジェクト)の伝播を含みます。 C: はい E: どのような種類の信号または移動オブジェクトの伝播を使用することを提案しますか C: ウォッチ E: あなたの時計は光の速度よりもはるかに小さい速度で動きます C: もちろん E: 結構。ゆっくりと十分に移動する場合、移動クロックを使用して、遠隔クロックを任意の高精度に同期させることができます。「QUIT」ボタンを2回押すことで問題を解決できます。他の方法に関連する原則の問題をさらに詳しく調べたい場合は、距離のあるクロック間で通信する別の方法を選択してください。どのような種類の信号または移動オブジェクトを使用することを提案しますか。 C: 光 E: もちろん、光信号は地球の曲率をたどることはありません。それでは、いくつかのシステムのリレータワーが使用されていると仮定しましょう。今すぐ私に尋ねて、ライトシグナルトラベルをニューヨークとサンフランシスコの間で直接移動するか、またはライトシグナルトラベルをいくつかの中間地点間で行き来させます C: セントルイスから両方向に移動します E: あなたはニューヨークとサンフランシスコから均等の中間点を置くということですか? C: はい、そうです E: 私の理解は、あなたが2つの信号を使用することを期待し、これらの信号がニューヨークとサンフランシスコからの均等なポイントに収束するか、送信されることです。この点について私の理解は正しいですか? C: はい E: この信号のペアは、中間点で収束するか、この点から送信されますか? C: それらはポイントから送信されます E: 2つの信号は、同時に中間点を離れますか? C: もちろん E: なるほど、わかった。あなたは「同じ時間」を読むためにニューヨークとサンフランシスコの時計を同期させようとしています。ミッドポイントからの信号のペアの出発に対して「同じ時間」を仮定することはどのように有効ですか? C: 信号のペアが同じポイントから出るため E: その通り。空間の同じポイントの近くで発生するイベントに適用される場合、正しい「同じ時間」というフレーズには曖昧な意味があります。今、あなたは同じ時間にミッドポイントから始まる2つの信号が同じ時間にニューヨークとサンフランシスコに届くと言うことによってあなたの主張を続けるつもりです。これらの信号を使用して、ニューヨークとサンフランシスコの時計を同期できます。これはあなたの主張が続く道ですか? C: はい E: 最後に1つ質問。反対方向に移動する2つの信号の速度について、どのような仮定をしますか? C: これらの速度が等しいこと E: 素晴らしい。ニューヨークとサンフランシスコの2つの時計を同期する有効な方法を考案しました。 CTSSシステムに戻ります。 --------------------------------------------------------------------------------
I have chosen to skew this discussion in the direction of "understanding" and have used that difficult word almost as if it were synonymous with "recognition." Actually, recognition is a prerequisite to understanding. The latter provides a test of the former. Even though no test of understanding can be defined with rigor, we do feel we are understood when the person we're talking to asks what we believe to be relevant questions and when he finally answers our question or solves the problem we posed. By such criteria, the conversations displayed above justify the assertion that the programs that produced the responses recognized textual patterns and understood what they were being told.
私はこの議論を「理解する」の方向にゆがめ、まるで「認識する」と同義であるかのように難しい言葉を使ってきました。 実際、理解するためには認識が必要です。後者は前者のテストを提供します。 厳密さをもって理解のテストを定義することはできませんが、私たちが話している相手が私たちに関連すると思われる質問をしたとき、そして彼が最終的に私たちの質問に答えたり、私たちが提起した問題を解決したりしたとき、私たちは理解されていると感じています。 このような基準によって、上に示した会話は、応答を生成したプログラムがテキストのパターンを認識し、彼らが言われていることを理解したという主張を正当化します。
参考となる先行研究事例
Finally, I wish to call attention to three pieces of work, two of which predate the programs discussed here and to whose authors I owe a considerable intellectual debt. The last is more recent but nevertheless highly relevant to my own current line of attack. 最後に、3つの研究に注目していただきたいと思います。 そのうちの2つは、ここで議論されているプログラムよりも前のもので、著者にはかなりの知的負債があります。 最後のものは、より最近のものですが、それにもかかわらず、私自身の現在の研究目標に非常に関連しています。
The SIR program of Raphael is capable of inferential data acquisition in a way analogous to that displayed in the ELIZA ball and sphere conversation displayed above. Notice that in that conversation the program had to infer that a ball was a sphere and an object. Once that inference was affirmed, the program retained the information by, in this ease, associating with ball the fact that it is a sphere and an object and with sphere and object that ball is an instance of each, respectively. SIR is a program which specializes in establishing such relationships, remembering and invoking them when required. One of its principal aims was to establish methodology for formalizing a calculus of relations and even relations among relations.
RaphaelのSIRプログラムは、上記のELIZAのボールと球体の会話で表示されるのと同様の方法で、推論データを取得できます。 この会話では、プログラムはボールが球体でありオブジェクトであると推論しなければならなかったことに注意してください。 その推論が確認されると、プログラムは、この簡単な方法で、球とオブジェクトであるという事実と、球がそれぞれのインスタンスである球とオブジェクトとを関連付けることにより、情報を保持しました。 SIRは、そのような関係を確立し、必要に応じてそれらを記憶し、呼び出すことに特化したプログラムです。 その主な目的の1つは、関係の計算や関係間の関係さえも形式化する方法論を確立することでした。
Bobrow's program STUDENT is capable of solving so-called algebra word problems of the kind that are typically given in high school algebra texts. He uses a mechanism not very different from an ELIZA script. Its chief task is to transform the input text, i.e., the natural language statement of an algebra word problem, into a set of simultaneous linear equations that may then be evaluated to produce the desired result. A particular strength of his program is its power to recognize ambiguities and resolve them, often by appeal to inferentially acquired information but sometimes by asking questions.
Bobrow のプログラム STUDENT は、高校の代数の教科書によく出てくる、いわゆる代数単語の問題を解くことができます。 彼は ELIZA スクリプトとあまり変わらないメカニズムを使っています。 その主な仕事は、入力テキスト、すなわち代数問題の自然言語文を、一連の連立線形方程式に変換し、それを評価して目的の結果を生成することです。 彼のプログラムの特別な強みは、曖昧さを認識し、それを解決する能力です。 多くの場合、推測的に取得した情報にアピールしますが、質問をすることもあります。
The work of Quillian is mainly directed toward establishing data structures capable of searching semantic dictionaries. His system could, for example, decide that the words "work for" in the sentence "John works for Harry." mean "is employed by", while the same words appearing in the sentence "That algorithm works for all even numbers that are not perfect squares." mean "is applicable to."
Quillianの仕事は主にセマンティックな辞書を検索できるデータ構造を確立することに向けられています。 例えば、彼のシステムは "John works for Harry." という文の中の "work for" という言葉が "is employed by"(によって採用される) を意味し、"That algorithm works for all even numbers that are not perfect squares." という文の中に現れる同じ言葉が "is applicable to"(に適用される) を意味すると決定することができます。
Each of the computer papers referenced below represents an attack on some component of the machine understanding problem. That problem is not yet solved. 以下に引用するコンピュータの論文はいずれも、機械理解問題のある構成要素に対する取り組みを表していますが、その問題はまだ解決されていません。
RECEIVED APRIL, 1967
REFERENCES
参考文献
1. BORROW, D. G. Natural language input for a computer problem-solving system. Ph.D. Thesis, MIT, Dept. of Mathematics, Cambridge, Mass. 1964. 2. COLBY, KENNETH MARK. Computer simulation of change in personal belief systems. Paper delivered in Section L2, The Psychiatric, Sciences, General Systems Research, AAAS Berkeley Meeting, December 29, 1965. To appear in Behav. Sci., 1967. 3. QUILLIAN, M. R. Semantic memory. Ph.D. Thesis, Carnegie Inst. of Technology, Pittsburgh, Pa., 1966. 4. RAPHAEL, B. SIR: A computer program for Semantic Information Retrieval. Ph.D. Thesis, MIT, Dept. of Mathematics, Cambridge, Mass., 1964. 5. ROGERS,C. Client Centered Therapy: Current Practice, Implications and Theory. Houghton Mifflin, Boston, 1951. 6. WEIZENBAUM, JOSEPH. ELIZA -- a computer program for the study of natural language communication between man and machine. Comm. ACM 9, 1(Jan. 1966),36-45.