つくよみちゃん チャットボット チャレンジ
【情報】初期不良に対処しました。詳細はこちらをご覧ください。
藤田昭人
僕をよく知る誰かから「ジジィ、とうとうボケたか!」と突っ込まれそうですが…
いたって正常です😁
実は僕史上初めてのゲーム・アプリなんです。
ゲーム・アプリと言っても、もうこれ以上にないくらいシンブルなヤツですが…
https://tycc-voice-chatbot.glitch.me/
ソースコードも公開してます。
今回はこれを紹介します。
README に書いてること
まずはソースコードに添付している README(日本語版)から…
このウェブ・アプリケーションは還暦めがねじぃじ(@m04uc513)が開発・運営する音声チャットボットです。今、日本で注目されているキャラクタ「つくよみちゃん」の公開リソースを使っています。「つくよみちゃん」に関する詳しい情報はこちらをご覧ください。
遊び方
これは単純に 「人間の質問にテキストと発話で答える」 だけの最もシンプルなチャットボットで 「チャットする」ボタンを押すと始まります。
まず、最初にあなたの質問を入力してください。 プロンプトには 予め登録されている500ぐらいのQ&Aから ランダムに選んだ質問文が表示されているので、 もし質問が何も思いつかなければ、 プロンプトの質問をそのまま入力するのでも 構いません。スマホやPCの音声入力を オンにしておくと入力がラクです。
もし質問がマッチすると、 その回答をテキスト表示した後、 読み上げます。 チャットボットが 「読み取れませんでした。もう一度入力してください」 と反応したら、登録済みの質問には マッチしなかった印です。
チャットボットをしばらく放置した後に質問をすると、 返事がテキスト表示されるけども 読み上げてくれない現象が起こります。 これはアプリケーションのバックエンドが 停止していることが理由で (Glitch.com はウェブ・アプリケーションが 5分以上放置されるとバックエンドを 自動的に停止させてしまいます) リロードを実行すれば (Glitch.comの起動表示の後) 復活します。
以上、たったこれだけのゲームなんですが、 つくよみちゃんの声で返事が返ってくると なんだかおしゃべりしているような錯覚に陥ります😀 これもイライザ効果なんでしょうか?
ソフトウェアについて
このアプリケーションのソースコードは Github に置いてあります。
コードを見て貰えばわかるように、 チャットボットは基本的に あなたのブラウザだけで動いています。 あなたが入力してくれた質問は (不要なトラブルを避けるため) 保管していません (幼いお子さんでも楽しんでもらえるでしょう)。
Glitch.com で動作しているので Remix を試みる方もいるかも知れませんが、 正常に動かすにはちょっとしたテクニックが必要です。 テクニックについてはリクエストがあれば説明します。 その他のリクエストやコメントも歓迎します。 Twitter に告知のツィートを出しますので、 そこにメッセージを残しておいてください。
今後の計画について
あまりにも無意味なアプリケーションなので、 公開した理由を疑問に思っている方もいらっしゃるでしょう…
実は、このアプリケーションは 2023年冬に公開予定の 開発中のアプリケーションの プレビュー版なんです。 関係者に音声チャットボットの効果を 実感してもらうため 「今、出来上がってる部分だけ」 を公開しました。
なので、半年後をお楽しみに…
「つくよみちゃん」について
このチャットボットの開発には、フリー素材キャラクター「つくよみちゃん」(© Rei Yumesaki)が無料公開している会話テキストデータセットとイラスト素材を使用しています。
- つくよみちゃん公式サイト
- つくよみちゃん会話AI育成計画
- イラスト素材:夢前黎様
なお、このチャットボットが使用している音声データは SHAREVOX の 標準搭載音声ライブラリ を使って作成しました。
…という説明だけだとあまりに唐突すぎるので
うちわけ話をちょっとだけ
実はこれ、昨年の10月に書いた次の記事の続きだったりします。
今年の冬(にやるはず)の授業に向けた教材の開発として 今年の1月からちょこちょこ手がけていたんですが、 昨年11月 ChatGPT のリリース以降の影響などなど… いろいろな想定外の状況が発生して、 ここ半年間は右往左往してました。
実際、IT業界は数十年に一度あるかないかの 暴風雨に見舞われた感があります。 皆さんも同じだったのではないですか? ちなみに歴史オタクの僕の見立てでは (まだ小学生だったのでリアルタイムでの知見はない) 第1次AIブームのピーク時によく似てるのでは? と考えているのですが、 それについては先日次の記事を書いたので是非。
で…
当初は授業用の教材は3月あたりにプレビュー版を 公開するつもりだったのですが、 2ヶ月あまり遅れた上に 機能もかなり縮小せざる得なくなりまして、 結局、夢前黎さんが作成・公開されている つくよみちゃん会話AI育成計画 に頼らざる得なくなりました。 もっとも、この会話データは非常に良くできているので、 スマホで音声入力をオンにして、 プロンプトに表示される質問文を読み上げていると、 なんだか「つくよみちゃん」と おしゃべりしているような錯覚に陥ります。 気が向いたらちょっと試してみてください😀
ChatGPT狂想曲
昨年11月の公開以来、 快進撃を続ける ChatGPT による技術革新はもはや社会的な現象と言って良いのかも知れません。 ここ半年間は、この新技術の効果的な活用法に関する議論が多かったように思いますが、 ここへ来て社会に与える影響について考える議論へと移ってきているように見えます。
例えば、Quora に投稿された次のような質問を見かけることが 増えてきているような気がしますが いかがでしょう?
この質問には様々な回答というよりは意見が寄せられていますが、 その中に、かつて議論になった 中国語の部屋について語られていることに 興味をそそられます。
中国語の部屋
中国語の部屋とは哲学者の ジョン・サール が1980年に発表した論文 "Minds, brains, and programs" に登場する有名な思考実験です。 詳細は次の記事をご覧ください。*1
実は、先にも語った 「つくよみちゃんとおしゃべりをしてるような錯覚」 に気づいた時に思い出したのがこの思考実験だったのです。 で、この記事で紹介している音声チャットボットが 中国語の部屋を再現する最も単純な実装なのかも知れない… などと考えたのでした。であれば、 部屋の中にいる英国人が持っているのは ポケット辞書みたいな会話データを片手に 質問文に紐付けされた回答文を書いて渡してると思ったのです。 もし、それが僕が書いたブラウザ・サイドだけで動く 単純な質問文・回答文をマッピングする ロジックではなく、 ChatGPTのAPIを呼び出すようなものだったら、 その部屋は億の単位の蔵書のあるべらぼうな広さがあって その膨大な蔵書から瞬時に最適な応答を見つけ出す 超人的な英国人がいるに違いないと…
そんなことを考えると妄想が膨らんじゃうんですが😀
プログラマの僕は職業柄 この部屋の中身や仕組みが気になっちゃうんですが*2、 そんなところにフォーカスを当てるのは 少数派であることも自覚しています。 この部屋の中が見れない (あるいは見えても理解できない) ことを問題視する人もいるでしょうが 「部屋の中よりも返される回答が正しいか教えて欲しい」 人が大半でしょう。必然的に 「返される回答が正しいかどうかはともかく、 この部屋が注目されている間に一儲けできないか?」 と考えるビジネスマンも現れるでしょう。ごく少数 「この部屋から返される回答が正しいことを証明せよ」 と要求する輩も出てきます*3。
で…
この思考実験を思いついた ジョン・サール自身はこの思考実験から 「この部屋にいる英国人は中国語を理解してると言えるのか?」 という哲学的命題を引き出しています*4。 結論としてサールはAIを「強いAI」と 「弱いAI」に分類して、 強いAIは実現不可能なのではないか? と先の論文で述べています。
実際、この手の論争は コンピュータが実現された80年前以降 何度となく繰り返されてきた いつか見た光景 です。特に「AI(人工知能)」という言葉は 「人間の尊厳を脅かす存在」と想起されがちですから、 その否定派や反対派の主張の中には極端なものもある ことを10代、20代の若い方々にも 理解しておいて欲しいと思ったりしてます。
なんだか大ごとになってきた
前回の記事では 60年前の事例を紹介しましたが、 この記事を書いている間にも次のような報道が…*5
60年前と今の決定的な違いは、 やはり情報の拡散スピード なんじゃないかと思います。 もはや開発元の彼らでさえ 制御不能ってことなのかなぁ?*6
しかし「人類絶滅のリスク」だなんて…
と、まぁすっかり脱線してしまいましたが…
中国語の部屋の論によれば、 この音声チャットボットも ChatGPTと見分けがつかない ということに気を良くしたので 今回は気分よく〆たいと思います😀
#つくよみちゃんを利用してフォロワー増やしたい
以上
2023/06/09 追記
リリース直後のトラブルですいません。 試してみていただいた方は チャットボットで入力すると、 いきなりデッドロックに似た 現象に遭遇したかと思います。
原因はつくよみちゃんの発話を 非圧縮のWAVファイルで 格納していたことによります。 そのため音声データの転送に 非常に時間がかかってました。 緊急対処として発話用の音声データを AACコーディングのデータに差し替えました。 (およそ20分の1のデータサイズになってます) これで発話の問題は解消されたと思います。
試しに「疲れた」あるいは「好きだよ」 「励まして」と入力してみてください。 ちゃんとつくよみちゃんが返事してくれるはずです。
*1:僕と同世代の方々にとっては AI冬の時代 に起こった人工知能批判の事例のひとつとして 記憶されている方々も多いかと思います。
*2:そういえば、 先のQuoraの質問に寄せられている回答は この例えでいうところの中国語の部屋の中に フォーカスしたものが大半のよう見えます。
*3:彼らの要求はたいてい悪魔の証明なんですが、 ほとんどの場合、 そんな要求を突きつける輩が少数派であることを 彼らは全く自覚していません。
*4:今風に説明すると AGI(汎用人工知能) は実現可能なのか?と等価な命題なんじゃないかと思いますが…
*5:って書いたそばから…
🎉COEIROINK v2をリリースします!💫
— シロワニさん⭐️COEIROINK®︎🌙 (@shirowanisan) 2023年6月1日
COEIROINKは、VOICEVOXのエディタ・エンジンを利用しない、独自開発のUIに変わります。
今後、よりCOEIROINKに特化した追加機能や、操作性を実現するためにこの決断をしました。
よろしくお願いします...!!!https://t.co/yawM52hWHQ pic.twitter.com/BxnclaNdKf
ぜんぜん追いつけないじゃん。
*6:サム・アルトマンの発言も 3月の来日時とは微妙に変わって 来てると思えてならない。