音声チャットボットを活用した学習支援アプリの開発

Development of learning support application using voice chatbot
2023/08/18
藤田昭人


2023/08/19: 早速、追記しました。


はじめに

  • 本研究は(2021年度実施)昨年度発表した下記の研究の継続
  • AIが図書館司書の業務の「童話の読み聞かせ」を行うと仮定

    • テーマ:聴衆の関心を惹くセリフをAIに教える
      • 対象は幼児から小学校低学年
      • 退屈したり集中できない児童の関心を惹くことが重要
      • 童話の段落ごとに聴衆を喚起する一言を挟んでいく
  • 本年度も新たなテーマで実習授業を準備中

    • テーマ:中学生・高校生向けの四択問題10問を出題するAI



生成系AIのブーム

  • 新たな実習テーマで教材の開発に着手(2022年10月〜)
    • 前々年度、使用した実習教材がベース
    • チャットボットの音声合成部分の実装を追加*1
  • 生成系AIの大ブームが発生(2022月12月〜)
    • Stable Diffusion(2022年8月)
    • ChatGPT(2022年11月)
  • 3月〜5月:プロンプト・エンジニアリングに注目が集まる

生成系AIを応答文生成機能に活用する可能性検討に着手



ChatGPTの問題点 望ましくない応答も生成する

教育現場で生徒や学生に利用させるのはリスクが伴う



ChatGPTの問題点 意味を理解している訳ではない

  • 大規模言語モデル(LLM)
    • 大量のテキストデータを使って事前に学習された自然言語処理のモデル
    • LLMは入力に続く言葉を統計学の手法を使って推論しているだけ
    • 応答文が生成された理由を明確に示すことが困難
  • 専門家以外の反応:AIが質問を理解していると誤解
    • どんな質問にも返答を答えるが、その内容の妥当性は吟味しない
    • 具体的で一般的な質問には相応の(不正確な)返答を返すが
    • そうでない質問にはおかしな返答を返すことが多い
  • LLMのこの振る舞いはライトヒルレポートを彷彿させる
    • 1972年に発表されたAI研究を評価するレポート
      • AI techniques may work within the scope of small problem domains, but the techniques would not scale up well to solve more realistic problems.
      • AI技術は、小さな問題領域の範囲内では機能するかもしれないが、より現実的な問題を解決するためには、その技術はうまくスケールアップしないだろう。
    • 第1次AIブームの終焉のきっかけとなった

AI技術は60年前から格段に進歩したが、社会の反応はあまり変わらない?



ChatGPTの問題点 プライバシーと著作権の問題



検討結果 生成系AIの活用方法

  • 生成系AIは問題領域(用途)を限定すれば有効に見えるが…
    • 妥当性をチェックしないので応答の精度はヒント程度
    • 生成系AIを使うアプリで妥当性の確認をするのはコストが大きい
    • 生成系AIを活用する場合には、処理フローに応答の妥当性を人間が確認するパスを組み入れるべき
  • 実習の「中高生のテスト勉強をアシストするAI」の実現には…
  • 特定の個人にフォーカスした対話の実現
    • 「知識」を学習することを前提とした対話は固有表現に着目すべき
    • 対象「テスト勉強」に限定すれば、テスト問題から抽出できる
    • 任意のテキストから固有表現を抽出する問題は生成系AIが有効






第1次AIブームと現在 歴史的な相似

年号 第1次 年号 第3次
1955   2005 シンギュラリティ
1956 ダートマス会議 2006 ディープラーニング
1966 ELIZA、ALPACレポート 2016  
1967   2017 トランスフォーマ
1968   2018 GPT-1
1969 パーセプトロン批判 2019 GPT-2
1970   2020 GPT-3、Google、AI倫理研究者を解雇
1971   2021  
1972 Mycin(マイシン) 2022 GPT-3.5
1973 ライトヒル・レポート 2023 GPT-4、AI規制論議
1974 DARPACMUのプロジェクトをキャンセル 2024 (さて、何が起こるか?)


用語の解説

<作業中>



2023/08/19 追記

今日、箕原先生からの質問にあったオープンソースの日本語大規模言語モデルの件ですが…

東大の松尾研(機械学習を使ったAI研究で日本国内では有名です)から リリースされた Weblab-10Bオープンソース表記について 早速クレームがついているようです。


どうやら「商用利用不可」との条項が「オープンソースに適合しない」との指摘です。

日本でも生成系AIの制作物に関する著作権問題について ネット上での場外乱闘が始まっているようです。

*1:音声合成部分のみサービスは次のURLで確認できます。
https://tycc-voice-chatbot.glitch.me/
フロントページで「チャットする」をクリックして、 「励まして」と入力してみてください。
iPhoneの場合はSafariで起動してください。