2021-06-01から1ヶ月間の記事一覧
Embedded extraction from Wikipedia pages 2021/06/23 藤田昭人 前回は wikipedia-tokens.txt と wikipedia-papers.txt の 生成を試みましたが、本稿では残る wikipedia-embeddings.txt の生成を試みます。 もうひとつの難物、Word2Vec学習済みデータ wiki-…
Turing Bot (1) Extracting tokens from Wikipedia pages 2021/06/17 藤田昭人 本稿から数回は Turing Bot のための道具立てを紹介します。 これまで紹介してきた fastWMD は Python と C++ で実装されてますが、 このコードを参考に JavaScript に書き直し…
Aiming for a Turing Bot 2021/06/07 藤田昭人 前回 まででWMDの実装について ひと通り把握できた訳ですが、 本稿からは数回にわけて WMDを利用した対話システムの応答文生成について考えていきます*1。 WMDによる応答文生成の基本的なアイデア そもそも…
以下はブレッチリー・パークのサイトで公開されている アラン・チューリングに関するFAQ と その日本語訳 です。 原文は以下で掲載されています。 bletchleypark.org.uk Turing FAQ Pre-war No QA Desc. 1. Q When did Alan start to figure out that he …
Word Mover's Distance (6) Prepare the execution environment for fastWMD 2021/06/03 藤田昭人 本稿では、 前回 紹介したwikiPageSelectorを使って、fastWMDの入力となる 3種のデータファイルを生成するスクリプト wiki-xml-to-txt.py の動作を確認した…