自然言語処理
boonlab.hatenablog.com 今までは小説のデータを取ってくるのに毎回毎回青空文庫からデータを引っ張ってたのだけれど、 さすがにDosアタックしてるような気持ちになったので、PostgreSQLにデータを全部突っ込んでそこからデータ取るようにした。 ついでに、m…
boonlab.hatenablog.com 前につくった、 http://bungoo.herokuapp.com/Bungoo/ の紹介記事のようなもの。 しかし、そろそろ校正しないと文学フリマに間に合わなそうでやばい。まじでやばい。
はじめに 2chまとめを読んでいたら、"長い"みたいなレスを投げられていた二郎コピペがあった。せっかく名文なのに長いの一言で一蹴されては報われないので、日本語の自動要約をしてくれるshucaを用いて短く要約してみた。 shucaとは? github.com python2系で…
本日の小説 - 文學ラボ@東京boonlab.hatenablog.com 転記しました。
soy-curd/Bungoogithub.com とりあえず動いたのでgithubに上げておく。詳細は後ほど書く気がする。 マルコフ連鎖で前の文に似通った文字列を出力することで、小説っぽい文字列を生成するツールを作った。 http://bungoo.herokuapp.com/Bungoo/ 課題 現状、実…
第19回文学フリマ向け同人誌『実用 どんぐりと山猫』のメインコンテンツとなる、d3.jsを使ったテキストヴィジュアライゼーションのスクショが撮れた。青空文庫から取ってきた『どんぐりと山猫』のテキストから、pythonを使って"どんぐり"、 "山猫" 等の生物…
良いの思いつかなかったら表紙これにします。
はじめに 2014年11月24日に開催される第19回文学フリマの参加サークルが発表されたので、参加サークルの名前の傾向を分析してみた。 第十九回文学フリマ 参加確定サークル一覧 分析 まずは結果から。 単語 出現回数 会 ************************************…
はじめに ある小説が存在するとき、我々はその文章の中のどんな要素によって、その小説を「面白い」と評価するのだろうか? 例えばここで、以下のような文があったとする。 私は家を出た。外は晴れていた。公園に向かって歩いていくと、犬が猫を連れて散歩し…