soy-curd's blog

へぼプログラマーです [https://twitter.com/soycurd1]

自然言語処理

小説風文章生成アプリ『Bungoo』を少し改造した

boonlab.hatenablog.com 今までは小説のデータを取ってくるのに毎回毎回青空文庫からデータを引っ張ってたのだけれど、 さすがにDosアタックしてるような気持ちになったので、PostgreSQLにデータを全部突っ込んでそこからデータ取るようにした。 ついでに、m…

文學ラボに同人誌の原稿追加した

boonlab.hatenablog.com 前につくった、 http://bungoo.herokuapp.com/Bungoo/ の紹介記事のようなもの。 しかし、そろそろ校正しないと文学フリマに間に合わなそうでやばい。まじでやばい。

自動要約プログラムshucaを使ってニ郎コピペを要約した

はじめに 2chまとめを読んでいたら、"長い"みたいなレスを投げられていた二郎コピペがあった。せっかく名文なのに長いの一言で一蹴されては報われないので、日本語の自動要約をしてくれるshucaを用いて短く要約してみた。 shucaとは? github.com python2系で…

本日の自然言語処理小説(javascriptで文字列の反転)

本日の小説 - 文學ラボ@東京boonlab.hatenablog.com 転記しました。

小説執筆補助ツールBungoo作った

soy-curd/Bungoogithub.com とりあえず動いたのでgithubに上げておく。詳細は後ほど書く気がする。 マルコフ連鎖で前の文に似通った文字列を出力することで、小説っぽい文字列を生成するツールを作った。 http://bungoo.herokuapp.com/Bungoo/ 課題 現状、実…

d3.jsとpython3を用いて『どんぐりと山猫』のテキストから動物要素を可視化した

第19回文学フリマ向け同人誌『実用 どんぐりと山猫』のメインコンテンツとなる、d3.jsを使ったテキストヴィジュアライゼーションのスクショが撮れた。青空文庫から取ってきた『どんぐりと山猫』のテキストから、pythonを使って"どんぐり"、 "山猫" 等の生物…

群馬文明文芸誌「実用 どんぐりと山猫」

良いの思いつかなかったら表紙これにします。

pythonを用いた文学フリマ参加サークル名の分析

はじめに 2014年11月24日に開催される第19回文学フリマの参加サークルが発表されたので、参加サークルの名前の傾向を分析してみた。 第十九回文学フリマ 参加確定サークル一覧 分析 まずは結果から。 単語 出現回数 会 ************************************…

動物を用いた小説の面白さの評価

はじめに ある小説が存在するとき、我々はその文章の中のどんな要素によって、その小説を「面白い」と評価するのだろうか? 例えばここで、以下のような文があったとする。 私は家を出た。外は晴れていた。公園に向かって歩いていくと、犬が猫を連れて散歩し…