soy-curd's blog

へぼプログラマーです [https://twitter.com/soycurd1]

小説風文章生成アプリ『Bungoo』を少し改造した

boonlab.hatenablog.com

今までは小説のデータを取ってくるのに毎回毎回青空文庫からデータを引っ張ってたのだけれど、 さすがにDosアタックしてるような気持ちになったので、PostgreSQLにデータを全部突っ込んでそこからデータ取るようにした。

ついでに、markov chainを作るのにめちゃくちゃ時間がかかっていたので、それもあらかじめ作成してpickle.dumpsしてデータベースに格納した。これで高速化できるはずだったけど、調子に乗って太宰治の小説を200本くらいポスグレにいれたせいで文字列を作るほうで時間かかってしまい差し引きゼロになった。むしろ遅くなったかもしれない。残念。

github.com