2015-11-22から1日間の記事一覧
http://takuti.me/note/tf-idf/ を参考に、太宰治小説のTF-IDFを計算した。以下、値が上位のものから単語だけ30個並べると、 いちど,謂わ,依っ,要ら,つらい,やたら,ご存じ,在っ,先日,おそろしく,だいいち, あがっ,ゆるし,下さっ,おそろしい,落ちつき,青森,あ…
boonlab.hatenablog.com 今までは小説のデータを取ってくるのに毎回毎回青空文庫からデータを引っ張ってたのだけれど、 さすがにDosアタックしてるような気持ちになったので、PostgreSQLにデータを全部突っ込んでそこからデータ取るようにした。 ついでに、m…