茶筌遊び

細々と茶筌で遊んでいます。

で、面白くなりそうなものを作ってみました。まだ、プログラム自体は公開できる状態ではありませんが、その結果のみ公開してみます。

解析結果:http://members.jcom.home.ne.jp/j-klein/text/index.html

これはHatena::Diaryのログを解析し、各月の日記の特長を見ることを目標にしています。現在のところ頻出頻度の高い名詞を抜きだすのと、フィラーグラフを作成することしかしていませんが、いろいろ解析したら面白くなると思います。ちなみに、フィラーについての説明も上記リンクにて触れていますので御覧下さい。

日記というのは日々書いているものなので、後々になり「過去の自分」を見ることが出来ます。勿論、すべてを読めば良いのでしょうが、その中でも機械的に判断可能な属性を自動的に取りだすことは決してムダではないはずです。

例えば、定期的に解析プログラムを走らせて、解析結果を公開すれば、第三者が見るときに「◯年□月頃は▽に多く触れている」ということが分かりますし、フィラーの動向を見れば(理想的には)文章の雰囲気、文体、といったものが想像出来ます。

さらにいくつかの属性についても解析する予定ですので、お楽しみに。と言っても勉強しながらなのでゆっくりですが…。


もし、この程度のものでも試したいという方がいたら、私のところにHatena::Diaryのログを送ってくれればこちらで解析します。正直なところ、いろいろな人の日記を解析してみたいので、こちらからお願いしたいぐらいなのですが…。解析結果に関しては無許可でこちらで公開するかもしれませんので、それでよろしい方のみお願いします。

メール(@を半角にしてください):j-klein@jcom.home.ne.jp