小説のキーワード

結論から言えば小説からキーワードを抜きだすことに無理があるんだろうな。そもそもキーワードをいくつか抽出してその小説の雰囲気や内容がつかめるわけがない。同じ理由で雑記的な日記も難しそう。

実験的に夏目漱石の『我が輩は猫である』の複合語を抽出してみたところ上位は次のようになった。

迷 - 亭
寒月 - 君
苦 - 沙弥
独 - 仙
ご - とく
東風 - 君
亭 - 君
鈴木 - 君
字 - 下げ
仙 - 君
小 - 供

やはり無理がある。第一、ネット上でなんらかのキーワードで小説を漁るという行為を行なう人もかなり少いはず。実際、キーワード抽出に関連したの論文などは抽出対象自体を論文や新聞に固定している。


余談。『我が輩は猫である』から抽出した『◯◯猫』という複合語は以下の通り(一部誤抽出がありますが)。

雄, 小, 盲, 黒, 乱暴, 等, 無, 無性,
痴, 愚, 雌, 庸, 的, 美, 霊, かい

ちょっと『我が輩は…』っぽくて良くないですか? 笑