複合語抽出 2

↓に書いた『複合語抽出』で使用したプログラムが微妙にバグっていました。それによりすべての出現回数がちょうど2倍になってしまったようです(ですので、相対的な順位は変りません)。修正しました。

この修正の際に少しアルゴリズムの調整したら、結果が少しだけ良くなったと思います。全体的にはあまり変らないのですが、いくつかのゴミデータが消えたようです。

これに加えて、もう1つ実験をしました。それは複合語の共通箇所をキーにしたグルーピングです。それについては『テキスト解析記録』にて。