2004-03-01から1ヶ月間の記事一覧
俺が中学校の時に有り金はたいて買った、ギターが壊れた。安物ギターの癖に、妙に気に入っていて、凄いショック。壊れたといっても一ヶ所欠けただけなのだが…。いまさら直すきにもなれないので、このまま自分のおもちゃとして生かしておくことに決定。写真の…
アクセス解析に関してのご質問、ということで多少コメントさせていただきます。まず、質問の内容を簡潔にまとめます。 アクセス解析により、検出されるアクセスと検出されないアクセスがある。なぜか? アクセス解析に検出されずにアクセスするには? どちらも…
頭痛。
見ての通り、デザイン大幅に変更しました。まるで自分でスタイルシートをスクラッチから書いたみたいに言っていますが、既存のテーマを拝借して多少書き変えただけです。もしかしたら、近々また変更するかもしれませんが、方向的には変らないと思います。今…
mimeTeXを弄っているうちに楽しくなってきたので、ローカルでコマンドとして実行するためのラッパを作ってみました。おそらくもっと簡単に実現する方法があったのでしょうが、勢いで自作した次第です。mimetex-wrapper.pl : http://members.jcom.home.ne.jp/…
TeXとかよくわかりませんが、はてなの数式機能おかしくないですか?次の数式は Z^2 = X^2 + Y^2 という式を表示しようとしています。 たぶん、CGIへ送るパラメータが正しくデコードされないことが原因かと思うのですが…。本家のサイトで試したところCGIに渡…
先日、複合語の出現回数を数えて、多い順に並べてみました。その結果の上位10個は以下のようになりました。(全リストはこちら http://members.jcom.home.ne.jp/j-klein/text/jklein/hukugou-list.txt) 脆弱性, お勧め, オーバーフロー, 暗号化, ユーザ名, …
京都府警の捜査書類、ネット上に流出 Winny経由かやっちゃいましたね。それしか言えないです。ここはあえて2チャンネラっぽく言わしてもらおう。(・A・) 京都府警、逝ってよし!
連日日記からキーワードを抜きだしているわけですが、ふと疑問に思ったことを実験してみました。疑問というのは『良く使われる語が、良く使われる日はいつ?』ということです。とりあえず、一番シンプルだと思われる方法で計算してみました。計算方法は以下の…
Interface Web : http://www.cqpub.co.jp/interface/今まで、興味が無かった(というより注目したことの無かった)雑誌ですが、ツタヤの本コーナーを歩いていたら急に『作りながら学ぶEthernet活用技術』という見だしに惹かれて手に取ってみました。だって普通…
今まで忍者Toolsを使っていましたが、やめました。理由は『手裏剣、ださ!』に尽きます。もう1つは『重い』こと。というわけで『一番星アクセス』を使うことにしました。名前の厨くささに腰が引けるものの、シンプルな使用法と結果の公開ができる*1ことが決…
RedHatLinuxで日本語入力時に数字キーをクリックすると漢数字が入力されることに始めて気付いた。1234567890を日本語入力字にタイプすると 壱弐参四伍六七八九零 となる。うわ、迷惑。半角数字を入力するように教育した。デフォルトでこうだったのか、何かの…
こっそりと『プロトコルに直接触れる - POP3』を追加しました。知っている人には当たり前、知らない人にもとっても簡単なPOP3をtelnetで操作して、メールを読みます。SMTPの説明があって、POP3の説明が無いのがアンバランスだったので…。『プロトコルに直接…
複合語の抽出というのはid:kt-blackout:20040324でも書いたように、キーワード抽出において重要な意味を持ちます。複合語というのはわりと専門的な用語であったり、日常会話などで出にくい言葉であることが多いので、単純に複合語を抜きだすだけでも面白い結…
↓に書いた『複合語抽出』で使用したプログラムが微妙にバグっていました。それによりすべての出現回数がちょうど2倍になってしまったようです(ですので、相対的な順位は変りません)。修正しました。この修正の際に少しアルゴリズムの調整したら、結果が少し…
結論から言えば小説からキーワードを抜きだすことに無理があるんだろうな。そもそもキーワードをいくつか抽出してその小説の雰囲気や内容がつかめるわけがない。同じ理由で雑記的な日記も難しそう。実験的に夏目漱石の『我が輩は猫である』の複合語を抽出し…
当初、小説は『推薦図書』に含めないで技術書かそれに近い本のみに限定するつもりでしたが、なんとなく小説を含めてみました。と言ってももともとのポリシーである『自信を持って推められるもののみを載せる』には違反しないつもりです。実際のところ、私は…
あぁ、アクセス数を久しぶりに見たら1万超えてるじゃないですか。まじで、嬉しいです。 この『生存記録』が現在10500PVで、本サイト『Mac Freaks』は過去4ヶ月で約12000PV。これからもよろしくです。
最初に書いておきますが、全て本当の話です。といっても、実は良くある話なのかも知れませんが、少くとも私にとっては衝撃的な話だったもので…。仕事(バイト)の関係で、ある会社のデータ管理状況の見直しをすることになりました。この会社では3000件ほどのデ…
いい加減、専用ページ作りました。http://members.jcom.home.ne.jp/j-klein/text/index.html昨日の日記ともかぶりますが、id:alpinixさんとid:shi_moさんからログを提供していただいたので、上記ページにて全て公開させていただきました。ありがとうございま…
さて、「茶筅遊び」で書いているように茶筅で遊び回っているわけですが、いつまでも遊んでいるわけにもいきません。とりあえずの目標である「キーワードの抽出」を中心に考えてみました。以下、キーワード(重要語)を抜き出す上で漠然と思ったことメモして…
自分が作ろうと思っているソフトがあって、それが結構新しい(自分的には画期的な)アイディアで、そのために必要な知識について(私の場合はそれが自然言語処理)必死に勉強しているときに、ふとしたきっかけでそのアイディアが実現されていることを発見し…
昨日も書いた、『Hatena::Diary解析器』に二つ機能を追加しました。解析結果:http://members.jcom.home.ne.jp/j-klein/text/index.html解析結果を見ていただけば分かると思いますが、『日記量グラフ』と『一行あたりの形態素数グラフ』を追加してあります。…
絶対に豚キムチ丼がまずくなってる。鬱
細々と茶筌で遊んでいます。で、面白くなりそうなものを作ってみました。まだ、プログラム自体は公開できる状態ではありませんが、その結果のみ公開してみます。解析結果:http://members.jcom.home.ne.jp/j-klein/text/index.htmlこれはHatena::Diaryのログ…
というわけで行って来ました、UJ。コンピュータ回りの話も面白いのですが、やはり家では見れない「理科の実験」が非常におもしろかったです。理科系の発表は薬師寺教授によるテスラコイルやPOKA氏のレーザ、KURARE氏の催涙ガスがあり、どれも非常におもしろ…
・近似文字列照合による全文検索のための接尾辞配列の高速走査法(PDF)この論文を読んでSuffix Arrayのライブラリは無いかな? と検索したら*1見事に高林哲氏が作成していましたね。・Sary: Suffix Arrayのライブラリとツール試してみます。ちなみにSuffix …
茶筌 - ChaSen : http://chasen.aist-nara.ac.jp/思うところがあり、ChaSenをインストール。インストール自体は簡単で、ChaSenとipadicをconfigure->make->make installで大丈夫です。試しにいくつか形態素解析してみた。 元テキスト:私は変なおじさんです…
今日は一日予定の無い「空き日」だったので、ゆっくりと待ち行列理論やグラフアルゴリズムについて勉強してました。結局、4時間弱勉強していたようです。それにしても昔は「絶対」に自分から勉強なんてしない人間だったのに、いつのまにか勉強するのが苦痛じ…
SoftEther仮想HUBが出たようです。「もしかしてソース公開?」なんて思いましたが、しっかり*.aなファイルで配付されていました。赤帽9でコンパイル、実行してみたところ問題無く動作しているようです。Windowsもってないので、そのままkillしましたがね。Sof…