Linux での文字コード

Linuxでの文字コードの変換が分からなかったので調べましたのでメモしておきます。これらのコマンドは環境によっては無いかもしれません。

文字コードの変換
iconv  -f  -t  -o 
srcfile : 変換したいファイル
from-code : 元の文字コード
to-code : 変換後の文字コード
destfile : 出力されるファイル(指定しないと標準出力になる)

 使用出来る文字コード一覧は --list オプションでみれます。

◆文字コードの判別
kcc -c 
file : 判別したいファイル

 kccが対応している日本語の文字コードはJIS・シフトJIS・EUC-JPのみ
 であり、その他の場合は data と表示される。(UTF-8 も不可)

◆EUCへ変換
kcc -e  > 
srcfile : 元ファイル
dstfile : 出力先ファイル
 
 元の文字コードを自動判別してくれるから意外と便利。

◆nkf 関連
nkf 

一つ一つファイルの文字コードを変更するのがダルかったので暇つぶしにちょっとしたシェルスクリプトを書きました。使用するには当然 nkf が必要です。

ダウンロード:nkfs

使用する際は " nkfs [option] [-r] filelsit "という風に実行して下さい。-r オプションはディレクトリを再起的に辿るかどうかの指定です。ソース内の注意事項も読んでから使用するようにして下さい。

# なお、このツールで何か問題あっても責任持てないので自己責任でお願いします。ソース自体も力技っぽいですね(苦笑)。

【重要】 最初のものに(01/30 23:44以前のもの)結構重大なバグがありました。使用しないで下さい。現在あるものは改善されているので大丈夫です。ちなみにバグの内容は…typo…( ´Д⊂。バグのあるやつは2階層以上深いディレクトリにあるファイルのエンコードがおかしくなります。