ども。鉄王です。

順序が前後してしまったんですが、今日はconvmvについてのネタです。

RedHat 8.0 から Ubunbu 6.06.2 に移行するにあたってのいちばんの懸念材料が、日本語ファイル名の扱いでした。前者の文字コードはEUC、後者はUTF-8がデフォルト。OSを移行するには、日本語ファイル名をUTF-8に変換する必要があるのでした。

で、起用したのが、Linux界隈では有名なconvmvというスクリプト。ウチの環境で使ってみたらこんな感じでした。

総ファイルサイズ約40GBの変換で約30分かかりました
サーバのスペックがアレなんで、まあ、こんなもんでしょう
なんか、ゴミファイルが残りました
原因がよく掴めてないのですが、RedHat 8.0時代に使っていたNetatalk 1.xで生成された「.DS_Store」(:2eDS_Store)が原因かもしれません
なぜか変換できないファイルがありました
RedHat 8.0 では、Samba 2.0.x と Netatalk 1.x(のEUC対応版)を使ってまして、ファイル名はすべてEUCだったはずなんですが、convmv -r -f euc-jp -t utf8 * --notest とやっても、Macがらみのファイルで変換できないものがありました

100%変換!というわけではない結果でしたが、全体的にはヒジョーに優秀なスクリプト、というのが使ってみての感想です。いやあ、いちばんの懸念材料がサクッと解消されてよかったよかった。

convmv - converts filenames from one encoding to another
http://www.j3e.de/linux/convmv/man/