Posted by qchan on November 8, 2011 at 1:05pm
アップロードファイルの[日本語 >> ローマ字変換]モジュールをSandboxとして公開しました。
今回2種類のモジュールを公開しましたが、形態素解析ライブラリ別になっています。
外部ライブラリがサーバーにインストールされていないと動作しませんので注意してください。
☆ KAKASIを使った jp_kakasi_transliteration
☆ MeCabを使った jp_mecab_transliteration
Drupal6,7のコアはブラウザから日本語の漢字かな混じり文から始まるファイル名をアップロードすると、
ASCII文字列以外を削除してしまう仕様になっています。
Drupal.orgのIssueでも議論されていて、Drupal8でも日本語文字列がそのままアップロード出来るかは未定のようです。
Using basename() is not locale safe | drupal.org
http://drupal.org/node/278425
今回公開したモジュールは、日本語ファイル名をローマ字として変換できるようにするものです。
日本語に対処する難しさの一つに分かち書き(形態素解析)問題があります。
これは検索インデックスを作成するときにもぶつかる問題で、ローマ字変換も同じ作業が必要になります。
このモジュールではKAKASI、MeCab等の外部のライブラリを使いました。
使ってみて、Test&Reviewのフィードバックをよろしくお願いします。
正式プロジェクトになり次第リンクも変更します。

Comments
素晴らしいです、早速テスト&レビューさせていただきます。
素晴らしいです、早速テスト&レビューさせていただきます。