English Group, Eigo-Japan
Hi Everyone,
I just want to announce that I started an English group, not to break away from this group, but more of a group that reaches out to people here in Japan that have a hard time staying up with things here or anywhere inside of Drupal. As I see this group grow, it looks like it is going pretty much Japanese, which is great! This is the Japan group after all!
The English group I started is more for us who can't keep up with things here so much. I know I have a hard time, nor enough time to pull out my dictionary all the time.
Read more日本語検索時の 簡易CJK処理 に変わるindexes方法
DrupalのSearch moduleで日本語を検索しようとすると、ちゃんと検索結果が返って来ないことがあります。
これはノードをSearch moduleが文字列を半角スペース毎にインデクスしているからです。
これに対する簡易的な処理として簡易CJK処理(日本語環境だと標準でON)という機能があります。
簡易CJK処理は「単語の最少文字数」を設定し連続して重なり合う文字列へ分割します。
「単語の最少文字数」設定が 3 の場合、「こんにちは」という文章は「こんに」「んにち」「にちは」のように分割され、インデックス付けされます。
ですが、単にぶつ切りにしたものをインデクスするので、
- 検索精度が悪い、
- データベースが意味のないキーワードで肥大化する。
- 検索単語の最小値が「単語の最少文字数」になってしまう。
という問題があります。
この日本語の検索問題に対して以下何れかの方法で対応しようと思いますが、
意見やアイディアなどあればコメントをお願いします。
・MeCab(メカブ)を使用した形態素分析
公式ページ http://mecab.sourceforge.net/
グループで参加したいイベント予定表
OSCなどのイベントの予定スケジュールなどを管理していくWikiです。
イベントは全国で開催されていますので、イベント会場の近くにお住まいの方がメインとなって、
準備・参加できるようにしていければと思います。
その都度、Topicを立ち上げて告知していきましょう。
OSCの予定リンク
OSPN - We Are Open!! http://www.ospn.jp/#list
オープンソースカンファレンス2011 Fukuoka 2011年12月3日(土)
オープンソースカンファレンス2011 Tokyo/Fall 2011年11月19日(土)・20日(日)
オープンソースカンファレンス2011 Hiroshima(10月1日)
オープンソースカンファレンス2011 Nagoya(8月20日)
Drupal.orgのhandbookとかコンテンツを翻訳する何かのスキーム
へたれながらlocalize.drupal.orgでちょこちょこ翻訳作業をしておりますが、モジュール等使い方を調べるためにhandbookなどを閲覧します。
英語に精通しているならともかく、一回一回興味のあるモジュールをテスト環境にインストールして試すのはかなり手間がかかります。
一度調べるために翻訳したりしたのなら、handbookなどの翻訳もどこかにあげておきたいなと思うのですが、何か良いアイデアはないでしょうか?
drupal.orgでもMultilingual contentsに対応していただければ足りるのですが。
localizeの仕組みってすごいですよね。
もう少しマニュアル等整備されれば、利用者も増え、localizeを含めた翻訳者が増えると思うのですがいかがなものでしょうか。
何かwikiを使うのはどうでしょうか。
で、drupal.orgでもMultilingual contentsに対応したときは一気に移すとか。
drupalは日本語の情報量が圧倒的に不足しているっと思っているのでもっと情報がほしい、蓄積したいと思っています。
Read more
