中本です。 (2011/12/22 19:17), AWASHIRO Ikuya wrote:
i18npool/source/breakiterator/data/ja.dic というのがあるんですね。 http://cgit.freedesktop.org/libreoffice/core/tree/i18npool/source/breakiterator/data/ja.dic ものとしてはずいぶん古いようです。 これがどういうものなのかはよくわからないのですが、これをいい感じに変更 すると日本語でいい感じの恩恵が受けられたりするんでしょうか?
OOoのときにToraさんから話を聞いたことがありますが、これは単語境界を見つ け出すための辞書です。Writerとかで、Ctrl + → とかとすると、単語ごとに カーソルが移動するのですが、そういったときに使われます。未だにこの方式で やっているかどうかは定かではないですが、多分、上記の辞書をまだ使っている と思います。 昔あれこれと考えていた時には、辞書を更新するよりも、そもそも形態素解析か なにかを導入してもうちょっと賢く単語区切りできないものかというのは考えて いたことがあります。形態素解析を導入しようと思って、何年か前にこのあたり のコードを調べた記憶があります。 http://cgit.freedesktop.org/libreoffice/core/tree/i18npool/source/breakiterator/ ただ、当時は成果を残せていないので、あんまり記録がないかもしれません。大 した情報が残っていませんが、 http://www.freeml.com/openoffice/1910 http://openoffice.org/projects/ja/lists/qa/archive/2009-07/message/56 あたりの議論を参照してください。
どなたかハックしてみてはいかがでしょう?
期待しています!(他人任せ...) 中本崇志 -- Unsubscribe instructions: E-mail to discuss+help@ja.libreoffice.org Posting guidelines + more: http://wiki.documentfoundation.org/Netiquette List archive: http://listarchives.libreoffice.org/ja/discuss/ All messages sent to this list will be publicly archived and cannot be deleted