Macへのmecabインストール
形態素解析で日本語をごにょごにょしたいので、mecabを入れてみる。従来はchasenとかを使っていたんだけど、こちらの方がメモリ効率がいいという話を聞いたので試してみる。
例によって環境は以下の通り
mecabのサイトから本体と辞書をダウンロードしてくる。
http://mecab.sourceforge.net/
まずは、mecab本体をインストール。
$tar zxvf mecab-0.98pre3.tar.gz $ ./configure --prefix=/Users/名前/App/mecab $ make $ make install
続いて辞書を登録。辞書はmecabのインストールディレクトリが標準でない場合、オプションでmecab-configの場所を教えてやらないとうまくいかない。あと、ディフォルトの文字コードがeucなので変えたい場合は、--with-charsetをつけておくのが大事
$ tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-mecab-config=/Users/名前/App/mecab/bin/mecab-config --with-charset=utf8 $ make $ make install
これだけでさっくりインストール終了。ちゃんと機能しているかmecab/bin配下に移動して日本語入力してみる。
$ ./mecab 日本語入力 日本語 名詞,一般,*,*,*,*,日本語,ニホンゴ,ニホンゴ 入力 名詞,サ変接続,*,*,*,*,入力,ニュウリョク,ニューリョク EOS