ubuntu 12.04でapt使ってmecabをインストールしている状態、virtualenvのpythonに切り替えているところからスタート
先に結論
mecabをソースからインストールして最新版にして、natto-pyをpipでインストールすれば出来た。
1. mecab-pythonをvirtualenv上で使用してみる
ファイルにmecab-pythonを置いてる場所を指定して、pip使えば良い
#requirements.txt
https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
$ pip install -r requirements.txt
これでvirtualenv上にmecab-pythonをインストール出来た。 参考:travisでpython-mecabを動かしたい時の設定 - Qiita
でもこれでおもむろに
import MeCab
m = MeCab.Tagger('-Ochasen')
print '今日は良い天気'
エラーが出たorz
2. natto-pyを使ってみる
pip search mecabで調べて、その後ググると、natto-pyってのがmecab使えるライブラリであるっぽいのでインストールしてみた
$ pip install natto-py
これだけでインストール出来た。使ってみたらインストールしてあるmecabのバージョンが古過ぎて使えないと怒られたorz。
3. mecabを最新バージョンにする
仕方ないので
aptのmecabをアンインストール
$ sudo aptitude remove mecab
mecabをソースからインストール
$ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE
$ tar zxvf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure
$ make
$ make check
$ sudo make install
mecab辞書のインストール
$ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM
$ tar zvxf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
urlはそれぞれmecabのページからリンクされているものを用いた。
参考:MeCabのインストール方法 - tatsuyaoiw.hatenablog.com
natto-pyを改めて使う
# coding: utf-8↲
from natto import MeCab
nm = MeCab()
print nm.parse('ピンチの時には必ずヒーローが現れる。')
# MeCab result as a single string
ピンチ 名詞,一般,*,*,*,*,ピンチ,ピンチ,ピンチ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
時 名詞,非自立,副詞可能,*,*,*,時,トキ,トキ
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
必ず 副詞,助詞類接続,*,*,*,*,必ず,カナラズ,カナラズ
ヒーロー 名詞,一般,*,*,*,*,ヒーロー,ヒーロー,ヒーロー
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
現れる 動詞,自立,*,*,一段,基本形,現れる,アラワレル,アラワレル
。 記号,句点,*,*,*,*,。,。,。
EOS
うまくいった。