ubuntu 12.04でapt使ってmecabをインストールしている状態、virtualenvのpythonに切り替えているところからスタート

先に結論

mecabをソースからインストールして最新版にして、natto-pyをpipでインストールすれば出来た。

1. mecab-pythonをvirtualenv上で使用してみる

ファイルにmecab-pythonを置いてる場所を指定して、pip使えば良い

#requirements.txt
https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
$ pip install -r requirements.txt

これでvirtualenv上にmecab-pythonをインストール出来た。 参考:travisでpython-mecabを動かしたい時の設定 - Qiita

でもこれでおもむろに

import MeCab
m = MeCab.Tagger('-Ochasen')
print '今日は良い天気'

エラーが出たorz

2. natto-pyを使ってみる

pip search mecabで調べて、その後ググると、natto-pyってのがmecab使えるライブラリであるっぽいのでインストールしてみた

参考:buruzaemon/natto-py

$ pip install natto-py

これだけでインストール出来た。使ってみたらインストールしてあるmecabのバージョンが古過ぎて使えないと怒られたorz。

3. mecabを最新バージョンにする

仕方ないので

aptのmecabをアンインストール

$ sudo aptitude remove mecab

mecabをソースからインストール

$ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE
$ tar zxvf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure
$ make
$ make check
$ sudo make install

mecab辞書のインストール

$ wget https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM
$ tar zvxf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install

urlはそれぞれmecabのページからリンクされているものを用いた。

参考:MeCabのインストール方法 - tatsuyaoiw.hatenablog.com

natto-pyを改めて使う

# coding: utf-8↲
from natto import MeCab
nm = MeCab()
print nm.parse('ピンチの時には必ずヒーローが現れる。')
# MeCab result as a single string
ピンチ    名詞,一般,*,*,*,*,ピンチ,ピンチ,ピンチ
      助詞,連体化,*,*,*,*,,,
      名詞,非自立,副詞可能,*,*,*,,トキ,トキ
      助詞,格助詞,一般,*,*,*,,,
      助詞,係助詞,*,*,*,*,,,
必ず    副詞,助詞類接続,*,*,*,*,必ず,カナラズ,カナラズ
ヒーロー  名詞,一般,*,*,*,*,ヒーロー,ヒーロー,ヒーロー
      助詞,格助詞,一般,*,*,*,,,
現れる  動詞,自立,*,*,一段,基本形,現れる,アラワレル,アラワレル
      記号,句点,*,*,*,*,,,
EOS

うまくいった。