Tips

形態素解析ツールmecab(和布蕪)を、centOS(5.8)にインストールしてみました。
インストール手順を以下にまとめます。

手順1:ダウンロード&インストール

# cd /usr/local/src
# wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
# tar xvfz mecab-0.996.tar.gz
# cd mecab-0.996
# ./configure
# make
# make install

手順2:辞書のインストール

# cd /usr/local/src
# wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# tar xvfz mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure
# make
# make install

手順3:動作確認

echo “和布蕪で形態素解析をやってみる” | nkf -e | mecab | nkf -w

↓こんな感じで表示されたらOK
和布 名詞,一般,*,*,*,*,和布,ワカメ,ワカメ
蕪 名詞,一般,*,*,*,*,蕪,カブラ,カブラ
で 助詞,格助詞,一般,*,*,*,で,デ,デ
形態素 名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
やっ 動詞,自立,*,*,五段・ラ行,連用タ接続,やる,ヤッ,ヤッ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
みる 動詞,非自立,*,*,一段,基本形,みる,ミル,ミル
EOS

補足

mecabはkakasi同様、デフォルトではUTF対応していないので、mecabへ渡す直前と、
mecabから取得後に、文字列を各々utf8に変換します。

感想

chasenよりもさくっと簡単にインストールできました。
ネットでの評判を見てみるとchasenよりも評判がいい記事もちらほら。
使ってみて使い易い方を使うといいのでしょうね。

AIやビックデータ解析に興味を持った時のはじめの一歩

独学で学ぶ-pythonプログラミング 連載目次

Recent News

Recent Tips

Tag Search