MeCabのインストールは以前、実施していたかもしれませんが、メモ
参考url
- 【Python】形態素解析器のMeCabを使って自然言語処理の実装
- MeCab: Yet Another Part-of-Speech and Morphological Analyzer
- GitHub - neologd/mecab-ipadic-neologd: Neologism dictionary based on the language resources on the Web for mecab-ipadic
mecab本体のdownload
google driveからのダウンロードで redirectが発生することもあり、 wgetで行う場合も、curlで行う場合も、 以下のようにファイル名を指定する必要があります。
$ wget --output-document="mecab-0.996.tar.gz" \ "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" $ curl --location \ --output "mecab-0.996.tar.gz" \ "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"
ipa辞書のdownload
$ curl --location \ --output "mecab-ipadic-2.7.0-20070801.tar.gz" \ "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM"
mecabのbuild
$ sudo yum install gcc-c++ $ tar -xvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --prefix=/home/end0tknr/local/mecab \ --with-charset=utf8 $ make $ make check $ make install
ipa辞書のbuild
$ tar -xvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --prefix=/home/end0tknr/local/mecab-ipadic \ --with-mecab-config=/home/end0tknr/local/mecab/bin/mecab-config \ --with-charset=utf8 $ make $ make install
インストールされた辞書の確認と、簡単な形態素解析テスト
$ ~/local/mecab/bin/mecab -D filename: /home/end0tknr/local/mecab/lib/mecab/dic/ipadic/sys.dic version: 102 charset: utf8 type: 0 size: 392126 left size: 1316 right size: 1316
$ echo "これははじめての形態素解析のテストです" | ~/local/mecab/bin/mecab これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ は 助詞,係助詞,*,*,*,*,は,ハ,ワ はじめて 副詞,一般,*,*,*,*,はじめて,ハジメテ,ハジメテ の 助詞,連体化,*,*,*,*,の,ノ,ノ 形態素 名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ 解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ の 助詞,連体化,*,*,*,*,の,ノ,ノ テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス EOS
追加辞書 (mecab-ipadic-neologd) のインストール
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ export PATH=$PATH:/home/end0tknr/local/mecab/bin $ /home/end0tknr/local/mecab/bin/mecab-config --dicdir /home/end0tknr/local/mecab/lib/mecab/dic # ↑mecab辞書fileのインストールdirを確認し # ↓その上で、インストール. (インストール完了まで数分を要します) $ ./bin/install-mecab-ipadic-neologd --newest \ --prefix /home/end0tknr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd
追加辞書による形態素解析テスト
$ echo "人工知能がバズる" | \ ~/local/mecab/bin/mecab \ -d /home/end0tknr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd 人工知能 名詞,固有名詞,一般,*,*,*,人工知能,ジンコウチノウ,ジンコーチノー が 助詞,格助詞,一般,*,*,*,が,ガ,ガ バズる 名詞,固有名詞,一般,*,*,*,バズる,バズル,バズル EOS
default辞書を変更するには、mecabrc を編集
$ vi /local/mecab/etc/mecabrc dicdir = /home/end0tknr/local/mecab/lib/mecab/dic/ipadic