end0tknr's kipple - web写経開発

太宰府天満宮の狛犬って、妙にカワイイ

install MeCab from source to rhel9

MeCabのインストールは以前、実施していたかもしれませんが、メモ

参考url

mecab本体のdownload

google driveからのダウンロードで redirectが発生することもあり、 wgetで行う場合も、curlで行う場合も、 以下のようにファイル名を指定する必要があります。

$ wget --output-document="mecab-0.996.tar.gz" \
  "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"

$ curl --location \
     --output "mecab-0.996.tar.gz" \
     "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"

ipa辞書のdownload

$ curl --location \
     --output "mecab-ipadic-2.7.0-20070801.tar.gz" \
     "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM"

mecabのbuild

$ sudo yum install gcc-c++

$ tar -xvf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure --prefix=/home/end0tknr/local/mecab \
            --with-charset=utf8
$ make
$ make check
$ make install

ipa辞書のbuild

$ tar -xvf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --prefix=/home/end0tknr/local/mecab-ipadic \
            --with-mecab-config=/home/end0tknr/local/mecab/bin/mecab-config \
            --with-charset=utf8
$ make
$ make install

インストールされた辞書の確認と、簡単な形態素解析テスト

$ ~/local/mecab/bin/mecab -D 
filename:   /home/end0tknr/local/mecab/lib/mecab/dic/ipadic/sys.dic
version:    102
charset:    utf8
type:   0
size:   392126
left size:  1316
right size: 1316
$ echo "これははじめての形態素解析のテストです" | ~/local/mecab/bin/mecab
これ  名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
はじめて    副詞,一般,*,*,*,*,はじめて,ハジメテ,ハジメテ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
形態素   名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析  名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
テスト   名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です  助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
EOS

追加辞書 (mecab-ipadic-neologd) のインストール

$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd

$ export PATH=$PATH:/home/end0tknr/local/mecab/bin

$ /home/end0tknr/local/mecab/bin/mecab-config --dicdir
  /home/end0tknr/local/mecab/lib/mecab/dic

# ↑mecab辞書fileのインストールdirを確認し
# ↓その上で、インストール. (インストール完了まで数分を要します)

$ ./bin/install-mecab-ipadic-neologd --newest \
   --prefix /home/end0tknr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd

追加辞書による形態素解析テスト

$ echo "人工知能がバズる" | \
~/local/mecab/bin/mecab \
  -d /home/end0tknr/local/mecab/lib/mecab/dic/mecab-ipadic-neologd
人工知能    名詞,固有名詞,一般,*,*,*,人工知能,ジンコウチノウ,ジンコーチノー
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
バズる   名詞,固有名詞,一般,*,*,*,バズる,バズル,バズル
EOS

default辞書を変更するには、mecabrc を編集

$ vi /local/mecab/etc/mecabrc

dicdir =  /home/end0tknr/local/mecab/lib/mecab/dic/ipadic