Open5

Amazon Linux2 - ライブラリ系インストール

Amazon Linux 2 にyumでgitをインストール

2021/02/05現在、Amazon Linux 2でインストールできるのは以下のバージョン。
本家 だと2.30.0なのでちょっと古い

$ sudo yum list | grep git
~~~
git.x86_64                             2.23.3-1.amzn2.0.1            amzn2-core

バージョンを気にしないのであれば、そのままyumでインストール

$ sudo yum install -y git
~~~
$ git version
git version 2.23.3

Amazon Linux 2 に fastText をインストール

  • EPEL レポジトリを有効化する

[Extras library (Amazon Linux 2)] (https://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/amazon-linux-ami-basics.html#extras-library)

$ sudo amazon-linux-extras install -y epel

レポジトリが追加されていることを確認

$ sudo yum repolist
読み込んだプラグイン:extras_suggestions, langpacks, priorities, update-motd
200 packages excluded due to repository priority protections
リポジトリー ID                   リポジトリー名                                      状態
amzn2-core/2/x86_64               Amazon Linux 2 core repository                          23,094
amzn2extra-corretto8/2/x86_64     Amazon Extras repo for corretto8                            22
amzn2extra-docker/2/x86_64        Amazon Extras repo for docker                               36
amzn2extra-epel/2/x86_64          Amazon Extras repo for epel                                  1
epel/x86_64                       Extra Packages for Enterprise Linux 7 - x86_64      13,317+200
repolist: 36,470
  • fastText のインストール
$ sudo yum install -y fasttext

インストールの確認

$ which fasttext
/usr/bin/fasttext
$ /usr/bin/fasttext
usage: fasttext <command> <args>

The commands supported by fasttext are:

supervised              train a supervised classifier
quantize                quantize a model to reduce the memory usage
test                    evaluate a supervised classifier
test-label              print labels with precision and recall scores
predict                 predict most likely labels
predict-prob            predict most likely labels with probabilities
skipgram                train a skipgram model
cbow                    train a cbow model
print-word-vectors      print word vectors given a trained model
print-sentence-vectors  print sentence vectors given a trained model
print-ngrams            print ngrams given a trained model and word
nn                      query for nearest neighbors
analogies               query for analogies
dump                    dump arguments,dictionary,input/output vectors

Amazon Linux 2 に MeCab をインストール

  1. ビルドツールのインストール
$ sudo yum update -y
$ sudo yum groupinstall -y "Development Tools"
  1. MeCab インストール
$ wget 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE' -O mecab-0.996.tar.gz
$ tar xzf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure
$ make
$ make check
$ sudo make install
  1. NEologd をインストール

mecab-ipadic-NEologd : Neologism dictionary for MeCab

『-a』をつけてインストールするとインスタンスタイプによっていはメモリ不足?で失敗することがある模様

$ cd
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ ./mecab-ipadic-neologd/bin/install-mecab-ipadic-neologd -n -y

# デフォルトの辞書を設定する
$ sudo sed -i -e "s|^dicdir.*$|dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd|" $(mecab-config --sysconfdir)/mecabrc

# インストールできたか確認
$ echo すもももももももものうち | mecab
すもももももももものうち        名詞,固有名詞,一般,*,*,*,すもももももももものうち,スモモモモモモモモノウチ,スモモモモモモモモノウチ
ログインするとコメントできます