データサイエンスに興味がある君へ[環境構築編][Mac]
目次
- Pythonってどうやったら使えるん?
- Anacondaってなに?pipってなに?
- 仮想環境ってなに?
- 実際の環境構築まで
1. Pythonってどうやったら使えるん?
最近何かと話題に上がる生成AIの話題に触発されてなんとなくデータサイエンスを始めたくなった皆さん、もしくはそれに触発された教授に急に機械学習関連の研究テーマを割り振られた残念な大学院生の皆さんこんにちは。授業では散々ソフトウェアやハードウェアの知識を勉強したのに環境構築はできて当たり前みたいな顔で進められている人も多いと思います。そんな方のためにサクッと環境構築が出来るようになる記事になっています。
Pythonの種類
まずは、Pythonのインストールの仕方についてです。実はPythonは2種類インストール元があります。
1つ目はPythonの公式サイトからダウンロードする方法。2つ目は後で出てくるAnacondaが配布しているPythonをダウンロードする方法。どちらを使うかは好みですが、始めたての人はややこしくならないようにAnacondaの方をダウンロードすることを勧めます。
- Python公式サイト:https://www.python.org/downloads/
以上のどちらかからPythonをインストールするだけで使えるようになります。
簡単ですね!!
2. Anacondaってなに?Pipってなに?
Anacondaは平たく言うと、楽にコードをかけるようになるライブラリをまとめて入れておける入れ物のことです。pipも同じで機能です。上級者になるほどpipを使っている印象です。
ライブラリってなに?
データサイエンスを始めようと思ったら、numpy,pandas,matplotlib,scikit-learn,pytorchなかを聞いたことがあると思います。これらはライブラリと呼ばれ計算や、グラフの描画などが簡単に操作できるようになります。
3. 仮想環境ってなに?
仮装環境は簡単に言うと、自分が今使っているコンピュータの中にもう一つ別のコンピュータを作るイメージで下の図のような感じです。図はこの記事からお借りしました
仮想環境を作らないと一つの物理マシンに対して一つのOSですが、仮想環境を作ることで複数のOSを操作することができ、擬似的に複数のマシンを所持していることになります。
仮想環境作成のメリット
仮想環境を作るメリットはいくつかありますが、最も大きなものは仮想環境同士が干渉しないことです。
たとえば、Aと言う仮想環境とBと言う仮想環境を作ったとします。
Aの仮想環境でエラーが起こり、取り返しのつかないことになったとします。しかし、Bの仮想環境は独立しているためAのエラーの内容の影響を受けません。また、仮想環境を保持しているベース環境にも影響はありません。つまり、仮想環境Aを消去してもう一度新しくしてしまえばエラーは無かったことになります。
そのほかにも、解析の目的(画像認識、自然言語処理など)ごとに環境を切り替えられると言うメリットもあります。
4.実際の環境構築まで
環境の構築の仕方はWindowsとMacで異なります。
Mac,Windows共通
まずはエディタをインストールします。エディタは簡単にいうと便利なメモ帳みたいなものでコードを書くときに色々なサポートをしてくれます。(エディタ自体にPythonを実行する機能はないことに注意)
一番有名なのはVscodeなのでそれをインストールします。以下のサイトから自分のOSに合ったものをインストールしてください。
Macの場合(Anaconda)
Anacondaをインストールします。以下のサイトからインストールをします。OSはiMacを選択してください。(僕が環境を作った時はサインインが必要なかったのですが必要になっています)
次々に出てくるポップアップを全てyesにしているとインストール先を選択する画面が表示されるので、「自分専用にインストール」を選択する。この時ユーザーのホームディレクトリがインストール先になります(ユーザーネームがホームディレクトリの名前)。
これだけではまだ使えなくて初期設定が必要です。Terminalを起動し、下のコマンドを入力します。
/opt/anaconda3/bin/conda init zsh
これで、Terminalを再起動したときに先頭に(base)の文字が表示されると成功です!
さて、次は仮想環境を作ってみます。
下のコマンドを入力します。
conda create -n (環境名)
これで、仮想環境が作成されます。これだけでは仮想環境に入れていないので、仮想環境に入るために以下のコマンドを入力します。
conda activate (環境名)
これで左側の文字が(base)から(環境名)に変われば成功です!お疲れ様でした。
あとは、conda install などで好きなライブラリを入れましょう
conda install numpy
condaは単純にライブラリ名をconda installで指定してもinstallできない場合も多いのでその時はconda のページを参照しましょう。
間違ってpipでinstallしてしまった場合は以下のコマンドでライブラリを消去します。
pip uninstall numpy
Macの場合(pip)
こちらの方は割と簡単で、homebrewからインストールします。
homebrewはbrewコマンドを使うことでパッケージをインストールすることができます。
Linuxのsudo apt get にあたるコマンドです。
homebrewをインストールするには以下のコマンドをTerminalに入れます。
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
以下のコマンドを実行し、バージョンが表示されれば成功です。
brew --version
次に、homebrewを使ってpythonをインストールします。
brew install python3
これだけです! 簡単〜
では、最後に仮想環境を作っていきます。anacondaの場合はanacondaディレクトリの下に環境用のファイルができるのですが、pipの場合は自分の作業環境にファイルができるので、新たに作業用のディレクトリを作る必要があります。
ディレクトリが何かは、この記事にまとめています。
mkdir (ディレクトリ名)
cd (ディレクトリ名)
ディレクトリがなに?cdコマンドってなに?と言う人はLinuxコマンドの勉強をしましょう。
それ用の記事も書く予定です。
condaを使わない場合はvenvが仮想環境の管理をしてくれます。仮想環境を作ってみます。
python3 -m venv (環境名)
仮想環境を有効にします。
source env/bin/activate
これで、環境名が左に出れば完成です!pipコマンドでライブラリを入れまくりましょう!
pip3 install numpy
環境から抜けたい場合は以下のコマンドです
source deactivate
お疲れ様でした!これで仮想環境の設定はおしまいです〜
おしまいに
記事を書くのって結構疲れますね、、、
Windows版もここに書くと長くなるので、次の記事で書くことにします。
ほな、また。
Discussion