<h1 id="%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB">
<a class="header-anchor-link" href="#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB" aria-hidden="true"></a> はじめに</h1>
<p>n番煎じですが、PyCaretという機械学習のコードを少し楽にしてくれる便利なライブラリの使い方をご紹介したいと思います。<br>
環境構築は結構手間取ったので別の機会に環境構築だけでも詳しくまとめたいと思っています。</p>
<p>最近HPも新しくなり、見やすくなりました！<br>
若干Pytorchライクな気がする感じのページに生まれ変わってます。</p>
<h1 id="pycaret%E3%81%A8%E3%81%AF">
<a class="header-anchor-link" href="#pycaret%E3%81%A8%E3%81%AF" aria-hidden="true"></a> PyCaretとは</h1>
<p>PyCaretという様々な機械学習のコードを簡単に実装してくれるものです。<br>
公式サイトで詳しく見たいからは以下からどうぞ。</p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__ad5e6abe91b87" src="https://embed.zenn.studio/card#zenn-embedded__ad5e6abe91b87" data-content="https%3A%2F%2Fpycaret.gitbook.io%2Fdocs%2F" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://pycaret.gitbook.io/docs/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://pycaret.gitbook.io/docs/</a></p>
<h1 id="%E7%92%B0%E5%A2%83">
<a class="header-anchor-link" href="#%E7%92%B0%E5%A2%83" aria-hidden="true"></a> 環境</h1>
<p>OS : macOS Big Sur<br>
Anaconda : conda version : 4.11.0<br>
conda-build version : 3.21.4<br>
python version : 3.8.8.final.0</p>
<h1 id="%E7%92%B0%E5%A2%83%E6%A7%8B%E7%AF%89">
<a class="header-anchor-link" href="#%E7%92%B0%E5%A2%83%E6%A7%8B%E7%AF%89" aria-hidden="true"></a> 環境構築</h1>
<h2 id="%E4%BB%AE%E6%83%B3%E7%92%B0%E5%A2%83%E3%81%AE%E6%BA%96%E5%82%99">
<a class="header-anchor-link" href="#%E4%BB%AE%E6%83%B3%E7%92%B0%E5%A2%83%E3%81%AE%E6%BA%96%E5%82%99" aria-hidden="true"></a> 仮想環境の準備</h2>
<p>PyCaretの公式に乗っ取ってanacondaで環境構築をします。<br>
<a href="https://pycaret.gitbook.io/docs/get-started/installation#environment" target="_blank" rel="nofollow noopener noreferrer">PyCaretOfficial Environment</a><br>
Anacondaが入っている環境で、以下のコマンドを叩けば環境が立ち上がります。環境名は個々人お好きな名前にしてください。</p>
<div class="code-block-container"><pre><code># create a conda environment
conda create --name yourenvname python=3.8

# activate conda environment
conda activate yourenvname

# install pycaret
pip install pycaret

# create notebook kernel
python -m ipykernel install --user --name yourenvname --display-name "display-name"
</code></pre></div><h2 id="%E5%BF%85%E8%A6%81%E3%81%AA%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8%E3%81%AE%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB">
<a class="header-anchor-link" href="#%E5%BF%85%E8%A6%81%E3%81%AA%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8%E3%81%AE%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB" aria-hidden="true"></a> 必要なパッケージのインストール</h2>
<p>以下のパッケージは公式の方法にある</p>
<div class="code-block-container"><pre><code>pip install pycaret
</code></pre></div><p>で入れてしまうと互換性のない最新バージョンが入ってしまい動かないことになってしまう。そのため、conda環境内で下記のコマンドを実行して、パッケージのバージョンをPyCaretに合わせなくてはいけないということが僕の環境では発生しました。ですので、下記コマンドで個別にインストールすることで、対応できます。下記以外のパッケージのバージョン確認は<a href="https://pycaret.gitbook.io/docs/get-started/installation#dependencies" target="_blank" rel="nofollow noopener noreferrer">公式のDependencies</a>をご覧ください。</p>
<div class="code-block-container"><pre><code>conda install -c conda-forge lightgbm
conda install numpy=1.21  -c conda-forge
conda install scikit-learn=0.23.2  -c conda-forge
</code></pre></div><table>
<thead>
<tr>
<th style="text-align:left">モジュール</th>
<th style="text-align:left">インポート方法</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:left">分類</td>
<td style="text-align:left">pycaret.classification</td>
</tr>
<tr>
<td style="text-align:left">回帰</td>
<td style="text-align:left">pycaret.regression</td>
</tr>
<tr>
<td style="text-align:left">クラスタリング</td>
<td style="text-align:left">pycaret.clustering</td>
</tr>
<tr>
<td style="text-align:left">異常検出</td>
<td style="text-align:left">pycaret.anomaly</td>
</tr>
<tr>
<td style="text-align:left">自然言語処理</td>
<td style="text-align:left">pycaret.nlp</td>
</tr>
<tr>
<td style="text-align:left">アソシエーション分析</td>
<td style="text-align:left">pycaret.arules</td>
</tr>
</tbody>
</table>
<h3 id="%E6%B3%A8%E6%84%8F">
<a class="header-anchor-link" href="#%E6%B3%A8%E6%84%8F" aria-hidden="true"></a> 注意</h3>
<p>LightBGMは、<a href="https://cocoinit23.com/mac-lightgbm-image-not-found/" target="_blank" rel="nofollow noopener noreferrer">MacのLightGBMでエラー image not found<br>
</a> で紹介されているように、Macの場合Homebrew・pipで入れてしまうと仮想環境下で入れたパッケージから見えなくなってしまい利用できないので、condaコマンドを使って入れなければいけないです。</p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>なんでかはわかりません。</p>
</div></aside>
<h1 id="%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E8%AA%AD%E3%81%BF%E8%BE%BC%E3%81%BF">
<a class="header-anchor-link" href="#%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E8%AA%AD%E3%81%BF%E8%BE%BC%E3%81%BF" aria-hidden="true"></a> データの読み込み</h1>
<p>よくある、ボストンの住宅価格のデータセットを使ってみると、</p>
<div class="code-block-container"><pre class="language-python"><code class="language-python"><span class="token comment"># パッケージの読み込み</span>

<span class="token keyword">import</span> pandas <span class="token keyword">as</span> pd
<span class="token keyword">from</span> pycaret<span class="token punctuation">.</span>regression <span class="token keyword">import</span> <span class="token operator">**</span><span class="token operator">*</span>
<span class="token keyword">from</span> pycaret<span class="token punctuation">.</span>datasets <span class="token keyword">import</span> get_data 

data <span class="token operator">=</span> get_data<span class="token punctuation">(</span><span class="token string">'boston'</span><span class="token punctuation">)</span>
</code></pre></div><p>として読み込むことができます。<br>
データ解析などで手持ちのデータを使いたい場合は、</p>
<div class="code-block-container"><pre class="language-python"><code class="language-python">data <span class="token operator">=</span> pd<span class="token punctuation">.</span>read_csv<span class="token punctuation">(</span><span class="token string">'****.csv'</span><span class="token punctuation">)</span>
</code></pre></div><p>とCSVファイルを読み込めば大丈夫です。</p>
<h1 id="%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%89%8D%E5%87%A6%E7%90%86">
<a class="header-anchor-link" href="#%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%89%8D%E5%87%A6%E7%90%86" aria-hidden="true"></a> データの前処理</h1>
<p>PyCaretを起動してデータの前処理を行います。</p>
<div class="code-block-container"><pre class="language-python"><code class="language-python"><span class="token comment"># PyCaretを起動</span>
exp1 <span class="token operator">=</span> setup<span class="token punctuation">(</span>data<span class="token punctuation">,</span> target <span class="token operator">=</span> <span class="token string">'medv'</span><span class="token punctuation">,</span> ignore_features <span class="token operator">=</span> <span class="token boolean">None</span><span class="token punctuation">)</span>

<span class="token comment">#　第一引数 : 読み込んだデータ</span>
<span class="token comment">#　第二引数 : 目的変数</span>
<span class="token comment">#　第三引数 : 除外する変数　（option）</span>
<span class="token comment">#　最後にnumeric_features　= ['カラム名']のような形で指定することでデータタイプを変更できます。</span>
</code></pre></div><p>setupの引数は非常に多いので、下記の記事が参考になるかと思います。<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__7b2a1c5e82ecb" src="https://embed.zenn.studio/card#zenn-embedded__7b2a1c5e82ecb" data-content="https%3A%2F%2Fqiita.com%2FAsagumo63%2Fitems%2F99357d4b472a9219040e%23%25E5%259B%259E%25E5%25B8%25B0-regression-pycaret20" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://qiita.com/Asagumo63/items/99357d4b472a9219040e#%E5%9B%9E%E5%B8%B0-regression-pycaret20" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://qiita.com/Asagumo63/items/99357d4b472a9219040e#回帰-regression-pycaret20</a></p>
<p>前処理が終われば、<strong>Enterを押して次に進めます</strong>。</p>
<h1 id="%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E8%A9%95%E4%BE%A1">
<a class="header-anchor-link" href="#%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E8%A9%95%E4%BE%A1" aria-hidden="true"></a> モデルの評価</h1>
<p>モデルの評価もPyCaretでは様々な評価指標を使って評価することができます。そのコマンドが、以下のコマンドです。</p>
<div class="code-block-container"><pre class="language-python"><code class="language-python"><span class="token comment"># モデルの比較</span>
compare_models<span class="token punctuation">(</span><span class="token punctuation">)</span>
</code></pre></div><aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>各性能がトップの部分は黄色であみがけされています。</p>
</div></aside>
<h1 id="%E3%83%91%E3%83%A9%E3%83%A1%E3%83%BC%E3%82%BF%E3%81%AE%E3%83%81%E3%83%A5%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0">
<a class="header-anchor-link" href="#%E3%83%91%E3%83%A9%E3%83%A1%E3%83%BC%E3%82%BF%E3%81%AE%E3%83%81%E3%83%A5%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0" aria-hidden="true"></a> パラメータのチューニング</h1>
<p>下記のようにパラメータを最適化することができます。</p>
<div class="code-block-container"><pre><code># Random Forestのモデルを作成
rf = create_model('rf')
tuned_rf = tune_model(rf, n_iter = 500, optimize = 'r2')

# n_iter : グリットサーチの回数
# optimize : 最適化の対象（損失関数）
</code></pre></div><h1 id="%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E5%8F%AF%E8%A6%96%E5%8C%96">
<a class="header-anchor-link" href="#%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E5%8F%AF%E8%A6%96%E5%8C%96" aria-hidden="true"></a> モデルの可視化</h1>
<p>以下にモデルの可視化によく使われるコマンドを列挙しておきます。</p>
<div class="code-block-container"><pre><code># 解析結果の確認
evaluate_model(tuned_rf)
</code></pre></div><p>これで出てくる選択肢から選択して行くと好きなプロットを作成することができます。</p>
<h1 id="%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E7%A2%BA%E5%AE%9A%E3%81%A8%E4%BA%88%E6%B8%AC">
<a class="header-anchor-link" href="#%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E7%A2%BA%E5%AE%9A%E3%81%A8%E4%BA%88%E6%B8%AC" aria-hidden="true"></a> モデルの確定と予測</h1>
<p>以下のようにモデルを確定し、予測することができます。</p>
<div class="code-block-container"><pre><code>#モデルの確定
final_rf = finalize_model(tuned_rf)
print(final_rf)
#未知なるデータを読み込みそれでテストを行う
test_data = pd.read_csv('test_data.csv')
test_data_predictions = predict_model(final_rf, data = test_data)
</code></pre></div><p>また、モデルの評価結果ですが、以下のようにしてダウンロードすることが可能です。</p>
<div class="code-block-container"><pre><code>#CSVファイルでダウンロードする
test_data.to_csv('test_data_preds.csv')
</code></pre></div><h1 id="%E5%8F%82%E8%80%83">
<a class="header-anchor-link" href="#%E5%8F%82%E8%80%83" aria-hidden="true"></a> 参考</h1>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__5999451fdab1b" src="https://embed.zenn.studio/card#zenn-embedded__5999451fdab1b" data-content="https%3A%2F%2Fpycaret.gitbook.io%2Fdocs%2F" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://pycaret.gitbook.io/docs/" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://pycaret.gitbook.io/docs/</a></p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e56a0d8fb28b" src="https://embed.zenn.studio/card#zenn-embedded__e56a0d8fb28b" data-content="https%3A%2F%2Fqiita.com%2Fshuhigashi%2Fitems%2F0fb37468e64c76f4b245" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://qiita.com/shuhigashi/items/0fb37468e64c76f4b245" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://qiita.com/shuhigashi/items/0fb37468e64c76f4b245</a></p>


PyCaretの使い方

必要なパッケージのインストール

zenn-content

Discussion