💬

Microsoft FabricのNotebookでmlflowを使ってみる-①

2024/02/23に公開1

やること

mlflowを用いて、modelを作成し保存してみる。

手順

  1. Microsoft Fabric(https://app.fabric.microsoft.com/home)にアクセス
  2. 「Synapse Data Engineering」をクリック
  3. 「ワークスペース」をクリック

    4.作業を行うワークスペースをクリック

    5.「+新規」をクリック

    6.「ノートブック」をクリック

    7.ノートブックが開くことを確認
  4. 下記のコードをコピーし、notebook上で実行する
import mlflow
import numpy as np 
import pandas as pd    
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
import matplotlib.pyplot as plt

from sklearn.datasets import fetch_california_housing
data = fetch_california_housing(as_frame=True)
x = data.data
y = data.target
x_train,x_test,y_train,y_test = train_test_split(x,y)

mlflow.set_experiment("mlflow_test")

from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import accuracy_score
from math import sqrt
from mlflow.models import infer_signature

with mlflow.start_run() as run:
    knn = KNeighborsRegressor(n_neighbors=5,leaf_size=10)
    knn.fit(x_train,y_train)
    score_train = knn.score(x_train,y_train)
    score_test = knn.score(x_test,y_test)
    mlflow.log_metric("r2_train",round(score_train,3))
    mlflow.log_metric("r2_test",round(score_test,3))
    y_pred = knn.predict(x_test)
    mlflow.log_metric("RMSE",round(sqrt(mean_squared_error(y_test,y_pred)),3))
    mlflow.log_params(knn.get_params())
    mlflow.sklearn.log_model(knn,"knn-model",signature=infer_signature(x_train,y_train))
    mlflow.register_model(f"runs:/{run.info.run_id}/knn-model", "model-houseing-cost")

  1. 「mlflow_test」をクリック
  2. 開かれたことを確認
  3. 「保存」をクリック
  4. 下記のパラメータを入力し、「保存」をクリック

次回

保存したモデルをFabric内でどのように使えるのかを検証する

ヘッドウォータース

Discussion

まっきーまっきー

次回楽しみ!!
mlflowの他のと比較とか解説とかもあると嬉しいっす!