🗂

Microsoft FabricのNotebookを使ってみる-④【PowerBI編】

2024/02/15に公開

やること

Titanicのデータを使い、データを視覚化する
今回は、PowerBIで可視化する
https://zenn.dev/headwaters/articles/90be9058404160
https://zenn.dev/headwaters/articles/b024e0ab10ace4

手順

  1. 下記のコードを実行する
df = spark.read.format("csv").option("header","true").load("Files/titanic/train.csv")
# df now is a Spark DataFrame containing CSV data from "Files/titanic/train.csv".
display(df)
  1. データを確認
  2. 下記のコードを実行する
table_name = "titanic"
df.write.mode("overwrite").format("delta").save("Tables/"+table_name)
  1. table配下にテーブルが作成されたことを確認
  2. 下記のコードを実行する
# Create a spark dataframe from a Lakehouse parquet table
sdf = spark.sql("SELECT * FROM Titanic.titanic LIMIT 1000")

# Create a Power BI report object from spark data frame
from powerbiclient import QuickVisualize, get_dataset_config
PBI_visualize = QuickVisualize(get_dataset_config(sdf))

# Render new report
PBI_visualize
  1. PowerBIのレポートが作成されたことを確認

備考

csvファイルでもPowerBIのレポート作成ができる

  1. 下記のコードを実行する
df = spark.read.format("csv").option("header","true").load("Files/titanic/train.csv")
# df now is a Spark DataFrame containing CSV data from "Files/titanic/train.csv".
# Create a pandas dataframe from a Lakehouse csv file
from powerbiclient import QuickVisualize, get_dataset_config

# Create a Power BI report object from your data
PBI_visualize = QuickVisualize(get_dataset_config(df))

# Render new report
PBI_visualize
  1. PowerBIのレポートが作成されたことを確認
ヘッドウォータース

Discussion