🐥

Microsoft FabricのNotebookを使ってみる-④【Notebook編】

2024/02/15に公開

やること

Titanicのデータを使い、データを視覚化する
今回は、前回LakehouseにアップロードしたTitanicのデータをNotebookで可視化する
https://zenn.dev/headwaters/articles/90be9058404160

手順

  1. 下記のコードを実行
df = spark.read.format("csv").option("header","true").load("Files/titanic/train.csv")
# df now is a Spark DataFrame containing CSV data from "Files/titanic/train.csv".
display(df)
  1. データを確認
  2. 「Chart」をクリック
  3. 「View option」をクリック
  4. 下記のパラメータを入力し、「Apply」をクリック
Configuration 説明
グラフの種類 関数では、棒グラフ、散布図、折れ線グラフなど、さまざまな種類のグラフがサポートされています。
Key X 軸の値の範囲を指定します。
Value Y 軸の値の範囲を指定します。
Series Group 集約のグループを決定する。
Aggregation 視覚化でデータを集約します。
  1. データを可視化できる

  2. 下記のコードを実行する

display(df, summary=True)
  1. データの統計概要を確認できる
  2. nameを選択すると、概要の統計情報を確認できる
ヘッドウォータース

Discussion