🐥
Microsoft FabricのNotebookを使ってみる-④【Notebook編】
やること
Titanicのデータを使い、データを視覚化する
今回は、前回LakehouseにアップロードしたTitanicのデータをNotebookで可視化する
手順
- 下記のコードを実行
df = spark.read.format("csv").option("header","true").load("Files/titanic/train.csv")
# df now is a Spark DataFrame containing CSV data from "Files/titanic/train.csv".
display(df)
- データを確認
- 「Chart」をクリック
- 「View option」をクリック
- 下記のパラメータを入力し、「Apply」をクリック
Configuration | 説明 |
---|---|
グラフの種類 | 関数では、棒グラフ、散布図、折れ線グラフなど、さまざまな種類のグラフがサポートされています。 |
Key | X 軸の値の範囲を指定します。 |
Value | Y 軸の値の範囲を指定します。 |
Series Group | 集約のグループを決定する。 |
Aggregation | 視覚化でデータを集約します。 |
-
データを可視化できる
-
下記のコードを実行する
display(df, summary=True)
- データの統計概要を確認できる
- nameを選択すると、概要の統計情報を確認できる
Discussion