🙌
[Pandas] Seriesの使い方
Seriesとは
Pandasでは1次元のデータを扱うSeries
2次元のデータを扱うDataFrameを用いてデータ加工をしていきます。
今回はこのSeriesの扱い方について勉強したので、整理していきたいと思います。
Seriesは2種類のデータ型を扱うことができます。
・辞書型
・配列型
これらのデータ型のデータをSeriesとして扱うことができます。
辞書型のデータをSeriesで扱ってみる
PandasではSeries関数で辞書型のデータを扱うことができます。
import pandas as pd
fruits = {"snack": 200, "orange": 1000, "grape": 100}
print(pd.Series(fruits))
>>>出力結果
snack 200
orange 1000
grape 100
dtype: int64
dtypeはdata typeの略で、int64の略になります。
配列型のデータをSeriesで扱ってみる
配列型のデータもseriesのデータ構造で扱うことができます。
import pandas as pd
data = [10, 20, 30, 40, 50]
series = pd.Series(data)
# Seriesの表示
print(series)
>>>出力結果
0 10
1 20
2 30
3 40
4 50
dtype: int64
インデックス番号について
seriesで扱っているデータには1行ずつインデックスが振られます。
例えば以下のSeriesのデータで考えてみましょう!!
snack 200
orange 1000
grape 100
この場合snackにはインデックス番号0
orangeには1、grapeには2というインデックス番号が振られています。
このインデックス番号何に使うのかというと、Seriesからデータを取り出したいときに使用することができます。
series[始まりのインデックス:終わりのインデックス]でインデックスを指定してデータを抽出することができます。
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[0:2])
>>>出力結果
banana 3
orange 4
dtype: int64
DataFrameにSeriesのデータを追加する
DataFrameの行や列に対してSeriesの1行 or 1列をDataFrameに追加することができます。
例えば以下のようなコードで作成することができます。
import pandas as pd
# 既存のDataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# 追加するSeries
series = pd.Series([7, 8, 9])
# DataFrameにSeriesを追加
df['C'] = series
# DataFrameの表示
print(df)
>>>出力結果
A B C
0 1 4 7
1 2 5 8
2 3 6 9
Discussion