🙌

[Pandas] Seriesの使い方

2023/06/24に公開

Seriesとは

Pandasでは1次元のデータを扱うSeries
2次元のデータを扱うDataFrameを用いてデータ加工をしていきます。
今回はこのSeriesの扱い方について勉強したので、整理していきたいと思います。

Seriesは2種類のデータ型を扱うことができます。
・辞書型
・配列型
これらのデータ型のデータをSeriesとして扱うことができます。

辞書型のデータをSeriesで扱ってみる

PandasではSeries関数で辞書型のデータを扱うことができます。

import pandas as pd

fruits = {"snack": 200, "orange": 1000, "grape": 100}

print(pd.Series(fruits))

>>>出力結果
snack      200
orange    1000
grape      100
dtype: int64

dtypeはdata typeの略で、int64の略になります。

配列型のデータをSeriesで扱ってみる

配列型のデータもseriesのデータ構造で扱うことができます。

import pandas as pd

data = [10, 20, 30, 40, 50]

series = pd.Series(data)

# Seriesの表示
print(series)

>>>出力結果
0    10
1    20
2    30
3    40
4    50
dtype: int64

インデックス番号について

seriesで扱っているデータには1行ずつインデックスが振られます。
例えば以下のSeriesのデータで考えてみましょう!!

snack 200
orange 1000
grape 100

この場合snackにはインデックス番号0
orangeには1、grapeには2というインデックス番号が振られています。

このインデックス番号何に使うのかというと、Seriesからデータを取り出したいときに使用することができます。

series[始まりのインデックス:終わりのインデックス]でインデックスを指定してデータを抽出することができます。

import pandas as pd

fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)

print(series[0:2])

>>>出力結果
banana    3
orange    4
dtype: int64

DataFrameにSeriesのデータを追加する

DataFrameの行や列に対してSeriesの1行 or 1列をDataFrameに追加することができます。
例えば以下のようなコードで作成することができます。

import pandas as pd

# 既存のDataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 追加するSeries
series = pd.Series([7, 8, 9])

# DataFrameにSeriesを追加
df['C'] = series

# DataFrameの表示
print(df)

>>>出力結果
   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9

Discussion