Chapter 17

Pandasで新しいdfの作成

poclabweb
poclabweb
2023.01.11に更新

6. 新しいdfの作成

任意の行を抽出して新しいdfを作成する。

df['compound_subclass'] == 2015で'compound_subclass'が2015に一致するものを取得します。その後、df[]で囲むことでdaraframeになっています。
また、df_2015 = にすると ['compound_subclass']が2015のデータのみが入っている新しいdataframeのdf_2015が作成されます。

df = df[df['compound_subclass'] == 2015]

任意の列だけ取り出して、新しいdfを作成する。

smilesとformulaという列だけの新しいデータフレーム(名前がdf2)を作成して表示させた例

df2 = df[['smiles', 'formula']]
df2.head(3)

以下の例では、smiles, molecular_weight, compound_subclassという列だけの新しいデータフレーム(名前がdf3)を作成して表示させた例になります。

df3 = df[['smiles', 'molecular_weight', 'compound_subclass']]
df3.head(3)

データをつないで新しいdfを作成する。

pd.mergeを用いると特定の dfどうしを結合して、新しいdfにすることができます。
先程作成したdf2とdf3を結合させて、新しいdf23というものを作成した例になります。

df23 = pd.merge(df2, df3)
df23.head(3)

以下が出力した結果。

mergeの方法には、色々とあるのでmergeするものに合わせて選択する。