👩‍💻

言語処理100本ノック 2020 (Rev 2) 第2章: UNIXコマンド 13. col1.txtとcol2.txtをマージ

2023/01/07に公開約900字

問題

13. col1.txtとcol2.txtをマージ

12で作ったcol1.txtとcol2.txtを結合し,元のファイルの1列目と2列目をタブ区切りで並べたテキストファイルを作成せよ.確認にはpasteコマンドを用いよ.

solution13.py
import pandas as pd

df_col1 = pd.read_csv('chapter02/col1.txt', header=None)
df_col2 = pd.read_csv('chapter02/col2.txt', header=None)
df_merged = pd.concat([df_col1, df_col2], axis=1)
df_merged.to_csv('chapter02/solution13.txt', sep='\t', index=False, header=False)
solution13.txt
Mary	F
Anna	F
Emma	F
Elizabeth	F
Minnie	F
solution13.sh
paste col1.txt col2.txt | head -n 5
output
Mary	F
Anna	F
Emma	F
Elizabeth	F
Minnie	F

この問題では、pandas.concat()関数の使って複数のpandas.DataFrame, pandas.Seriesを連結(結合)します。縦方向、横方向いずれの方向に連結するかは引数axisで指定します。axis=1とすると縦横方向に連結します。

https://github.com/kurokawa5/nlp100_2020/blob/main/chapter02/solution13.py

参考記事

第2章: UNIXコマンド
pandas.DataFrame, Seriesを連結するconcat

Discussion

ログインするとコメントできます