👩‍💻

言語処理100本ノック 2020 (Rev 2) 第2章: UNIXコマンド 11. タブをスペースに置換

2023/01/07に公開約900字

問題

11. タブをスペースに置換

タブ1文字につきスペース1文字に置換せよ.確認にはsedコマンド,trコマンド,もしくはexpandコマンドを用いよ.

solution11.py
import pandas as pd

df = pd.read_csv('chapter02/popular-names.txt', sep='\t', header=None)
df.to_csv('chapter02/solution11.txt', sep=' ', index=False, header=None)
solution11.txt
Mary F 7065 1880
Anna F 2604 1880
Emma F 2003 1880
Elizabeth F 1939 1880
Minnie F 1746 1880
solution11.sh
expand -t 1 popular-names.txt | head -n5 
output
Mary F 7065 1880
Anna F 2604 1880
Emma F 2003 1880
Elizabeth F 1939 1880
Minnie F 1746 1880

新規のcsv, txtファイルを作成したり、既存のcsvファイルに追記したりしたい場合は、to_csv()メソッドを使います。区切り文字は引数sepで指定します。この問題では、タブ文字\tではなく、半角空白を指定します。

https://github.com/kurokawa5/nlp100_2020/blob/main/chapter02/solution11.py

参考記事

第2章: UNIXコマンド
pandasでcsvファイルの書き出し・追記(to_csv)

Discussion

ログインするとコメントできます