🍊

[メモ] たくさんあるCSVファイルのヘッダーだけを出力するためのコード

2024/08/23に公開

概要

メモです。大量にあるファイルのうち一部でヘッダーがないCSVファイルが含まれていたようで,それをPythonコードで一気見できるようにしたくて,下記のようなコードを書きました。

コード

# 下記環境で動作確認
# # MacBook Pro (Apple M1 Pro)
# # Ventura 13.6
# # python 3.10.13

import os
import glob
import pprint

target_path = "ZZZ"
# 走査したいパスを指定する
files_unsorted = [os.path.basename(p) for p in glob.glob(target_path + "XXX*", recursive=True) if os.path.isfile(p)]
# target_path配下の文字列'XXX'を含むファイルの名前をリストアップする
files = sorted(files_unsorted)
# ファイル名をソートする
pprint.pprint(files)
# ファイル名のリストを表示する

for k in files:
    print(k)
    try:
        with open(target_path + k,"r") as f:
            lines = f.readlines()
        header = lines[0]
        # 一行目にあるべきヘッダーを出力する
        print(header)
    except:
        print('error')

参考リンク

https://note.nkmk.me/python-list-sort-sorted/

https://note.nkmk.me/python-glob-usage/

https://qiita.com/to-fmak/items/bff68b29a394249b0bab

Discussion