📖

【Python】pandasを用いて、エクセルの特定文字が入ったセルの列番号を取得する方法

2024/07/22に公開

1. はじめに

pandasはデータ解析に強力なライブラリですが、Excelファイルの操作にも利用できます。今回は、pandasを用いて、Excelファイルの特定文字が入ったセルの列番号を取得する方法について解説します。
pandasを使用してExcelファイルを操作する際、特定の文字列を含むセルを検索することができます。本記事では、セルの値が固定値で、行番号も決まっているという前提条件のもとに、この操作を実現する方法を示します。

2. 事前準備

まず、pandasライブラリをインストールしていない場合は、以下のコマンドでインストールします。

pip install pandas

3. Excelファイルの読み込み

まず、pandasを使用してExcelファイルを読み込みます。以下の例では、example.xlsxというファイルを使用します。

import pandas as pd

# Excelファイルの読み込み
df = pd.read_excel('example.xlsx')

4. 特定の文字を含むセルの列番号を取得

ここでは、特定の行にあるセルに特定の文字列が含まれているかどうかをチェックし、そのセルの列番号を取得する方法を示します。例えば、5行目に「特定文字列」が含まれるセルを探すとします。

# 特定の文字列
search_string = '特定文字列'
# 特定の行番号
row_number = 4  # 0-indexedなので、Excelの5行目はPythonでは4行目

# 特定の行を抽出
row = df.iloc[row_number]

# 特定の文字列が含まれる列を検索
column_index = None
for idx, cell_value in enumerate(row):
    if search_string in str(cell_value):
        column_index = idx
        break

if column_index is not None:
    print(f"特定文字列が見つかった列番号: {column_index}")
else:
    print("特定文字列が見つかりませんでした。")

上記のコードでは、特定の行を抽出し、その行内で指定された文字列が含まれるセルを検索しています。見つかった場合、その列番号を出力します。

まとめ

pandasを使用してExcelファイル内の特定文字列を含むセルの列番号を取得する方法を説明しました。この手法は、特定の文字列を検索し、その文字列が含まれるセルの位置を特定するのに非常に有用です。pandasの強力なデータ操作機能を活用して、Excelファイルを効率的に操作しましょう。

Discussion