🍣

【Python】pandasを用いて、エクセルの特定文字が入ったセルの行番号を取得する方法

2024/07/22に公開

はじめに

pandasはデータ解析に強力なライブラリであり、Excelファイルの操作にも広く利用されています。今回は、pandasを用いて、Excelファイルの特定文字が入ったセルの行番号を取得する方法について解説します。

1. 事前準備

まず、pandasライブラリをインストールしていない場合は、以下のコマンドでインストールします。

pip install pandas

2. Excelファイルの読み込み

まず、pandasを使用してExcelファイルを読み込みます。以下の例では、example.xlsxというファイルを使用します。

import pandas as pd

# Excelファイルの読み込み
df = pd.read_excel('example.xlsx')

3. 特定の文字を含むセルの行番号を取得

ここでは、特定の列にあるセルに特定の文字列が含まれているかどうかをチェックし、そのセルの行番号を取得する方法を示します。例えば、2列目(0-indexedでは1列目)に「特定文字列」が含まれるセルを探すとします。

# 特定の文字列
search_string = '特定文字列'
# 特定の列番号
column_number = 1  # 0-indexedなので、Excelの2列目はPythonでは1列目

# 特定の列を抽出
column = df.iloc[:, column_number]

# 特定の文字列が含まれる行を検索
row_index = None
for idx, cell_value in enumerate(column):
    if search_string in str(cell_value):
        row_index = idx
        break

if row_index is not None:
    print(f"特定文字列が見つかった行番号: {row_index}")
else:
    print("特定文字列が見つかりませんでした。")

上記のコードでは、特定の列を抽出し、その列内で指定された文字列が含まれるセルを検索しています。見つかった場合、その行番号を出力します。

まとめ

pandasを使用してExcelファイル内の特定文字列を含むセルの行番号を取得する方法を説明しました。この手法は、特定の文字列を検索し、その文字列が含まれるセルの位置を特定するのに非常に有用です。pandasの強力なデータ操作機能を活用して、Excelファイルを効率的に操作しましょう。

Discussion