🤖

AIの「知ったかぶり」を物理的に封じる!GeminiにCSVを正しく読み込ませるベストプラクティス

に公開

BABY JOB株式会社のtakokad です。

先日、GeminiにCSVファイルを読み込ませて分析をお願いした際、これまでにない「沼」にハマってしまいました。

事の発端は、シート内の列ごとの内容にばらつきがあったため、「粒度と基準を提案してほしい」と指示したところ、Geminiは 中分類(目的)小分類(手段・施策) という非常に的確で、満足のいく粒度を提案してくれました。
ここまでは「さすがGemini!」と感動していたのですが...

😫 30分間の「不毛な戦い」の始まり

その粒度で実際にデータを並び直すよう指示を出した途端、Geminiが 「それらしいけれど、実はデータにない内容(捏造・ハルシネーション)」 を回答し始めてしまったのです。

私は「件数が足りない、20行目以降にもデータはある、ちゃんと読んで!」と何度も修正をお願いしましたが、気づけば30分が経過。自分の指示方法に限界を感じ、Gemini自身に 「なぜ捏造したのか、どう指示すれば最初から正解だったのか」 を正直に分析してもらうことにしました。


🔍 なぜAIは「適当な回答」をしてしまうのか?

Geminiの自己分析によると、そこには生成AI特有の 3つのプロセスエラー が隠れていました。


✅ Gemini直伝!プロンプトの「ベストプラクティス」

この失敗を踏まえ、AIの「知ったかぶり」を物理的に封じ、正確な出力を得るための最強のプロンプト構成がこちらです。

推奨プロンプト

このCSVファイルを、**必ずPython(コードインタープリター)を使って**読み込んでください。

1. まず、**データが入っている行数**をカウントして教えてください。
2. その上で、実際に記入されているデータのみを抽出して一覧表を作成してください。
3. ファイルに書かれていない内容は、**絶対に推測で追記しないでください**

この指示が有効な理由

  • 「Pythonを使って」: 曖昧な言語処理ではなく、正確な計算機(プログラム)の使用を強制することで、見えていない行を推測することを物理的に不可能にします。
  • 「行数をカウントして」: 最初に「全何行か」という事実を確定させることで、その後の出力でデータが勝手に増減する矛盾を防げます。
  • 「推測しないで」: AIの「気を利かせて補完しようとする機能」を明示的にオフにできます。

🤝 迷ったら「壁打ち」でベストプラクティスを生成しよう!

「毎回こんな細かい指示を考えるのは大変…」と思った方は、ぜひ 「壁打ちプロンプト」 を活用してください。

「今から〇〇をしたいのですが、正確な回答を得るためのベストプラクティスに基づいた質問を私にしてください」

とAIに丸投げすれば、AIが「役割」や「必要な手順」を逆質問してくれるので、それに答えるだけで格闘不要のプロンプトが完成します。

ただし、いくらベストプラクティスなプロンプトを生成したとしてもAIが出力した内容は、最後は人間が責任を持って確認する必要があります。


🔐 データの秘匿性について

こうしたデータ分析をAIで行う際は、データの秘匿性に十分注意しましょう。
Geminiをはじめとする生成AIにファイルをアップロードする場合、個人情報や機密情報が含まれていないか、必ず事前に確認してください。

もし機密データを扱う必要がある場合は、事前に個人を特定できる情報を削除(マスキング)するか、社内で許可されたセキュアな環境(Enterprise版など)を利用することを強く推奨します。


✨ 最後に

AIとの格闘は、AIの「特性」を理解するための第一歩です。
思考(ロジックの提案)は優秀でも、データの扱いには特有のクセがあります。

今回ご紹介したベストプラクティスを味方につけて、明日からはスマートに、そして正確にAIを使いこなしていきましょう!🌈

BABY JOB  テックブログ

Discussion