NTT DATA TECH
📘

ChatGPTに“正しく読ませる”ためのファイル活用ガイド

に公開

この記事は「ビギナーズ Advent Calendar 2025」の5日目の記事です。


— ファイル形式でここまで変わる。“ちゃんと読ませる”ための実践知 —

はじめに

ChatGPT を業務で活用しようとすると、「ファイルを正しく読んでくれない」 という壁にぶつかることがあります。

  • 資料をアップロードしても、意図と全然違う答えが返ってくる。
  • そもそもそのファイルを読めないといわれる。
  • ハルシネーション以前の問題?

——そんな問題は珍しくありません。

実はこれ、ChatGPT のファイルの扱い仕様を理解していないことが原因である場合が多いのです。

この記事では、ファイルを正しく読ませるための 3つの原則、そして 形式ごとにどう扱われるのか をわかりやすく整理します。

想定読者

  • ChatGPT Enterpriseを使い始めた
  • 実業務で利用するファイルをChatGPTに渡し、何か価値のあることをしてみたいと考えている
  • まずはChatGPTの通常のプロンプトにて、ファイルをうまく使ってみたい

※ChatGPTはライセンスにより挙動が異なります。本記事ではChatGPT Enterprise版を扱います。
※本記事は執筆時点である2025/11/20時点のOpenAI社公式ヘルプページの記載事項をもとに整理しています。
※この記事で紹介している内容は、通常プロンプトでのファイルアップロードを想定しています

やってみた

Excelで書いた業務フロー

手元に、勉強用に作成した、実案件に全く関係のない「Excel」がありました。
公開しても問題のない機密性は全くないものなので、チラ見せすると、
Excel上に、業務フローのようなものを書いている資料です。

業務フローをChatGPTに理解してもらえると、業務の改善ができそうですよね。
ぜひ理解してもらいたいものです。読んでもらいましょう。

ダメでした。
後半で頑張って一般論で回答をしようとしていますが、
「そもそも渡したファイルを読めていない」状態に見えます。

PDF化して再挑戦

全く同じExcelを、全シートを対象にPDF化して、ChatGPTに渡してみます。

こちらは、ファイルを読めていそうです!
もちろん、誤解や嘘が混ざっていないかハルシネーションチェックは必要です。
ですが、ファイル自体を読めていない、Excelより圧倒的進化に見えます。

ChatGPTでは、Excelは内部的にPythonベースの表データ解釈に回されるため、画像や複雑レイアウトを正しく扱えないことがあります。
PDF化するだけで、一気に挙動が変わるという理屈です。

実は、技術に長けている方からすると、基本の基本である話ではあるのですが、
生成AIがデータサイエンティスト以外の方にも当たり前に多数使われるようになった今、
この「ちょっとしたこと」で全然変わる事実は、正しく布教する必要があるのではと考えています。

ファイルの扱い方:3つの原則

OpenAI社公式のヘルプページを読むと、もっと具体的に記載しています。
ここからは、公式情報をもとに整理したファイルをChatGPT Enterpriseで扱う際の原則を記載します。Pro版などは仕様が異なるためご注意ください。

以下のOpenAI社公式ヘルプページをベースに整理しています。
Optimizing File Uploads in ChatGPT Enterprise

原則1:ファイルは“小さいほど”正しく理解される

ChatGPTは大きなファイルをそのまま全部読むのではなく、「一部はモデルの入力(短期記憶)」「残りは検索インデックス」に振り分けられます。
ファイルサイズにより、処理が変わることを理解しておくといいでしょう。
一般的に、扱うテーマに集中した小さい文章を読み込ませるほうが、高い精度を得られるとしています。

原則2:ファイル形式により読み方が変わる

ChatGPTはファイル形式ごとに処理方式が異なります。
特に、Excelの扱いで混乱する人が多い印象です。

● テキスト系(pptx, docx, txt, md, xmlなど)

  • テキストベースの検索として利用されます。
  • 文中の画像は無視される、と公式ヘルプページには記載されています。

● PDF(文章+画像)

  • Enterprise版では、PDF内の文章と画像どちらも読み取り対象です(通常のプロンプトの場合)

● Excel / CSV

  • 自動的にAdvanced Data Analysis (旧称 Code Interpreter)で処理されます
  • コードベースで処理され、数値集計・グラフ生成は得意
  • 文章中心の表は誤読しやすい → PDF化等、形式変換を推奨

● 画像(png, jpeg)

  • 図表・スクショを読み取れる
  • 小さい文字・回転・非英語は精度低下

原則3:質問は“ひとつずつ”聞くと精度が上がる

1つの質問では検索できる回数に制限があるため、
複数テーマを同時に質問すると、検索漏れが起きやすい です。

❌ 一問多答でまとめて聞く

「早期退職・育児休暇・海外異動についてまとめて」

✔ トピックごとに分ける

  • 「早期退職だけ教えて」
  • 「育児休暇だけ教えて」
  • 「海外異動だけ教えて」
  • 「最後にまとめて」

まとめ

  • ChatGPTの精度は ファイルの渡し方次第で大きく変わる
  • ファイルは“小さく・分割して”渡すと精度が上がる
  • 形式によって処理内容が変わる
  • 大きい検索テーマは テーマ分割 → 最後に統合 が鉄則

最後に

ChatGPTの仕様は短期間で大きく変わるため、公式ヘルプの継続チェックが大事です。

また、本記事では取り上げていませんが、コネクタ機能など別の方法でファイルを利用する手段が存在します。
その場合はまた大きく仕様が異なるため、さらに次のステップに進みたい方は、ぜひ公式の情報を調べてみてください。


NTTデータによるChatGPT Enterprise活用支援

NTTデータでは、お客さまによるChatGPT Enterpriseの活用を最大化するために、ライセンスのご提供にとどまらず、導入支援から組織内での定着・活用拡大まで、一貫した伴走型のサポートをご提供しています。
詳細は以下をご覧ください。

OpenAI ChatGPT Enterprise活用支援

NTT DATA TECH
NTT DATA TECH
設定によりコメント欄が無効化されています