🧊

AIO/LLMOについて調べました!

に公開

大AI時代になり、今後はSEOだけでなく、AIO/LLMOの対応が必要なのでは??
と話題あがり、何ができるのか調べました。

AIO??LLMO???

SEO(Search Engine Optimization)のAI版。AIOやLLMOと呼ばれています。
AIが参照する情報の最適化のことを指します。

試しに、ChatGPTやGeminiに、自社サービスについて質問してみましたが、全く自社サイトの情報は出て来ませんでした。
GA4の流入元集計でAIからかどうかを確認する事ができますが、1ヶ月で1人でした。

結論: 何すればいいの??

  • 基本**SEO対策と同じ!**です。
  • ただし、学習されないようオプトアウトも可能!

学習について

クローラーが来て、ページの内容を見て、信頼性のある情報かを判断し、
学習する/参照するという流れです。

AIが参照するデータソース

以下2つのパターンが考えられます。

  1. モデルの事前学習
    特定年までのデータをモデルが事前学習しています。

  2. リアルタイムでのweb検索
    chat等でのユーザーからの質問の回答生成時に、インターネット検索し、データを参照します。

AIクローラー

今回は、ChatGPT、Gemini、Claudeのクローラーについてまとめました。
(2025.11.15現在)

モデル/サービス 用途区分 User-Agent例 備考 公式ドキュメント
ChatGPT / OpenAI ユーザーリクエスト時(ブラウズ) ChatGPT-User/1.0 ブラウズ機能用。ユーザー指示でページ巡回。 Overview of OpenAI Crawlers
ChatGPT / OpenAI 学習用クローラ GPTBot/1.1 公開サイトを収集しモデル訓練に利用。robots.txt 制御可。
ChatGPT / OpenAI 検索インデックス用 OAI-SearchBot/1.0 検索体験向け巡回。ログインスキップ可。 Overview of OpenAI Crawlers
Claude / Anthropic ユーザーリクエスト時(ブラウズ) Claude-User ユーザー指示でWeb参照する UA。ログインスキップ用に利用可能。 公式によるUAの明言はなし。 ClaudeBot データ収集 FAQ
Claude / Anthropic 学習用クローラ ClaudeBot/1.0 学習用巡回。公開サイトを収集。
Claude / Anthropic 検索インデックス用 Claude-SearchBot/1.0 検索用巡回。ログインスキップ対象として利用可。 公式によるUAの明言はなし。 ClaudeBot データ収集 FAQ
Gemini / Google LLC 学習用クローラ/検索インデックス用 Googlebot/2.1 Geminiは Googlebot と同じUAで現れる。 Overview of Google crawlers and fetchers

学習データの範囲

全AIの仕様とは言えませんが、ChatGPTの説明には以下のような記載がありました。

We do not intentionally gather data from sources known to be behind paywalls or from the dark web. Additionally, we apply filters to remove material we do not want our models to learn from, such as hate speech, adult content, sites that aggregate personal information, and spam.

引用: How ChatGPT and our foundation models are developed | OpenAI Help Center

以下からは情報収集しない

  • 有料サービス
  • ダークウェブ

以下のような情報は学習前にフィルタリングされる

  • アダルトコンテンツ
  • ヘイトスピーチ
  • 個人情報
  • スパム

問題のあるデータは学習されないようになっているようですね。

しかし調べてみると、海賊版サイトから著作物を学習した事例もあり、、まだまだ問題はありそうです。
AI無断学習に2200億円!でも、本当の問題はもっと単純な話だった|AYAME

逆にAIに学習されたくない場合は??

AIによる学習のオプトアウトの方法も用意されています。
絵や漫画などの著作物のAI学習をしてほしくない、という場合に有用だと思います。
robots.txtでUAを指定し、クロールを許可しないようにすれば良いようです!

# Block major AI bots
User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: Claude-Web
Disallow: /

User-agent: Google-Extended
Disallow: /

検索用クローラーと学習用クローラーが別れている場合、検索には出してほしいけど、学習はされたくないというように細かく設定したいなら、UAごとに分けてDisallow設定をすれば良さそうです。

まとめ

  • 結局SEO対策!
  • 学習されない守ることも大事かも

Discussion