GoogleSearchConsoleのインデックス登録で、「アクセス禁止(403)が原因でブロックされました」となった時、確認すること
IVRyのBEエンジニアの島筒です。
先日、GoogleSearchConsoleのインデックス登録で失敗して、ちょっとハマったので、記事にしてみました。
なぜ、この記事を残したか
前述の通り、GoogleSearchConsoleでのインデックス登録に失敗したのですが、Cloudfrontの「地理的ディストリビューションの制限」の設定が起因しており、気付くまでに時間がかかったので、備忘録として記事に残しました。
GoogleSearchConsoleのインデックス登録時のエラー起因について
「アクセス禁止(403)が原因でブロックされました」エラーは、IPアドレス制限が起因していることがほとんどです。
IPアドレス制限以外に、設置されたURLのファイルに読み取り権限がないや、apacheなどのWebサーバなどの設定が関係している可能性もありますが、本投稿ではAWS上の設定に関係したエラー起因に着目しています。
また、アクセス禁止に関連するIPアドレス制限以外のエラーメッセージは、「robots.txt によってブロックされました」「noindex タグによって除外されました」のようにわかりやすいメッセージになっています。
IPアドレス制限に関係する確認すべきAWSサービス
- WAF & Shield
- ALBに設定されているセキュリティグループ(ALBを利用している場合に限る)
- ALBに設定されているリスナー(ALBを利用している場合に限る)
- Cloudfrontのコンテンツの地理的ディストリビューションの制限(Cloudfrontを利用している場合に限る)
WAF & Shield
Web ACLsのルールを確認
ALBに設定されているセキュリティグループ
ALBのセキュリティグループのソース(送信元)を確認
ALBに設定されているリスナー
ALBのリスナー設定の送信元IPを確認
Cloudfrontのコンテンツの地理的ディストリビューションの制限
Cloudfrontの地理的ディストリビューションの制限を確認
帰着
ちょっと考えれば当たり前のことなんですが、国外のアクセスを拒否すると、Googleのcrawlerのアクセスまで拒否していました。
Googleのページのインデックス登録は、申請からクロールまで数日かかるので、こういった問題で登録が遅延するのは、辛いですね。
IVRyでは、エンジニアが足りていません
IVRy、どんどん伸びています。
でも、エンジニアが足りません、マーケもセールスもディレクタもデザイナも足りていません。
皆さまのご応募お待ちしております!
ちょっと気になるなと思った方、カジュアルに面談もお待ちしています。
Discussion