📈
GA4のpage_location (ページの場所) を正規化する
page_location の正規化がなぜ必要か?
- GA4 の page_location (ページの場所) ディメンションはURLのパラメータも含めて表示してしまい、各ページのアクセス数を単純集計するにもパラメータごとにページが分かれてしまう。
- 一度データをエクスポートしてExcelで集計する手間が発生し、分析がしにくい。
Universal Analyticsではどうであったか?
- Universal Analyticsには パラメータ削除の機能があった。
- GA4には同等の機能が存在しないため、計測時点でパラメータを排除した対応を行う必要がある。
対応方法
- GTMを用いて、計測時点で必要なパラメータだけを残して計測する手法がベター
- 手順
- Trim QueryのWhite Listで必要なパラメータだけ残した変数を作成
- jsessionid等がURLについている場合はGTMのJavaScript変数を用いてカットする
- ブログのtagパラメータや、サイト内検索のquery パラメータなど、日本語がURLエンコードされてる場合は、GTMのJavaScript変数で
decodeURIComponent
を用いて日本語変換する。 - 分析に利用する可能性があるパラメータの場合は、そのパラメータの値だけ抽出し、イベントパラメータとしてセットする。
- 上記を別のイベントパラメータで計測。
- page_location をそのまま上書きすると、GA4の計測にどう影響するか、影響範囲が読めないため、別パラメータとして計測することを推奨。
page_location 300文字の制限
- page_location の最大文字長は420文字までという制約がある。
- BigQueryエクスポートして後でパラメータ内容も含めて分析しようと考えている場合は、必要なパラメータ情報が文字数制限のために途中でトリミングされてしまう可能性もある。
- 分析に利用したいパラメータがある場合には、該当のパラメータ値をイベントパラメータ化することを推奨。
Discussion