Amazon Keyspacesを試してみてる

create table gomi_log (
  created_on date,
  lat double,
  lng double,
  log_type int,
  created_at timestampuuid,
  user_name text,
  PRIMARY KEY (created_on, lat, lng, log_type, log_uuid)
);

primary key の先頭が partition key になる。
created_on をpartition key にして、lat, lng でソートするようにしたら、ある日の範囲内のレコード一覧が取れそう、というテーブル設計。

(最初キャメルケースでテーブル名やフィールド名を設定したら、ダブルクォーテーションで囲まないとフィールドやテーブル名を認識しなくてハマったのでスネークケースに変えた。初めて設計する人は気をつけてください。)

sasazuke

↓データ追加クエリ。

INSERT INTO gomi_map.gomi_log (created_on, lat, lng, log_type, created_at, user_name)
    VALUES (toDate(now()), 50.0, 100.0, 1, now(), 'naomi');

↓それでこういうクエリを実行してみた。

SELECT * FROM gomi_map.gomi_log
 where created_on = '2021-04-25'
   and lat >= 49.9 and lat <= 50.1
   and lng >= 99.9 and lng <= 100.1;

するとエラーになってしまった。
複数のclustering key への検索はできないらしい。

↓のクエリならclustering key を 1個だけ指定してるのでOK。

SELECT * FROM gomi_map.gomi_log
 where created_on = '2021-04-25'
   and lat >= 49.9 and lat <= 50.1

sasazuke

それでどうしようか悩んで考えてみて、以下のようなテーブル構成を思いついた。

create table gomi_lat (
  created_on date,
  lat double,
  log_uuid uuid,
  primary key (created_on, lat, log_uuid)
)

create table gomi_lng (
  created_on date,
  lng double,
  log_uuid uuid,
  primary key (created_on, lng, log_uuid)
)

create table gomi_log (
  created_on date,
  log_uuid uuid,
  user_name text
  log_type int,
  lat double,
  lng double,
  created_at timestamp,
  PRIMARY KEY (createdOn, log_uuid)
)

lat をclustering key にしたテーブル (gomi_lat) と、lngをclustering key にしたテーブル(gomi_lng)を追加した。gomi_log を保存したときには gomi_lat と gomi_lng にも保存する。

検索条件に指定された lat と lng を使って gomi_lat と gomi_lng から log_uuid を取得し、その積のlog_uuidを抽出する。
それを使って gomi_log から対象ログを抽出する。

sasazuke

↓こういう3段階のクエリで抽出する。

select * from gomi_map.gomi_lat
  where created_on = '2021-04-25'
    and lat >= 49.9
    and lat <= 50.1;

select * from gomi_map.gomi_lng
  where created_on = '2021-04-25'
    and lng >= 99.9
    and lng <= 100.1;

select * from gomi_map.gomi_log
  where created_on = '2021-04-25'
    and log_uuid in (c37d661d-7e61-49ea-96a5-68c34e83db3a);

sasazuke

このクエリを試してみたが、 in句がサポートされてないということで3番目のクエリがエラーになった。
色々制限があるんやな。

じゃあしょうがないから1件ずつ取って来るのがいいのかな。

select * from gomi_map.gomi_log
  where created_on = '2021-04-25'
    and log_uuid = c37d661d-7e61-49ea-96a5-68c34e83db3a;

これなら通った。

sasazuke

これで一応位置の範囲内検索が実現できた。

けどこれが良い設計なのかはよくわからない。
詳しい人に教えてほしい。