レシート買取アプリONEのデータで人気のお寿司を調べてみた
レシート買取アプリ ONE を開発運営している WED で、ML/DSをしている園芸係です。
最近は、LLM を使ったレシートの情報抽出の研究開発をしています。
さて、エンジニアの皆さんはお寿司をよく食べますか?私はよく食べます。
買い取ったレシートを使えば、人気のお寿司を調査することもできます。
ということで、私がよく行く寿司チェーンを調べてみました。
弊社で運用している BigQuery 上でのクエリは次のようになります。
なお値段の取得は OCR で失敗することもあり、中央値を見るようにしています。
SELECT
i.name,
fhoffa.x.median(ARRAY_AGG(price)) as price,
COUNT(receipt_item_id) as _count,
FROM `dmt.receipt_items` as i
JOIN `dmt.receipts` as r ON i.receipt_id = r.receipt_id
WHERE i.updated_at >= "2025-03-01" AND i.updated_at < "2025-04-01"
AND r.updated_at >= "2025-03-01" AND r.updated_at < "2025-04-01"
AND r.chain_name = $よく行く寿司チェーン
GROUP BY name
ORDER BY _count DESC
2025年3月の結果は次のようになりました。
順位 | 品目 | 値段 | 件数(約) |
---|---|---|---|
1 | 大切りまぐろ | 260 | 4700 |
2 | ガリ | 0 | 3200 |
3 | オニオンサーモン | 120 | 2100 |
4 | まぐろステーキ | 160 | 2000 |
5 | サーモン | 220 | 2000 |
6 | アボガドシュリンプ | 110 | 1700 |
7 | 大切り活け〆はまち | 110 | 1400 |
8 | あじ | 150 | 1400 |
9 | えび天巻 | 150 | 1400 |
10 | えび | 110 | 1200 |
それでは、実際に試食してみましょう。
1位の大切りまぐろです。値段は100円台ではなく260円なのですが、それでも人気です!
2位のガリ、無料ですが、食べていません。
3位のオニオンサーモンです。
4位のまぐろステーキです。とても美味しいです。
5位のサーモンです。美味しいです。
6位のアボガドシュリンプです。
7位の大切り活け〆はまちです。美味しいです。
8位のあじです。美味しいです。
9位のえび天巻です。見た目が楽しいです。
10位のえびです。
このように、ONE の分析機能を使えば、飲食店の売れ筋を調査することも可能となります。
さらに、月毎の変化を追うことで、施策の有無などを見ることも可能となります。
この表からは、施策などはなく、安定してまぐろが人気だったということが分かります。
順位 | 2025年1月 | 2025年2月 | 2025年3月 |
---|---|---|---|
1 | 大切りまぐろ | 大切りまぐろ | 大切りまぐろ |
2 | ガリ | ガリ | ガリ |
3 | まぐろステーキ | まぐろステーキ | オニオンサーモン |
4 | オニオンサーモン | オニオンサーモン | まぐろステーキ |
5 | サーモン | サーモン | サーモン |
また、2025年3月の他の同業チェーンと比較することで、共通点・違いを見ることもできます。
まぐろ、サーモンはどこのチェーンでも人気があることがわかる一方、チェーン毎の違いも表れており興味深いです。
順位 | 私がよく行く寿司チェーン | 他の寿司チェーンA | 他の寿司チェーンB |
---|---|---|---|
1 | 大切りまぐろ | まぐろ | 手焼き玉子焼き |
2 | ガリ | 甘酢生姜 | オーロラサーモン |
3 | オニオンサーモン | サーモン | えんがわ |
4 | まぐろステーキ | ねぎとろ軍艦 | 茶碗蒸し |
5 | サーモン | えび | いか |
6 | アボガドシュリンプ | びん長まぐろ | いくら軍艦 |
7 | 大切り活け〆はまち | サラダ軍艦 | とろたく細巻 |
8 | あじ | 茶碗蒸し | 本まぐろ5カンセット |
9 | えび天巻 | 天然やりいか | ねぎとろ軍艦 |
10 | えび | なっとう巻 | 中トロ |
簡単にではありますが、分析の例を見てきました。
このような分析を正しく行うには、日々レシートから安定して情報抽出する必要があります。
詳しい研究開発の内容については、ぜひ以下のブログをご覧ください。
Discussion