レシート買取アプリONEのデータで人気のお寿司を調べてみた
レシート買取アプリ ONE を開発運営している WED で、ML/DSをしている園芸係です。
最近は、LLM を使ったレシートの情報抽出の研究開発をしています。
さて、エンジニアの皆さんはお寿司をよく食べますか?私はよく食べます。
買い取ったレシートを使えば、人気のお寿司を調査することもできます。
ということで、私がよく行く寿司チェーンを調べてみました。
弊社で運用している BigQuery 上でのクエリは次のようになります。
なお値段の取得は OCR で失敗することもあり、中央値を見るようにしています。
SELECT
i.name,
fhoffa.x.median(ARRAY_AGG(price)) as price,
COUNT(receipt_item_id) as _count,
FROM `dmt.receipt_items` as i
JOIN `dmt.receipts` as r ON i.receipt_id = r.receipt_id
WHERE i.updated_at >= "2025-03-01" AND i.updated_at < "2025-04-01"
AND r.updated_at >= "2025-03-01" AND r.updated_at < "2025-04-01"
AND r.chain_name = $よく行く寿司チェーン
GROUP BY name
ORDER BY _count DESC
2025年3月の結果は次のようになりました。
| 順位 | 品目 | 値段 | 件数(約) |
|---|---|---|---|
| 1 | 大切りまぐろ | 260 | 4700 |
| 2 | ガリ | 0 | 3200 |
| 3 | オニオンサーモン | 120 | 2100 |
| 4 | まぐろステーキ | 160 | 2000 |
| 5 | サーモン | 220 | 2000 |
| 6 | アボガドシュリンプ | 110 | 1700 |
| 7 | 大切り活け〆はまち | 110 | 1400 |
| 8 | あじ | 150 | 1400 |
| 9 | えび天巻 | 150 | 1400 |
| 10 | えび | 110 | 1200 |
それでは、実際に試食してみましょう。
1位の大切りまぐろです。値段は100円台ではなく260円なのですが、それでも人気です!

2位のガリ、無料ですが、食べていません。
3位のオニオンサーモンです。

4位のまぐろステーキです。とても美味しいです。

5位のサーモンです。美味しいです。

6位のアボガドシュリンプです。

7位の大切り活け〆はまちです。美味しいです。

8位のあじです。美味しいです。

9位のえび天巻です。見た目が楽しいです。

10位のえびです。

このように、ONE の分析機能を使えば、飲食店の売れ筋を調査することも可能となります。
さらに、月毎の変化を追うことで、施策の有無などを見ることも可能となります。
この表からは、施策などはなく、安定してまぐろが人気だったということが分かります。
| 順位 | 2025年1月 | 2025年2月 | 2025年3月 |
|---|---|---|---|
| 1 | 大切りまぐろ | 大切りまぐろ | 大切りまぐろ |
| 2 | ガリ | ガリ | ガリ |
| 3 | まぐろステーキ | まぐろステーキ | オニオンサーモン |
| 4 | オニオンサーモン | オニオンサーモン | まぐろステーキ |
| 5 | サーモン | サーモン | サーモン |
また、2025年3月の他の同業チェーンと比較することで、共通点・違いを見ることもできます。
まぐろ、サーモンはどこのチェーンでも人気があることがわかる一方、チェーン毎の違いも表れており興味深いです。
| 順位 | 私がよく行く寿司チェーン | 他の寿司チェーンA | 他の寿司チェーンB |
|---|---|---|---|
| 1 | 大切りまぐろ | まぐろ | 手焼き玉子焼き |
| 2 | ガリ | 甘酢生姜 | オーロラサーモン |
| 3 | オニオンサーモン | サーモン | えんがわ |
| 4 | まぐろステーキ | ねぎとろ軍艦 | 茶碗蒸し |
| 5 | サーモン | えび | いか |
| 6 | アボガドシュリンプ | びん長まぐろ | いくら軍艦 |
| 7 | 大切り活け〆はまち | サラダ軍艦 | とろたく細巻 |
| 8 | あじ | 茶碗蒸し | 本まぐろ5カンセット |
| 9 | えび天巻 | 天然やりいか | ねぎとろ軍艦 |
| 10 | えび | なっとう巻 | 中トロ |
簡単にではありますが、分析の例を見てきました。
このような分析を正しく行うには、日々レシートから安定して情報抽出する必要があります。
詳しい研究開発の内容については、ぜひ以下のブログをご覧ください。
Discussion