💽

Cloudflare Hyperdriveが10分に1度繋がらなくなったので調査+対処療法を考える

2024/10/30に公開

起こったこと

だいたい10分に一度繋がらなくなり、キャッシュをオフにしたりオンにしたり設定を変更すると、また10分ほどつながるようになる。

tl;dr

今までのHyperdriveを消して、再度作成し直すと直った(?)

ことの発端

2024-10-25にHyperdriveに新しい機能が追加され、VPCで守られているDBとの接続が可能になった。
合わせて、Hyperdriveを作成するときに、プライベートなDBかパブリックなDBかの選択ができるようになった。

同時に自分のサービスに使っていたHyperdriveが不安定になった。Metricsには動いている挙動がログに出ているので、Hyperdrive自体は動いている判定だったっぽい。Hyperdrive→Workersのどこかでコケている。Workersのエラーには出なかった。Timeoutになるばかり。

だいたい10分に一度繋がらなくなり、キャッシュをオフにしたりオンにしたり設定を変更すると、また10分ほどつながるようになる。

キャッシュの設定か?と思い、色々変えてみたが、効果なし。
結局再作成→今のところ問題なし。

再作成時、同じDBがすでに設定されているよ!とエラーになったのが少し気になった。これまでは、同じDB向けに設定されているHyperdriveを複数個作成可能だった。実際、2つ設定していた。

ここの例外処理が内々で新しく追加されて、それに弾かれる様になったため、不安定になったのかな?と思ったりした。

一旦、こんなこと起こったよはDiscordで報告済み。

新しく追加されたtunnel

https://blog.cloudflare.com/elephants-in-tunnels-how-hyperdrive-connects-to-databases-inside-your-vpc-networks/

教訓

Cloudflareのサービスは今のところ安かろう悪かろうなので、がちゃがちゃ言わずに、安くてありがとうと感謝すること。感謝が足りないと、ご機嫌ななめになる。

それはそれとして、外形監視はリソース使ってガチガチにすべき。Cloudflareの監視機能のみではなく、サードオピニオン的な存在がいる気がする。以上未来の自分へのメッセージ。

Discussion