🤖

QNAP Qhora-301W で原因不明の瞬断が起きた場合の対処について

2024/12/06に公開

要約

  • QNAP製のルータでVLANを切るのをやめましょう。
    • ソフトウェアのバグとしか思えない挙動のエラーログをはき続けます。
  • 2.4.x -> 2.3.3.005 にダウングレードしましょう
    • VLANをやめても、今度はログに残らない瞬断が変わらず発生します。
  • [12/09追記] MacはAVB/EAVモードを解除しましょう

背景

QNAP Qhora-301W という、Wifiルータがある。
2020年末の発売当時では珍しい「10GbE LAN 2ポート + Wifi6対応」という未来を先取りした仕様で、Wifiが廃れても有線環境の方は壊れるまでは使い続けられそうなので、思い切って購入した。

年に1〜2回ファームウェアの更新をかけつつも、2024年末の現在に至るまで(細かなソフトウェア上の制約・スループットのUpperlimitなどには多少文句を言いながらも)安定動作をしていたため、買い換えることなく安心していた。

ーーが、直近のアップデートを適用したところ、ネットワークの特定ポートだけ瞬断を頻発するようになり、調査することになった。

環境

  • au ひかり 5G契約 と 10GbEポート付きONUルータ
    • 所謂プロパイダ貸し出しのそれ。
    • DMZを設定して、スルーする設定にしている。
  • QNAP QHora-301W
    • 自宅のメインルータ
    • 自室は仕事等を考慮し、LAN環境としてVLANを切っている
      • ちなみに QHoraでVLANを切ると思った以上にネットの速度が出なくなる。それを 2.5GbE帯域の物量でカバー。
    • それ以外はデフォルト状態として領域を振っている。
  • Planex FX2G-05EM
    • 2.5GbE スイッチ。自室にLANを通した先で展開する。

現象

自室に割り当てたVLAN環境下でのネットワーク瞬断。
しかも30分程度おきに発生するため、スタンド攻撃を受けていることに気づくのが遅れた!
音声会議で突然ブチっと抜けて、とっても恥をかいた!!!

そのため、通常のネットブラウジングなど、通信が非同期である場合は特に問題がない。動画再生もバッファリングが効くためあまり影響がでない。
ダウンロードなども、数秒程度だと自動的に待機→リトライの流れになるため、本当にワンショットの特殊なダウンロード作業でもない限り問題が表面化しにくい。

明確に障害となるのが音声通話。SlackやZoom、Meetなどなどのそれ。
こちらの音声は届かず、向こうが何話しているかもわからなくなる。

Wifiに接続された全ての機器は問題なく動作している、はず。(理由は後述)
同様に、VLANに繋いでいない他の有線LANの領域も正常動作している、はず。

調査

こういうときは、まず順を追って原因を切りわけないといけない。

今回のようなケースは、原因がどれか明確でないため、どこから手を付けても良い。とにかく原因になりそうな箇所は片っ端から見ていく必要がある。

調査1

まず、わかりやすいところから。

  1. スイッチングハブが原因?
    • ハブの劣化によって、ルータと繋がっているLANポートが壊れている可能性。
    • しかし、他のLANポートに繋いだ場合も同様の瞬断が発生した。スイッチングハブを取り外して直接マシンに繋いでも同様だった。
    • これは犯人候補から外れた。
  2. 接続経路のLANポートの接触不良?
    • 経路上のLANケーブルやコネクタが劣化している可能性。
    • 全て差し直したりしたが、瞬断は変わらなかった。ここに関してはまだ犯人候補として残る。
  3. ルータのログを見る
    • ルータのログを見ると、特定のポートが瞬断していることがわかった。
      • e.g.) 2024-12-31 12:34:56 [ERROR] Port 3 Link Down2024-12-31 12:34:56 [ERROR] Port 3 Link Up が数回繰り返される感じ。
    • しかし、ログには原因が特定できるような情報はない。ただ、瞬断が発生していることだけが記録されている。
  4. ルータの物理ポートが損傷?
    • ルータのLANポートが損傷している可能性。
    • 他のLANポートに繋いだ場合もなぜか同様の瞬断に関するエラーログが出力された。
      • e.g.) 2024-12-31 12:340:56 [ERROR] Port 4 Link Down2024-12-31 12:40:56 [ERROR] Port 4 Link Up が数回繰り返された。

以上のことから

  • スイッチングハブが原因ではない
  • ルータの物理ポートが損傷している可能性は低い
  • 経路上の問題は残る

という結論に至った。

調査2

条件を変えて再調査した。

  1. 経路上のLANケーブルを総取っ替えしてみる。
    • まだ瞬断が発生する。
  2. Wifi 上での通信はどうか?
    • Wifi での通信は問題ない。
    • これは、経路上の問題ではないことを示している。

以上のことから次の仮説を立てた。

  • ルータのVLAN設定が原因ではないか?

調査3 : ルータをいじる

ルータの設定側に問題があるのかを調査する。

  1. VLANを切ってみる
    • VLANを切ってデフォルト状態の領域に各マシンのIP設定を参加させてみる。
    • すると、瞬断の「エラーログ」は出なくなった。
    • しかし、瞬断自体は変わらず発生している。なんだこれ。
      • ということは、VLANとか関係なくルーターに繋いでいる全て瞬断をくらっている可能性が高そう。
      • 単純に、直近でオンライン通話とかしているのが自室だけだっただけなのでは。
  2. ファームウェアをダウングレードしてみる
    • 2.4.x最新 -> 2.3.3.005 という更新前のマイナーバージョンにダウングレードしてみる。
      • ダウングレードとなるため、各種設定のバックアップを持ち越すことができないので、手動で設定を再構築する必要がある。手間!
      • だけど、そもそもダウングレードを許可した作りになっていた非常に助かる。国内の有名どころだと、謎に対策されてて戻せなかったりする。
    • もちろんVLANも設定せずの状態に手動で復元したところ、瞬断と思われる現象は一旦発生しなくなった。

以上のことから、ファームウェアの問題と思われる、という結論に至った。

考察

VLAN自体が不安定だというところに、ハズレのファームウェアに更新したことのコンボによって、超めんどくさい状況に追い込まれてしまった。

ただ、なんでVLANを切った時だけエラーログが出ていたのか。疑問として残っている。
ファームウェアが稚拙な挙動をしているのは間違いないが、デフォルト領域で瞬断した場合、直接末端のマシンのIP情報が飛ぶので、もしかしたらマシン側のログには何か残っているのかもしれない。(未調査)

そもそも、30分程度おきに瞬断が発生するなんて症状は、開発者/テスター目線で言えばテストケースとして盛り込まれない、非常に難しい/厄介なケースと思うし、そういう症状(バグ)が存在することを知っている前提じゃないとテストケースに含まないタイプのそれ。
実際、手元で再現テストを行いたいものの、そのためには30分程度音声通話を続ける必要があるため、非常に手間がかかるうえ、何を持って改善したかの判断が難しい。金もらってテストする側からしたら、エビデンスが曖昧で通すのに一苦労しそう。
(しかも、今回はすでにVLANを解除したせいでエラーログにも出なくなってしまったので、本当に難しいなと思う)

対策

  • 一旦バージョン固定で運用する
    • セキュリティが地味に怖いが、瞬断が発生するのはもっと怖いので、一旦はこのまま運用する。
  • QNAPに問い合わせる
    • この問題が既知のバグであるかどうか、一応フィードバックとして報告を行う。
    • ただし、QNAPのサポート(は困っているユーザーを放置することでたまに話題になるため、その手の)には、あまり期待はしていない。
  • 他のルータを検討する
    • もし、これでやはり安定せず瞬断が再発した場合、たった4年程度での経年劣化だったと評価する必要がある。
    • そのときはQNAPはもう金輪際買うことはないだろう。

一応テスト(なんでここまでせんといかんの)

  1. Google Meet に スマホ+音源で延々と音声を垂れ流しておく
  2. 現象が起きていた自室のPC から Meetにつなぎ、Meetごしに流れる音声を再生しつづける。
    1. このとき、自室のPC は自室のLANに繋いでおく
    2. 更に、ネットワーク設定と下りの通信のモニターアプリ等で、瞬断が発生した際にどうなるかを確認する。
  3. 30分程度待ち、音声が途切れたり、ネットワーク設定が未通信状態になっていたりしないか、確認する。
    1. 何事もなければ、QNAPのファームウェアが原因であると判断する。

終わりに

実は本当にコレで改善したかわからない。
もしかしたら、auひかりから提供されている光ファイバーが断線しかけていて、根本的にネットワークが不安定である可能性は捨てきれない、とかそういうこともあるかもしれない。
(って言っておきながらWAN側の通信状態監視してそういうことではないことは確認済み。出ている数値が嘘でない限りはね...)

とりあえず、今時点でこれでやっとなんとかなりそうなので、このまま運用していく。

もし、瞬断が発生したらすぐに記事を更新するので、そのときはまたお会いしましょう。

12/04 追記:おいコラMac💢💢💢

宅内のネットワークがある程度安定したと思った矢先、メインのMac(M2 Max)だけなぜか瞬断が続いてている。

原因は、イーサネット設定で「AVB/EAVモード」をオフっていたはずなのに、OSのアップデートの際に勝手に有効に戻されており、それが平行して悪さをしていたというなんという極悪非道。
補足すると、M2チップでは有線LANのAVB/EAVモードが接続不安定を呼び起こす最悪な欠陥があり、それが広く知られている。そのため、購入時には明示的にOFFっていたわけで。
(ちなみにQhoraがAVB/EAV関係の信号を受けるとリンクダウンするってことは・・・ないよね???信じて良いよね???そうだったら前提が全部覆るんだけど・・・)

何はともあれ、再設定したら メインの Mac でも安定して通信ができるようになった。
なんだかなぁ。

Discussion