通信障害から学ぶ教訓

2022年7月21日

 

みなさんこんにちは。
先日某キャリアにて大規模な通信障害がありましたが、
本日は“通信障害から学ぶ教訓”と題して、ユーザーでもできる対応策について考えてみましょう。

障害のおさらい

簡単にですが先日の通信障害についておさらいしましょう。
※ネットニュースや記者会見の内容から読み取れる範囲で記載しています。
ことの発端は、7/2未明に行われた全国通信網における古いルータを新しいルータに入れ替える作業中に起きた不具合でした。
この不具合により音声通信が数分間不通となったため、用意していた手順に沿って古いルータへ音声通信を切り戻す作業を行なったところ、VoLTE交換機に対し再接続要求が多く発生し輻輳が発生、またこの輻輳を解消するために行なった対応策によって加入者DBでも負荷が高くなり、データの不一致が起こる、といったさらなる障害へとつながりました。
現在は既に復旧していますが、障害時間は約86時間、影響範囲は幅広い範囲のユーザーで最大3915万回線と、国内最大規模の通信障害となりました。

ユーザーでもできる対策

では、今回のような障害の時にユーザーでできる対応策にはどのようなものがあるでしょうか?
今回のケースで言うと公衆電話利用といったことが推奨されていましたが、現在その数も少なくなっているため、あまり効果的とは言えないかもしれません。
そのため私は、「 “デュアルSIM”で回線を複数確保する」という対応策をおすすめします。
デュアルSIMとはその言葉が示す通り、2個のSIMをスマートフォンに入れておいて、片方の回線が使えない時には、もう片方の回線を使用できるようにすることです。
SIMはそれぞれ別々の会社にする必要がある、対応していない機種もある、等も懸念点としてありますが、1台のスマートフォンで冗長性が担保できるというメリットは大きいと思います。
また、今回のような障害の際でも公共Wi-Fi環境等では、インターネットの利用ができますので、IP電話の検討もいいと思います。
ただし、IP電話は緊急電話が利用できないなどのデメリットもあるため、事前に対処方法も検討しておきましょう。

最後に

私もいちインフラエンジニアとして、今回の件は自分ごとのようにヒヤヒヤして見ていました。
また、「計画や準備は絶対に手を抜かないようにしよう。」と再認識すると共に、「今のやり方でお客様の安心・安全が担保できるだろうか。」と改めて考えるきっかけとなりました。
みなさんも今回の件を教訓として捉えていただき、本ブログも参考にしていただきながら、いざという時の備えを考えられてみてはいかがでしょうか?

サービス一覧
ITマネジメント

ITサービス(IT管理)

社内のIT運用をしっかりと管理する仕組み作りをお手伝いします

ITマネジメント

ITプラットフォーム

無停止サーバーやクラスターの導入でITを止めないシステムを