« 1月後半に気になったこと | トップページ | 青梅マラソン・スタート付近 »

2012年2月15日 (水)

auの通信障害

 先日、docomoだけでなく、auにも通信障害があった。ひとつは、2月9日に起こったデータ通信障害。原因は「ネットワーク設備の故障」らしい。

 もう一回、2月11日には、メール送受信に関する通信障害が起こっている。こちらのほうは「ネットワーク内の通信設備(電源設備)の故障」が原因だと書いてあった。

 報道によると、この「故障」の原因については不明のままだが、原因は個々の設備が故障したことにあるので、先日のdocomoの障害とは異なる、ということである。ただ、「通信インフラの現状を無視してスマートフォンの契約を大量に増やした」という点ではdocomoとauに違いはないような気もするため、根本的な原因は実はdocomoの場合と同じではないか、という疑問を何となく持っている。

 そうやって考えていたら、ふと以前ブログでも紹介した「失敗百選」「続・失敗百選」の2つの本のことを思い出した。最近あまり見ていなかったが、久しぶりにこの本を開いて、似たような事例が載っていないかどうか調べてみることにした。

 とりあえず見つけたのは「しんきんATMが1日間使用不能(2002)」(続・失敗百選 P.153)に関すること。2002年5月29日に信用金庫のATMが1日間使用不能になった、という話があった。この本によると、当時取材をした記者は「主原因はハードウェアの故障」述べていたが、具体的には何の故障なのか記者にもわからなかった、と書かれている。

 一方、実際の原因についても本に述べられていて、「(実際はハードウェアの故障ではなく)ソフトウェアの不備が原因であったため、同じソフトウェアを用いている待機システム(不具合の際に利用されるバックアップ用のシステム)も動作せず...」と書いてあった。

 ようするに、主原因はソフトウェアの不備によるもので、このような場合、稼働中のシステムが問題を起こすと、バックアップ用のものも同じソフトウェアを使っているため、同様の問題を起こしてダウンしてしまう、ということである。

 似たような話は「東証の株式売買システムが稼働せず(1997)」(失敗百選 P.268)でも見られる。こちらは1997年8月1日、プログラムにバグ(不具合)があったことが原因で株式売買システムが不具合を起こしてダウンした、という話である。

 さらに本を読んでみると、この不具合は、それまで幸運にも表には現れていなかったが、実際には元々プログラムに内在していたものだったそうである。これが、(想定外に)銘柄が激増するうちに準備していたメモリの作業域を使い果たし、その結果、他のプログラムと干渉してしまったことで、この元々あったプログラムの不具合が顕在化したらしい。

 そして、この事例も最初のものと同様に、バックアップ用のシステムも同じプログラムを使っていたため同様の問題を起こし、結果的に全体のシステムがダウンしてしまった。

 これら2つの事例を見た後、改めて今回起こったauの通信障害について考えてみる。2月9日と11日の2つの通信障害の原因は「設備の故障」という一言で片付けられているが、auの通信設備は、本当にちょっと故障しただけで障害を起こすほど脆弱なのだろうか。

 そもそも、さまざまな設備が故障してしまった場合に備えて、バックアップのための設備が別に用意されているべきだし、ちょっとした故障なら自動的にバックアップ用の設備に切り替わって全体のシステムに問題が出ないようにする備えは、auでもしているに違いないと思う。

 そう考えると、今回の通信障害の原因が設備の故障ということなら、そのバックアップ用の設備も含めて故障してしまった、と予想してもよさそうである。この場合、故障の原因はいろいろあるかもしれないが、取り上げた事例と同様に、「不具合のあるソフトウェアを使っていたため、稼働中の設備だけでなくバックアップ用のシステムも同様にダウンした」という可能性も考えられるかもしれない。

 さらに、1997年に起こった東証の「想定外のことが起こったために、プログラムの不具合が顕在化」という点についても個人的には気になる。今回のauの話も、スマートフォンの急激な普及のタイミングと通信障害が起こった時期が一致しているのは、果たして偶然だろうか。これは、単なる想像でしかないが、スマートフォンの急激な普及により現れた不具合が原因、という可能性も捨てきれない。

 何だか勝手な事をいろいろと書いたが、新聞の報道によると、実際の原因については調査中らしい。また、原因がわかったとしても、続・失敗百選の本の最初には「ソフトウェアの事故は複雑すぎてリスクが予知できない」とか、「事故原因が何とも複雑で、いくら設計者が天才でも、容易に予測できない」とも書かれている。

 専門家でもこう言っているのだから、今回の通信障害に限らず、さまざまなシステム障害を事前に予防することは難しく、想定外のことが起こることをある程度考慮しながら対応していくしかなさそうである。これは利用する側も同様で、今後も想定外の通信障害が起こる可能性はあると考えて、携帯を利用する立場の我々も通信障害が起こった際にも困らないような対策をとっておく必要があるのかもしれない。

--------

Copyright (c) 2012 ANADA, Koichi. All Rights Reserved.

« 1月後半に気になったこと | トップページ | 青梅マラソン・スタート付近 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 1月後半に気になったこと | トップページ | 青梅マラソン・スタート付近 »