先日、どうもサーバがダウンしているようだけど、どうしたのかな、などと思っていたら、何と自分が原因であったということがわかり、非常にショックを受けています。
使用していたとあるCGIプログラムの排他ロック処理の部分で、ロック待ちのループにsleepが入っておらずbusy loopになっていたため、競合した際に負荷が異常に高くなってサーバダウン寸前であったということです。
常識的に必要な処理がたった一行なぜか抜けていただけで大きな事態となってしまったのですが、結果的にプロバイダ側から一時的にCGI他を停止され、その後許可していただく際にきつめの警告を頂戴してしまいました。
やはりデバッグは重要ですね…

関連投稿