MMOBBS障害報告スレッド
[27:Akemino ★ (04/10/07 23:43 ID:???)]
>26
鯖を管理している管理人に聞きたいところですが、
その人に連絡が取れない為、私達にも分かりません。
ご迷惑をおかけしました。
[28:(>▽<)さん (04/10/07 23:57 ID:GJGQl7Tm)]
>>27
二つあるDNSサーバの両方ともzone空っぽでした。
全くの外部ゾーンの情報は返してたので、SOAレコードの値が変わっていないのであれば
少なくとも丸三日間(259200 / 60 / 60 / 24
=3)以上そのままだったと思われます。
どちらがPrimaryかはわかりませんが、secondary側がちゃんと設定されてない
(secondaryじゃなくてオンメモリキャッシュでしか動いてない)状態なのでは?
[29:neun ★ (04/10/08 00:18 ID:???)]
>>25
SalveのDNSサーバ達(公開)へ情報を与えていた
マスターDNSサーバ(非公開)がクラッシュにより同期中でものが中断され
DNSデータが破壊してしまったいたようです。
先ほど修正していたのでしばらくかかるかもしれませんが
徐々に復旧しているはずです。
[30:37.5℃@neun ★ (04/10/08 00:20 ID:???)]
>>29は>>26さん宛です。
あたまがぼーっとしていたようで、ごめんなさい。
[31:37.5℃@neun ★ (04/10/08 00:25 ID:???)]
>>29をよくみたら
Slaveをスペルミスしてるし、日本語文法も変だし
みすばっかりでごめんなさいorz
私は、復旧済みだと思ってますが、何かあればまた報告お願いします。
[32:(>▽<)さん (04/10/08 00:39 ID:+2WptxYb)]
>>31
DNSのzone transfer中に、ということなんでしょうか?
それともファイルベース同期?
前者で発生してしまったならしょうがないですけど、気付くはずですよね?
発生から復旧までアナウンス無しに三日かかったということは後者かとおもいますが、うがちすぎですか?
もしそうなら、bind9等の非公開masterからnotify先を明示し、公開slave側ではそれを受け入れる設定にすればいいと思います。
[33:37.5℃@neun ★ (04/10/08 00:48 ID:???)]
>>32
基本的には前者です。
気が付くのに遅れたのは、
先ほどまでマスターサーバの不調に全く気が付いてなかったです。
言い訳的になってしまいますが、トラブルが幾つか重なってのことで、
私もまさかそうなってるとは全くしらず数日を過ごしていたです。
前も別件が原因でDNSZoneが飛んだことがあったので、
マスターからのデータ同期の取り方を見直して対策しようかと思います。
[34:(>▽<)さん (04/10/08 01:12 ID:+2WptxYb)]
>>33
見直すのであればSOAレコードの異様に小さすぎる値も本当に必要なのか見直して下さい。
特にexpireがたった三日しかないってのが障害の追い打ち要因です。
neunさんが長期外出中に同様のことが起こったら、三日だと同様の被害は避けられません。
Expireは相当長くていいのでは。
あと、各サーバの生死確認マジおすすめ。
# 好意で使わせて頂いてる立場だと理解してます。
# あくまでわかる範囲でのアドバイスです。
# 苦情や強制のつもりはありませんので、出来る範囲で頑張って下さい。
[35:(>▽<)さん (04/10/08 11:50 ID:96utwwPB)]
障害情報は 別のところにあったほうがいいよね
[36:(>▽<)さん (04/10/08 11:53 ID:+2WptxYb)]
>>35
同感。避難所を生扉あたりに作るとか。
あっちはあっちで人災多いようだけど。
read.cgi ver5.26 + n2 (02/10/01)