[過去ログ] 【安藁】 楽天証券47マーケットくるくる♪【月間】 (984レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
85: 日経コンピュータの記事 05/02/27 11:54 ID:c7tXOk3O(2/4) AAS
■障害対応でベンダーが誤操作
 12日に起きた障害の発端は、同社が日次で実行している夜間バッチ処理が異常終了し
たことだった。夜間バッチで実行するのは、最新の株式銘柄情報の取り込み、顧客の前日
の約定結果を反映した残高の確定といった処理で、深夜3時ころから約2時間をかけて処
理する。ところが12日は、この処理が開始後約30分で異常終了した。
 バッチ処理の異常終了そのものは、「想定している範囲の障害」(楠氏)である。1月
12日の場合は、一部データが入力されていなかったために書き込みエラーが発生し、異
常終了した。こうした事態に備えて、楽天証券では対応手順を明確に決めてある。まず、
後続処理への影響を確認し、異常終了したプログラムをスキップして後続プログラムを実
行させる。その後で、異常終了したプログラムだけを再実行し、影響が及んだ箇所を修正
する。これが同社が取り決めた正規の手順である。
 ところが、運用を担当するベンダーのエンジニアがこの手順を誤った。後続のプログラ
ムを実行した後、異常終了したプログラムと一緒に、すでに実行したはずの後続処理の一
部まで再実行させたのである。このためバッチ処理後のデータには、株式数量が2倍にな
る、前日約定分の取引が2重に表示されるなどの影響が出た。
 顧客からのクレームで問題を知った楽天証券はベンダーとともに調査を開始。11時に
は原因を特定した。データの確認と復旧のために、いったんはすべてのシステムを停止し
たものの、その後の調査で国内株式以外のサービスには影響がないことが判明。12時
30分、米国株式などのサービスに関わるシステムだけ起動し、注文受付を再開した。
 国内株式については、サービスを停止したままデータの修正を続けたが、取引が終わる
午後3時の時点でも、誤ったデータの確認・訂正作業を終えるメドが立たなかった。結
局、「関連データの修復を終え、修復したデータをシステムに送り込んだのは午後9時
になってしまった」(同氏)
 その後、通常通りの夜間バッチ処理を実行。正常終了したことを確認し、13日の午
前6時、ようやく完全復旧に漕ぎつけた。オペレーション・ミスにはじまったトラブルの
解決に、実に22時間を要した。
1-
あと 899 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.007s