Next: Up: Previous:

診断の終了時期

分散診断システムにおいて診断終了の時期を見定めるのは難しい. その理由は 幾つか考えられが, 一番重大な理由は通信路の状況に依存するメッセージ遅延 の可能性である.

分散システムにおける診断エージェント間の協調は, 全てメッセージ 通信によって行われる. 従って, 通信路の太さや通信量の関係でメッセー ジの遅延の可能性を内在している. 診断において局所的な視点での推論が, ある追加情報によって覆され ることは多い. 検出された情報を最も良く説明する原因を推論するためには より沢山の情報が欲しいが, メッセージ遅延とプロセッサ停止故障を区別するのが事実上不可能である以上, 情報をいつまで持てば良いかという問に対する明確な解答は無い.

figure534

図5.30: 非同期性による推論過程の違い

図5.30は, 診断エージェントの非同期性による診断過程の違い を示している. 上側の図の順番で黒板が更新された場合, 推論過程を通じて異常原因は ``A1''である. しかし, 下側の図の順序で更新された場合, 診断前半では 異常原因は``C''と``D''という推論結果となっている. この場合正しい推論 結果を得るためには, エージェント1の到着を待たなければならない.

以上の理由から本枠組では診断終了をユーザの手に委ねることにする. 診断は ユーザが終了の合図を送るまで続けられ, 定期的に診断結果を出力すること にする.


Mitsubishi Research Institute,Inc.
Mon Feb 24 19:32:21 JST 1997