2011年12月30日金曜日

The φ Accrual Failure Detector

The φ Accrual Failure Detector 
Naohiro Hayashibara, Xavier Défago, Rami Yared1, and Takuya Katayama
PDF。 Cassandraで使われている事で知られる故障検出手法。

古典的にはハートビートを用いた検出手法が知られているが、1か0を返すだけで使いにくい。 これに対してφ Accrual では、やはりハートビートを使うのだが、ノードの状態を0以上の 故障可能性値φで返す。ポイントは、0,1でないため、使う側が故障しているかどうかの 判断を調整できること。

まず、ハートビートの受信間隔の平均と分散を算出しておく。 この二つの値を使って、前回ハートビートを受信してから経過した時間に応じて、 今後ハートビートが来る確率を算出し、そのLog10をφとする(?)。 ハートビートを受信するとファイは0にリセットされる。

0 件のコメント:

コメントを投稿