
| イベント | 開始~終了 | 経過時間 |
|---|---|---|
| 1回目チェック(初回) | t = 0 〜 5 s(タイムアウト) | 5 s |
| リトライ① | t = 5 〜 10 s | +5 s |
| リトライ② | t = 10 〜 15 s | +5 s |
| リトライ③ | t = 15 〜 20 s | +5 s |
| DOWN 判定 | t = 20 s | 合計 20 s |
- 間隔=5 秒なので、各チェックは 5 秒ごとに発生。
- タイムアウト=5 秒のため、応答がなければ 5 秒で失敗確定。
- リトライ回数は「再送分」(初回はカウントしない)と公式ドキュメントに明記されています
- したがって、失敗判定に必要な連続チェック数=1(初回)+3(リトライ)=4 回。
- 4 回 × 5 秒 = 20 秒 ≒ 0.33 分。
チューニング時の注意
| パラメータ | 短くすると | 長くすると |
|---|---|---|
| 間隔(閾値) | 障害検知が速い / 監視トラフィック増 | 障害検知が遅い / ネットワーク負荷減 |
| リトライ回数 | 誤検知しやすい / 切替えが速い | 誤検知に強い / 切替えが遅い |
| タイムアウト | レイテンシに弱い | 高遅延環境でも安定 |


コメント