アクションポリシーの作成に関するガイドライン
アクションポリシーは、アクションと通知をバンドルします。アクションと通知は通常、モニタで観察された状態またはしきい値によってトリガされます。アクションと通知の構成要素を組み合わせて、選択したデバイスとデバイスロールを制御するポリシーを実行することができます。
WhatsUp Gold では、アクションポリシーは通常、以下のいずれかをトリガします。
- 単純な通知 (E メール、SMS、ログ)。
- 是正手段 (リモートスクリプト実行ペイロード、設定ロールバック、再起動など)。
- 是正手段と通知の組み合わせ。
アクションポリシーを実施するためにバンドルされたサイトアクションの例を次に示します。
- 運用環境のデバイスの状態が変わったとき (保守点検モードから稼働状態など) アプリケーション管理エンジニアに通知する
- コンプライアンスからの逸脱 (デフォルトのパスワードが検出された、異常なポートが開いている、トラフィックが検出されたなど) が判明したデバイスに承認済みの設定を適用する
- プライマリホストデバイスで障害が発生したら必ずバックアップ用のホストデバイスを「アクティブ化」(再設定および再起動) する
- 「応答しない」重要なサービス (FTP やログサーバーなど) を再起動する
: また、WhatsUp Gold WhatsConfigured ポリシーを使用して、設定レコードのバージョン管理やデバイス設定の調整を実施する強力なポリシーを作成して適用することもできます。
アクションポリシーの作成
まず、サイトの重大な状態変化イベント、適切なアクション、および一連の責任者のリストまたはマトリックスを作成します。
例: デバイス回復マトリックス
ポリシー:内部サービスレベル契約
デバイス回復アクション
次の表は、「内部サービスレベル契約」というアクションポリシーの例にまとめられた WhatsUp Gold 管理対象コントロールのシーケンス (アクションと組み合わされたしきい値および状態) を示しています。
イベント
|
アクション
|
通知
|
デバイスがクラッシュして再起動する、または n 秒後に強制的に再起動する。
|
回復アクションスクリプトを実行します。
- ネットワーク (NIC) の接続を確認します。
- アプリケーションサービスの接続を確認します。
- アプリケーションサービスの確認に失敗すると、Web サービスロールの失敗ポリシーがトリガされます。
|
- データセンターチームに通知。
- オンコールのサービスエンジニアに通知。
- 通知添付ファイル
|
Web サービスロールの失敗ポリシー。
(WhatsUp Gold ポーラーからアプリケーションサービスのアクティブモニタへの応答がない場合、または n ミリ秒が経過した後。)
|
「ロードバランサー」の設定から Web サービスロールのエンドポイントを削除します。
WhatsUp Gold 保守点検モードに追加します。
|
- データセンターチームに通知。
- オンコールのサービスエンジニアに通知。
- 可用性レポートで製品所有者に通知。
|
ノードの失敗。
現象: 外部 NIC または管理 NIC の応答なし、リモート実行の失敗、リモート書き込みの失敗、カーネルパニック。
|
失敗したノードの回復アクションを実行します。
|
- データセンターチームに通知。
- 最も近いデータセンターのエンジニアに通知。
|
- アクションライブラリでアクションの種類を作成します。
例: テスト接続/リモート実行
- [新規作成] ボタンをクリックし、 を選択します (Linux/UNIX の場合は、 を選択します)。
- デバイスへのリモートログインの構文をスクリプトテキストボックスに追加します。
- アクションポリシーを作成します。
例: 通知スケジュールとロールテストを組み合わせてアクションポリシーに含める
- サイトの通知階層に従って、作成した通知アクションを追加します。
- 作成した PowerShell アクションを追加します。