建立操作策略的指南
操作策略捆绑“操作”和“通知”。“操作”和“通知”一般由条件或监控器遵守的阈值触发。您可以合并“操作”和“通知”要素,以实施治理选中设备和设备角色的策略。
在 WhatsUp Gold 中,“操作策略”一般会触发以下操作:
- 简单通知(电子邮件、短信、日志)。
- 纠正措施(例如远程脚本执行有效载荷、配置回滚、重启等)。
- 一些纠正措施和通知组合。
捆绑以实施操作策略的站点操作的例子包括:
- 当生产设备转换状态(例如从维护模式变为运行模式)时,通知应用程序管理工程师。
- 对发现不合规的设备应用经过批准的配置(检测到默认密码、开启异常端口或检测到流量)
- 当主设备出现故障时,“启动”(重新配置或重启)备用主机设备
- 重启“不响应的”关键服务(例如 FTP 或日志服务器)
: 您还可以创建和应用强大的策略,强制使用WhatsUp Gold WhatsConfigured 策略进行配置记录版本化和设备配置调整。
建立操作策略
首先为您的站点创建一个列表或矩阵,包括关键状态变更事件、相应的操作以及负责人员的链条。
范例:设备恢复矩阵
策略:内部服务水平协议
设备恢复操作
以下矩阵显示 WhatsUp Gold 管理控制(阈值、状态和操作)进入名为“内部服务水平协议”的示例操作策略的顺序。
事件
|
操作
|
通知
|
设备崩溃和重启或 n 秒后强制重启。
|
运行恢复操作脚本。
- 验证网络 (NIC) 连接性。
- 验证应用服务连接性。
- 如果应用服务验证失败,触发 Web 服务角色故障策略
|
|
Web 服务角色故障策略。
(WhatsUp Gold 轮询引擎对应用程序服务活跃监控器无响应或在 n 毫秒后响应)
|
从“负载平衡器”配置删除 Web 服务角色终端。
添加至 WhatsUp Gold 维护模式。
|
- 数据中心团队通知。
- 待命服务工程师通知。
- 附可用性报告的产品负责人通知。
|
故障节点。
症状:外部 NIC 或管理 NIC 无响应,远程执行故障,远程响应故障,内核错误。
|
运行故障节点恢复操作。
|
|
- 从“操作库”中创建操作类型。
范例:测试连接性/远程执行
- 单击新建按钮,然后选择 (对于 Linux/UNIX,选择 )。
- 在脚本文本框中添加远程登录设备的语法。
- 创建“操作策略”。
范例:将通知计划和轮询测试合并到操作策略中
- 根据站点的通知层级,添加您创建的通知操作。
- 添加您创建的 PowerShell 操作。