值班人员
5 分钟上手
- 登录系统,使用账号密码或钉钉扫码登录。
- 从左上角项目选择器选择负责项目。
- 查看仪表盘中的今日告警、P0/P1、MTTR 和去重率。
- 进入工单中心筛选高优工单,查看 AI 建议和 SOP。
- 接受工单,处理后标记解决,填写根因并关闭。
快速导航
从值班处理、项目初始化和巡检配置三个入口开始使用 OpsAGI。
5 分钟上手
15 到 30 分钟初始化
3 步启动巡检
同一用户在不同项目中可拥有不同角色,系统管理能力只对超级管理员开放。
| 功能 | 查看者 | 编辑者 | 项目管理员 | 超级管理员 |
|---|---|---|---|---|
| 查看工单/报告 | 是 | 是 | 是 | 是 |
| 创建/处理工单 | 否 | 是 | 是 | 是 |
| 发布/归档 SOP | 否 | 否 | 是 | 是 |
| 项目设置/通知 | 否 | 否 | 是 | 是 |
| 用户管理/归档项目 | 否 | 否 | 否 | 是 |
工单工作台覆盖仪表盘概览、工单列表、详情查看与状态流转,是 OpsAGI 的核心处理界面。
OpsAGI 以项目作为隔离单元,每个项目拥有独立的工单、Webhook Token、知识库、巡检配置、通知渠道和成员角色。
通过标准化 Webhook 对接 Prometheus、Grafana、Zabbix、DataWorks DQC 等告警系统,实现自动建单、去重聚合和 AI 解析。
SOP 是 OpsAGI 的核心知识资产,知识库支持创建、发布、匹配、反馈收集和持续优化。
巡检中心提供数据平台连接、巡检配置、通知配置、巡检报告和异常决策能力。
分析中心把历史工单转化为运维洞察,提供根因分析、运维效率分析和 SOP 候选草稿报告。
钉钉机器人把运维处理延伸到 IM 场景,支持处理工单、查看巡检异常和操作数据平台实例。
系统管理面向超级管理员,覆盖用户管理、AI 配置、审计日志和 AI 任务监控。
按登录、告警、巡检和权限三个场景快速定位排查路径。
| 问题 | 排查方向 |
|---|---|
| 忘记密码 | 登录页点击忘记密码,输入邮箱查收重置邮件;未收到时联系管理员。 |
| 账号被锁定 | 连续输错 5 次会锁定 15 分钟,可等待或联系管理员解锁。 |
| 钉钉扫码提示未绑定 | 先密码登录,进入个人中心完成钉钉账号绑定。 |
| 问题 | 排查方向 |
|---|---|
| 告警未创建工单 | 检查 Webhook 开关、Token、IP 白名单和请求体格式。 |
| 工单无通知 | 检查通知渠道配置、测试推送、触发条件和 Agent 日志。 |
| AI 建议未生成 | 等待 30 秒刷新,检查 Agent 日志和 LLM 配置,必要时手动重试。 |
| SOP 匹配无结果 | 确认 SOP 已发布、规则可命中、向量化已完成且语义匹配已开启。 |
| 问题 | 排查方向 |
|---|---|
| 巡检不生效 | 检查配置是否启用、Cron 是否正确、连接是否正常,并手动触发测试。 |
| 通知推送失败 | 检查渠道配置、机器人是否在群内、安全验证设置和审计日志。 |
| 权限不足 | 确认项目角色、所在项目和权限表,必要时联系管理员调整。 |
围绕 Token、权限、知识库、巡检规则和系统维护建立稳定运营节奏。
需要了解 OpsAGI 产品能力、解决方案或试用方式,可以联系销售团队或提交技术支持工单。