网站首页 > 技术文章 正文
使用 Prometheus 监控 Linux 服务器性能 是一套强大且灵活的解决方案,可以帮助你实时监控服务器的 CPU、内存、磁盘、网络等性能指标。以下是从安装到配置的完整指南,包括如何使用 Prometheus 和 Node Exporter 进行监控。
1. Prometheus 和 Node Exporter 简介
- Prometheus:
- 一个开源的监控工具,用于收集和存储时间序列数据(如服务器性能)。
- 提供强大的查询语言(PromQL)以及内置的警报功能。
- Node Exporter:
- 一个 Prometheus 的官方导出器,用于收集 Linux 系统的性能指标,如 CPU 使用率、内存使用、磁盘 I/O、网络等。
- 运行在每个需要监控的 Linux 服务器上。
2. 环境准备
在安装和配置之前,请确保以下条件满足:
- Linux 服务器: 一台用于安装 Prometheus 的服务器(监控主机)。 一台或多台需要被监控的 Linux 服务器。
- Root 权限:安装过程中需要 root 或 sudo 权限。
- 网络连通性:监控主机需能访问被监控服务器的指定端口(默认 9100)。
3. 安装和配置步骤
3.1 安装 Prometheus(监控主机)
步骤 1:下载 Prometheus
- 前往 Prometheus 官方下载页面:https://prometheus.io/download/。
- 或使用以下命令下载最新版本(以 v2.47.0 为例):
- bash
- 复制
- wget https://github.com/prometheus/prometheus/releases/download/v2.47.0/prometheus-2.47.0.linux-amd64.tar.gz
步骤 2:解压 Prometheus
bash
复制
tar -xvzf prometheus-2.47.0.linux-amd64.tar.gz
cd prometheus-2.47.0.linux-amd64
步骤 3:运行 Prometheus
- 使用默认配置启动 Prometheus:
- bash
- 复制
- ./prometheus --config.file=prometheus.yml
- 默认 Prometheus 会监听在 http://<监控主机IP>:9090。
3.2 安装 Node Exporter(被监控服务器)
步骤 1:下载 Node Exporter
- 前往 Node Exporter 官方页面:https://prometheus.io/download/。
- 或使用以下命令下载最新版本(以 v1.6.1 为例):
- bash
- 复制
- wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz
步骤 2:解压并运行
bash
复制
tar -xvzf node_exporter-1.6.1.linux-amd64.tar.gz
cd node_exporter-1.6.1.linux-amd64
./node_exporter
- 默认 Node Exporter 会监听在 http://<服务器IP>:9100。
步骤 3:设置为系统服务(可选,确保自动启动)
- 创建 Systemd 服务文件:
- bash
- 复制
- sudo nano /etc/systemd/system/node_exporter.service
- 添加以下内容:
- ini
- 复制
- [Unit] Description=Node Exporter After=network.target [Service] User=nobody ExecStart=/path/to/node_exporter [Install] WantedBy=default.target
- 替换 /path/to/node_exporter 为 Node Exporter 的实际路径。
- 启用并启动服务:
- bash
- 复制
- sudo systemctl daemon-reload sudo systemctl enable node_exporter sudo systemctl start node_exporter
3.3 配置 Prometheus
步骤 1:修改 Prometheus 配置文件
- 编辑 prometheus.yml 文件:
- bash
- 复制
- nano prometheus.yml
- 添加被监控服务器节点信息:
- yaml
- 复制
- scrape_configs: - job_name: 'node_exporter' static_configs: - targets: - '<被监控服务器IP>:9100' - '<其他被监控服务器IP>:9100'
- 示例:
- yaml
- 复制
- scrape_configs: - job_name: 'node_exporter' static_configs: - targets: - '192.168.1.101:9100' - '192.168.1.102:9100'
步骤 2:重启 Prometheus
bash
复制
./prometheus --config.file=prometheus.yml
3.4 验证安装
- 检查 Prometheus 状态:
- 打开浏览器,访问 http://<Prometheus主机IP>:9090。
- 在页面顶部输入查询 up,查看 Node Exporter 是否已成功连接。
- 检查指标数据:
- 在 Prometheus 的查询界面输入以下指标: node_cpu_seconds_total:查看 CPU 使用情况。 node_memory_MemAvailable_bytes:查看可用内存。 node_network_transmit_bytes_total:查看网络传输数据。
4. 配置 Grafana 可视化(可选)
4.1 安装 Grafana
- 下载并安装 Grafana:
- bash
- 复制
- sudo apt-get install -y grafana # Debian/Ubuntu sudo yum install -y grafana # CentOS/RHEL
- 启动服务:
- bash
- 复制
- sudo systemctl start grafana-server sudo systemctl enable grafana-server
- 默认访问地址:http://<服务器IP>:3000(默认账户:admin/admin)。
4.2 配置 Prometheus 数据源
- 登录 Grafana。
- 在左侧菜单中选择 Configuration > Data Sources。
- 添加一个新的数据源,选择 Prometheus,并配置 URL 为 http://<Prometheus主机IP>:9090。
4.3 使用现成的 Grafana Dashboard
- 前往 Grafana Dashboard 共享库。
- 搜索并下载 Node Exporter Full Dashboard(常用 ID:1860)。
- 在 Grafana 导入该 Dashboard,并选择 Prometheus 数据源。
5. Prometheus 监控的关键指标
以下是 Prometheus 监控 Linux 服务器时常用的指标:
指标 | 用途 |
node_cpu_seconds_total | CPU 使用率(以秒为单位)。 |
node_memory_MemAvailable_bytes | 可用内存总量(字节)。 |
node_memory_MemTotal_bytes | 系统总内存(字节)。 |
node_filesystem_avail_bytes | 磁盘可用空间(字节)。 |
node_network_transmit_bytes_total | 网络发送的总字节数。 |
node_network_receive_bytes_total | 网络接收的总字节数。 |
node_load1 | 过去 1 分钟的系统平均负载。 |
6. 警报配置(可选)
Prometheus 支持通过 Alertmanager 配置警报。以下是简单的警报配置示例:
- 在 prometheus.yml 中添加警报规则:
- yaml
- 复制
- rule_files: - "alert.rules"
- 创建 alert.rules 文件:
- yaml
- 复制
- groups: - name: example_alerts rules: - alert: HighCPUUsage expr: avg(rate(node_cpu_seconds_total[1m])) > 0.9 for: 1m labels: severity: warning annotations: description: "CPU usage is above 90% for the past 1 minute."
- 重启 Prometheus。
7. 总结
通过 Prometheus 和 Node Exporter,你可以轻松实现对 Linux 服务器性能的全面监控。以下是关键步骤:
- 安装 Prometheus 并配置监控主机。
- 在每台被监控服务器上安装 Node Exporter。
- 配置 Prometheus 采集指标数据,并通过 PromQL 查询关键性能指标。
- (可选)结合 Grafana 实现数据可视化和警报。
这种监控方案灵活、可靠且开源,非常适合企业和个人使用。
猜你喜欢
- 2025-08-01 AI 推理 | vLLM 快速部署指南
- 2025-08-01 Java实现调用nvidia硬编解码
- 2025-08-01 运维必备:掌握这3个存储技术
- 2025-08-01 Claude Code:完爆 Cursor 的编程体验
- 2025-08-01 【Docker 新手入门指南】第十章:Dockerfile
- 2025-08-01 Linux漏洞检测与修复工具示例
- 2025-08-01 Dify存储告急别焦虑!6步迁移教程,系统无缝切换,流畅度暴涨!
- 2025-08-01 技术栈:全网疯传的Claude code,保姆级使用教程来啦!
- 2025-08-01 LLVM IR入门:编写自定义优化Pass的完整教程与性能影响分析
- 2025-08-01 艹!公网开放后,NAS 不小心中了挖矿病毒...
- 08-01Linux Systemd入门
- 08-01使用 Checkmk 监控 Oracle 服务器
- 08-01核心库CPU飙到99%了!我发现很多DBA都不会看日志……
- 08-01China's CETC Kingbase Unveils AI-Powered Database Appliances Amid Rising Demand for Intelligent Data Infrastructure
- 08-01Docker安装部署Oracle/Sql Server
- 08-01Oracle数据库安装 | 步骤详细
- 08-01基于Springboot + vue实现的社团管理系统
- 08-01前端开发如何用Mock.js进行数据接口模拟
- 1520℃桌面软件开发新体验!用 Blazor Hybrid 打造简洁高效的视频处理工具
- 623℃Dify工具使用全场景:dify-sandbox沙盒的原理(源码篇·第2期)
- 526℃MySQL service启动脚本浅析(r12笔记第59天)
- 492℃启用MySQL查询缓存(mysql8.0查询缓存)
- 491℃服务器异常重启,导致mysql启动失败,问题解决过程记录
- 479℃「赵强老师」MySQL的闪回(赵强iso是哪个大学毕业的)
- 460℃mysql服务怎么启动和关闭?(mysql服务怎么启动和关闭)
- 458℃MySQL server PID file could not be found!失败
- 最近发表
-
- Linux Systemd入门
- 使用 Checkmk 监控 Oracle 服务器
- 核心库CPU飙到99%了!我发现很多DBA都不会看日志……
- China's CETC Kingbase Unveils AI-Powered Database Appliances Amid Rising Demand for Intelligent Data Infrastructure
- Docker安装部署Oracle/Sql Server
- Oracle数据库安装 | 步骤详细
- 基于Springboot + vue实现的社团管理系统
- 前端开发如何用Mock.js进行数据接口模拟
- 使用vite为vue项目配置@别名
- 基于Springboot + vue3实现的教务管理系统
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- windowsscripthost (69)
- apt-getinstall-y (100)
- js~~ (67)
- node_modules怎么生成 (87)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- js判断是否是json字符串 (67)
- c语言min函数头文件 (68)
- asynccallback (71)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)