梳理了一些个人认为常用的度量指标,暂时只有node_exporter的,待后续更新。
一、主机基础监控指标
以node_exporter为例
1.1、通用
序号 | 指标名称 | 说明 | 单位 |
---|---|---|---|
1 | node_os_version | 系统版本 | string |
2 | node_os_info | 系统信息(比系统版本更详细) | string |
3 | node_boot_time_seconds | 节点开机时间(Unix时间戳) | |
4 | process_start_time_seconds | 节点已开机时间(Unix时间戳) |
1.2、CPU
序号 | 指标名称 | 说明 | 单位 |
---|---|---|---|
1 | up | exporter实例存活与否,1为正常,0为异常 | |
2 | process_cpu_seconds_total | 进程(一般指exporter)CPU使用量 | s |
3 | node_cpu_seconds_total | 当前实例各CPU使用量 | s |
4 | node_load1 | 当前节点1m内CPU平均负载 | % |
5 | node_load5 | 当前节点5m内CPU平均负载 | % |
6 | node_load15 | 当前节点15m内CPU平均负载 | % |
1.3、内存
序号 | 指标名称 | 说明 | 单位 |
---|---|---|---|
1 | node_memory_MemTotal_bytes | 内存总大小 | bytes |
2 | node_memory_MemFree_bytes | 内存剩余空间(不包含buffer和cache) | bytes |
3 | node_memory_MemAvailable_bytes | 内存可用空间(包含buffer和cache) | bytes |
4 | node_memory_Buffers_bytes | buffer占用内存大小 | bytes |
5 | node_memory_Cached_bytes | cache占用内存大小 | bytes |
6 | process_resident_memory_bytes | 进程(一般指exporter)内存使用量 | bytes |
7 | node_memory_SwapTotal_bytes | swap分区空间总大小 | bytes |
8 | node_memory_SwapFree_bytes | swap分区剩余空间大小 | bytes |
1.4、磁盘
类别 | 指标名称 | 说明 | 单位 |
---|---|---|---|
磁盘空间 | node_filesystem_size_bytes | 已node_disk_io_now挂载的各磁盘总空间大小 | bytes |
node_filesystem_free_bytes | 已挂载的各磁盘可用空间大小 | bytes | |
磁盘读取 | node_disk_reads_completed_total | 磁盘成功读取总数量 | 个 |
node_disk_read_bytes_total | 磁盘成功读取的总字节数 | bytes | |
node_disk_read_time_seconds_total | 磁盘所有读取总耗时 | s | |
磁盘写入 | node_disk_writes_completed_total | 磁盘成功写入总数量 | 个 |
node_disk_write_time_seconds_total | 磁盘所有写入总耗时 | s | |
node_disk_written_bytes_total | 磁盘成功写入的总字节数 | bytes | |
I/O | node_disk_io_time_seconds_total | 磁盘I/O总耗时 | s |
node_disk_io_time_weighted_seconds_total | 磁盘I/O加权总耗时(I/O队列长度) | ||
node_disk_io_now | 磁盘当前正在执行的I/O数量(待处理?) |
1.5、网络
类别 | 指标名称 | 说明 | 单位 |
---|---|---|---|
node_network_info | 网络信息 | ||
node_network_speed_bytes | 网络设备速率(带宽) | B/s | |
上传/发送 | node_network_transmit_bytes_total | 网络设备已发送报文总字节数 | bytes |
node_network_transmit_packets_total | 网络设备已发送报文总数量 | 个 | |
node_network_transmit_queue_length | 网络设备发送报文队列长度 | ||
下载/接收 | node_network_receive_bytes_total | 网络设备已接收报文总字节数 | bytes |
node_network_receive_packets_total | 网络设备已接收报文总数量 | 个 |