梳理了一些个人认为常用的度量指标,暂时只有node_exporter的,待后续更新。
一、主机基础监控指标
以node_exporter为例
1.1、通用
序号 |
指标名称 |
说明 |
单位 |
1 |
node_os_version |
系统版本 |
string |
2 |
node_os_info |
系统信息(比系统版本更详细) |
string |
3 |
node_boot_time_seconds |
节点开机时间(Unix时间戳) |
|
4 |
process_start_time_seconds |
节点已开机时间(Unix时间戳) |
|
1.2、CPU
序号 |
指标名称 |
说明 |
单位 |
1 |
up |
exporter实例存活与否,1为正常,0为异常 |
|
2 |
process_cpu_seconds_total |
进程(一般指exporter)CPU使用量 |
s |
3 |
node_cpu_seconds_total |
当前实例各CPU使用量 |
s |
4 |
node_load1 |
当前节点1m内CPU平均负载 |
% |
5 |
node_load5 |
当前节点5m内CPU平均负载 |
% |
6 |
node_load15 |
当前节点15m内CPU平均负载 |
% |
1.3、内存
序号 |
指标名称 |
说明 |
单位 |
1 |
node_memory_MemTotal_bytes |
内存总大小 |
bytes |
2 |
node_memory_MemFree_bytes |
内存剩余空间(不包含buffer和cache) |
bytes |
3 |
node_memory_MemAvailable_bytes |
内存可用空间(包含buffer和cache) |
bytes |
4 |
node_memory_Buffers_bytes |
buffer占用内存大小 |
bytes |
5 |
node_memory_Cached_bytes |
cache占用内存大小 |
bytes |
6 |
process_resident_memory_bytes |
进程(一般指exporter)内存使用量 |
bytes |
7 |
node_memory_SwapTotal_bytes |
swap分区空间总大小 |
bytes |
8 |
node_memory_SwapFree_bytes |
swap分区剩余空间大小 |
bytes |
1.4、磁盘
类别 |
指标名称 |
说明 |
单位 |
磁盘空间 |
node_filesystem_size_bytes |
已node_disk_io_now挂载的各磁盘总空间大小 |
bytes |
|
node_filesystem_free_bytes |
已挂载的各磁盘可用空间大小 |
bytes |
磁盘读取 |
node_disk_reads_completed_total |
磁盘成功读取总数量 |
个 |
|
node_disk_read_bytes_total |
磁盘成功读取的总字节数 |
bytes |
|
node_disk_read_time_seconds_total |
磁盘所有读取总耗时 |
s |
磁盘写入 |
node_disk_writes_completed_total |
磁盘成功写入总数量 |
个 |
|
node_disk_write_time_seconds_total |
磁盘所有写入总耗时 |
s |
|
node_disk_written_bytes_total |
磁盘成功写入的总字节数 |
bytes |
I/O |
node_disk_io_time_seconds_total |
磁盘I/O总耗时 |
s |
|
node_disk_io_time_weighted_seconds_total |
磁盘I/O加权总耗时(I/O队列长度) |
|
|
node_disk_io_now |
磁盘当前正在执行的I/O数量(待处理?) |
|
1.5、网络
类别 |
指标名称 |
说明 |
单位 |
|
node_network_info |
网络信息 |
|
|
node_network_speed_bytes |
网络设备速率(带宽) |
B/s |
上传/发送 |
node_network_transmit_bytes_total |
网络设备已发送报文总字节数 |
bytes |
|
node_network_transmit_packets_total |
网络设备已发送报文总数量 |
个 |
|
node_network_transmit_queue_length |
网络设备发送报文队列长度 |
|
下载/接收 |
node_network_receive_bytes_total |
网络设备已接收报文总字节数 |
bytes |
|
node_network_receive_packets_total |
网络设备已接收报文总数量 |
个 |