如何从一台操作机监控多台linux服务器的cpu利用率

2025-03-17 11:38:31
推荐回答(2个)
回答(1):

推荐监控软件zabbix嫌麻烦用脚本监控系统性能
能根据实际环境写搜集系统性能报告ftp志服务器
或者scp 或者 rsync

回答(2):

对于两个处理器存在两项,因此平均情况下,处理器要执行的工作会稍少于它的处理能力。在较高层次上,这意味着机器需要执行的工作少于它的处理能力。注意:若在双 CPU的机器上 uptime命令显示的负荷平均值小于 2.00的话,这表明处理器仍拥有额外的空闲周期。在 4个 CPU的机器上如果负荷平均值小于 4.00的话也表明同样的情况,如此等等。然而,负荷平均值单独并不能说明全部问题。
尽管该工具可以检测CPU获得了利用情况, 但它并不指明系统正在执行什么工作以及如此繁忙的原因。如果该系统的用户响应时间是可接受的,可能没有任何理由需要更深入地探究系统的运行情况。
诸如uptime之类的简单工具常常是用户试图对应用各种可觉察的缓慢响应时间加以解释的快捷方式。若系统的平均负荷值表明响应时间可能是由单个(或多个)过载的处理器所引起的,那么可以使用许多其他工具来缩小负荷起因的范围。
为了更深入地探究处理器的使用情况,下面介绍的 3种工具可以提供许多关于CPU利用情况的不同理解: vmstat、 iostat和 top。 这些工具各自关注系统监视的不同方面,但都可获得关于处理器当前使用情况的不同视图。特别地,下一个步骤是理解处理器是否将处理时间主要消耗在操作系统(经常称为内核空间)或应用(经常称为用户空间)之中,或者处理器是否处于空闲状态。如果处理器处于空闲状态,则理解其空闲的原因是所有进一步性能分析的关键。有许多原因可以导致处理器空闲。例如,最明显的原因是某个进程无法运行。 这听起来或许过于明显, 但如果工作负荷的某个组件(例如特定进程或任务)没有正在运行的话,则性能可能受到影响。在某些情况下,对组件实施缓存或后退(fallback)机制可以允许一些应用继续运行, 尽管吞吐率会降低。 例如, Internet域名服务经常被配置为对 named守护进程或者 off-host服务进行查询。如果某个域名服务提供商(例如出现在/etc/resolv.conf的第一行 name server语句中)当前没有运行,则在查询其他信息提供商之前可能存在一个超时周期。对于用户来说,这可能看起来像是应用中的不定时延迟。对于使用 uptime来监视系统的用户来说,平均负荷值看起来可能不是很高。然而,在这种情况下,vmstat的输出可以有助于缩小排查问题的范围。