开发一种基于AIoT的服务器监控系统,利用声学信号和振动来检测异常,而非传统的软件方法
服务器基础设施监控的一个常见局限在于其依赖软件层面的指标,这些指标可能无法始终捕捉到硬件退化的早期物理迹象。在机械问题(如风扇磨损、气流问题或异常振动)开始出现时,CPU负载、日志和温度读数仍可能显示正常。
本项目提出了一种基于AIoT的非侵入式服务器监控原型,利用声学和振动特征进行监测。该方法不再将服务器仅视为数字系统,而是将其视为能够发出与运行状态相关可测量声音和振动模式的物理设备。通过在边缘端使用Edge Impulse模型对这些物理信号进行本地分类,并将简化的结果通过LoRaWAN网络传输,系统探索了如何在不安装服务器上的软件代理的情况下实现早期异常检测。
边缘AI上的机器学习
系统的核心是一个边缘部署的机器学习模型,直接在NatureGuard物联网设备上运行。该设备从服务器环境中采集物理信号,主要包括车载麦克风的声学数据以及车载加速度计的振动数据。这些信号用于判断服务器当前的运行状态,并评估所观察到的行为是否可能表明存在异常。
在当前的原型中,基于音频的模型作为主要分类引擎,因为声学模式能够提供有关风扇噪音、气流变化及其他机械行为的丰富信息。振动测量则作为辅助信号使用,有助于在存在物理移动或机械变化时提升系统的鲁棒性。
每次分类后,设备会生成一个包含预测状态、模型置信度和异常分数的紧凑结果。系统不会传输原始音频或振动数据,而是仅通过LoRaWAN将该简要摘要发送至The Things Stack,并在Datacake中进行可视化。这种方式可有效降低带宽使用,使系统适用于传统网络基础设施可能无法覆盖的分布式监控场景。
LoRaWAN 通信
经过本地分类后,NatureGuard物联网设备仅通过LoRaWAN发送紧凑的推理结果。传输的数据包包含预测状态、模型置信度和异常得分,而非原始的音频或振动数据。这有助于降低带宽使用,使系统适用于Wi-Fi或有线连接不可用或不理想的分布式监控场景。
LoRaWAN消息由The Things Stack接收,其中有效载荷被解码为状态、置信度、异常分数和原始有效载荷等独立字段。这些解码后的值随后被转发至Datacake进行可视化处理。
仪表盘集成
传入的分类结果在Datacake仪表板中进行可视化。该仪表板显示当前服务器状态、置信度分数、异常分数以及设备连接状态,可简单概述被监控服务器的行为,并有助于识别随时间推移出现的异常声学或振动模式。
在当前的原型中,仪表板用于验证从本地边缘分类到LoRaWAN传输以及云端可视化的一整套AIoT流程。
系统概览
系统的流程如下:
•NatureGuard物联网设备可采集被监控服务器或机架的声学和振动信号。
•Edge Impulse 机器学习模型在设备上本地处理信号。
•系统对当前运行状态进行分类,例如启动状态、正常运行、关机状态、未知状态或潜在异常。
•通过LoRaWAN传输包含预测状态、置信度和异常分数的紧凑型结果。
•The Things Stack 解码有效载荷并将数据转发至 Datacake。
•Datacake仪表板可显示当前状态、置信度、异常分数、原始负载以及设备状态。
通过结合边缘人工智能、物联网通信和物理信号分析,该项目展示了一种轻量化的非侵入式服务器监控方法。该系统无需依赖软件代理或服务器内部指标,而是通过观察声音和振动模式来检测硬件行为的变化。
本文编译自hackster.io





