基于XIAO nRF52构建边缘AI智能听诊器探索,采用预训练的Edge Impulse模型实现边缘端心肺异常检测
我们的学生项目始于一个问题:能否使用便宜的听诊器和经济实惠的微控制器来听到并分析心脏和肺部的声音?我们并不打算制造出经过认证的医疗设备,只是想看看一个简单的DIY装置是否能捕捉到足够清晰的身体声音,以便机器学习模型能够识别它们。
硬件
为了捕捉声学信号,我们仅花费5欧元购买了一台标准的机械听诊器。我们将金属耳片剪掉,直接将剩余的橡胶管连接到XIAO nRF52840 Sense模块上,并将其正对内置数字麦克风的小孔位置。然后用一个定制的外壳固定,使声波能准确地传送到传感器。
我们直接剪掉了金属耳片,取下剩余的橡胶管,并将其尽可能靠近XIAO模块上微小的麦克风孔位。然后严密密封,以确保胸部部件发出的声学信号能直线传送到电子传感器。
为什么我们的照片里会有更大的画板?
在我们的项目照片中,可以看到XIAO模块连接到一块更大的电路板。这是NatureGuard物联网板,由卢布尔雅那大学电气工程学院(UL FE)设计开发的教育平台,用于教授基础的物联网概念。该板支持LoRaWAN等特性,并配有SD卡插槽。
给社区的说明:我们仅使用了XIAO nRF52840 Sense的核心功能(麦克风和蓝牙)。你不需要完整的NatureGuard板就能复制这个项目;一个独立的XIAO模块运行方式完全相同!
数据集
我们没有构建复杂的自定义神经网络,而是专注于搭建一个干净、直接的数据集,看看 Edge Impulseulse 能直接为我们带来怎样的结果。
我们手动标注了这些文件,并很快发现原始的医学数据集存在严重不平衡的问题。为了确保AI不会总是猜测单一类别,我们对数据进行了裁剪。通过删除多余文件,最终实现了50/50的平衡——大约50%的记录代表健康受试者,50%代表有异常或问题的受试者。
训练集与测试集划分
为了准确评估我们的模型是真正学习还是仅仅在记忆,我们采用了标准的80/20训练/测试划分。这意味着Edge Impulse使用了平衡数据集的80%进行模型训练,同时将剩余的20%完全作为“测试数据”,以便后续验证准确性。
主要问题:数据集规模与样本重叠严重
即使成功训练了模型,我们在软件阶段仍遇到了两个主要瓶颈,限制了其在现实世界中的准确率:
重叠样本过多:由于原始录音中包含连续音频,而异常事件以短时间间隔出现,将其切分成窗口后,生成的样本之间变得过于相似。
数据集时间有限:在严格平衡各类别并剔除多余不平衡数据后,我们仅保留了22分钟的音频录音供模型学习。这种数据多样性不足,导致模型在接触真实世界实时声学信号时难以良好泛化。
导出Arduino库
培训结束后,我们直接进入部署选项卡,选择了Arduino库,并下载了编译好的代码为ZIP文件夹。
这为我们提供了模型——一个包含训练会话所有权重的固定库。我们直接将这个ZIP文件导入Arduino IDE,以便XIAO微控制器能够本地运行推理,并完全离线操作。
为什么在现实生活中不起作用
尽管我们的数字物联网管道运行正常——XIAO微控制器成功采集音频,运行了本地的TinyML库,并准备通过蓝牙传输数据——但实际的实地测试未能提供准确的诊断结果。
当我们把听诊器放在人体胸部时,模型无法可靠地检测到心跳或呼吸模式。这种失败源于三个主要的实际因素:
令人难以忍受的噪音:专业数字听诊器是经过精心设计的设备,采用专用声学腔体、多级带通滤波器来隔离身体频率(20-2000赫兹),并具备主动降噪功能。而我们的5欧元橡胶管却毫无这些优点。它就像一根敞开的吸管,将所有声音都吸入其中:房间内的环境回响、手部抖动,最糟糕的是——橡胶管与皮肤摩擦产生的巨大摩擦噪音。
微控制器麦克风的局限性:XIAO nRF52840 Sense Sense 内置的数字麦克风并非用于精细的听诊。如果没有外部模拟放大器和适当的声学屏蔽,该麦克风无法在背景噪音中捕捉人体内部细微的声音。
软件瓶颈(小数据集与重叠):如前所述,仅有22分钟的总训练数据意味着我们的模型缺乏足够的深度来理解数据的差异性。再加上源数据集中样本高度重叠,当神经网络暴露于嘈杂、混乱的真实世界环境中时,其本质上变得“盲目”。信噪比实在太低,导致模型无法捕捉到信号。
结论与关键要点
尽管我们没有开发出一个实用的医疗诊断工具,但这个大学项目却是一次令人惊叹且极具价值的工程实践。它让我们学到了关于边缘人工智能和物联网开发的几项重要经验:
“输入垃圾,输出垃圾”原则:这是机器学习的黄金法则。无论你如何清理数据集,或在 Edge Impulse 中如何优化模型,人工智能都无法从被破坏、充满噪声的模拟信号中提取有意义的信息。良好的硬件和物理声学环境必须优先考虑。
全栈物联网理解:我们成功使用了整个流程。我们学习了如何获取和平衡公共生物医学数据,训练TinyML模型,并在受限硬件上本地部署该模型,同时设计了一套蓝牙低功耗通信系统。
原型制作的价值:一个5欧元的听诊器和一个微控制器非常适合低成本的教育实验。它让我们清楚地看到了简单“创客”改装与专业医学工程之间的界限。
本文编译自hackster.io





