当前位置:首页 > 嵌入式 > 嵌入式分享
[导读]在 Linux 系统运维过程中,系统卡顿是一个令人头疼的问题。当系统出现卡顿时,用户界面无响应、服务延迟增加,严重时甚至会导致业务中断。不可中断进程(处于 D 状态)往往是系统卡顿的“罪魁祸首”之一。这些进程由于等待某些硬件资源(如磁盘 I/O、网络 I/O 等)而无法被信号中断,从而阻塞了整个系统的正常运行。本文将介绍如何利用 eBPF 和 ftrace 这两大强大的工具,追踪不可中断进程的阻塞链,精准定位系统卡顿的根源。


在 Linux 系统运维过程中,系统卡顿是一个令人头疼的问题。当系统出现卡顿时,用户界面无响应、服务延迟增加,严重时甚至会导致业务中断。不可中断进程(处于 D 状态)往往是系统卡顿的“罪魁祸首”之一。这些进程由于等待某些硬件资源(如磁盘 I/O、网络 I/O 等)而无法被信号中断,从而阻塞了整个系统的正常运行。本文将介绍如何利用 eBPF 和 ftrace 这两大强大的工具,追踪不可中断进程的阻塞链,精准定位系统卡顿的根源。


不可中断进程(D 状态)概述

在 Linux 中,进程有多种状态,其中 D 状态(TASK_UNINTERRUPTIBLE)表示进程处于不可中断的睡眠状态。处于 D 状态的进程通常在等待硬件资源,例如磁盘读写操作完成。与可中断状态(S 状态)不同,D 状态的进程不会响应任何信号,包括 SIGKILL 信号,这使得它们难以被强制终止,也增加了系统卡顿排查的难度。


eBPF 与 ftrace 简介

eBPF

eBPF(extended Berkeley Packet Filter)是一种强大的内核技术,它允许用户在内核中运行沙箱化的程序,而无需修改内核代码或加载内核模块。eBPF 程序可以附加到内核的各种钩子点上,如系统调用入口、网络数据包处理路径等,从而实现对系统行为的实时监控和分析。


ftrace

ftrace 是 Linux 内核提供的一个内置跟踪框架,它可以用于跟踪内核函数的调用、执行时间等信息。ftrace 提供了多种跟踪工具和接口,如 function_graph、function 等,可以帮助开发者和运维人员深入了解内核的运行情况。


使用 eBPF 追踪不可中断进程

编写 eBPF 程序

以下是一个简单的 eBPF 程序示例,用于捕获处于 D 状态的进程信息:


c

#include <uapi/linux/ptrace.h>

#include <linux/sched.h>


struct data_t {

   u32 pid;

   char comm[TASK_COMM_LEN];

   u64 state;

};


BPF_PERF_OUTPUT(events);


int trace_sched_process_exec(struct pt_regs *ctx) {

   struct task_struct *task;

   struct data_t data = {};


   task = (struct task_struct *)bpf_get_current_task();

   data.pid = task->pid;

   bpf_get_current_comm(&data.comm, sizeof(data.comm));

   data.state = task->state;


   if (data.state == TASK_UNINTERRUPTIBLE) {

       events.perf_submit(ctx, &data, sizeof(data));

   }


   return 0;

}

加载 eBPF 程序

可以使用 BCC(BPF Compiler Collection)工具来加载上述 eBPF 程序。以下是一个 Python 脚本示例:


python

from bcc import BPF


# 加载 eBPF 程序

b = BPF(src_file="d_state_trace.c")


# 定义回调函数处理捕获的事件

def print_event(cpu, data, size):

   event = b["events"].event(data)

   print(f"PID: {event.pid}, Command: {event.comm.decode()}, State: {event.state}")


# 关联回调函数和性能事件

b["events"].open_perf_buffer(print_event)


# 启动跟踪

while True:

   try:

       b.perf_buffer_poll()

   except KeyboardInterrupt:

       exit()

运行上述 Python 脚本后,当有进程进入 D 状态时,会输出进程的 PID、命令名和状态信息。


使用 ftrace 追踪阻塞链

启用 ftrace 跟踪

可以使用以下命令启用 ftrace 的 function_graph 跟踪,以跟踪内核函数的调用关系:


bash

# 进入 ftrace 目录

cd /sys/kernel/debug/tracing


# 设置跟踪选项

echo function_graph > current_tracer


# 设置要跟踪的函数(这里以磁盘 I/O 相关函数为例)

echo "submit_bio* blk_mq_start_request* generic_make_request*" > set_ftrace_filter


# 启用跟踪

echo 1 > tracing_on

分析跟踪结果

当系统出现卡顿时,可以通过以下命令查看跟踪结果:


bash

cat tracing/trace

在跟踪结果中,可以查看进程在进入 D 状态前调用了哪些内核函数,从而分析出阻塞链。例如,如果发现进程在调用 submit_bio 函数后进入 D 状态,并且 submit_bio 函数又调用了 blk_mq_start_request 等函数,那么可以推测是磁盘 I/O 操作导致了进程阻塞。


综合分析与优化

通过 eBPF 和 ftrace 追踪到不可中断进程的阻塞链后,就可以针对性地进行优化。例如,如果是磁盘 I/O 瓶颈导致的卡顿,可以考虑升级磁盘硬件、优化磁盘读写策略或调整系统参数等。


总结

系统卡顿问题往往复杂多样,不可中断进程的阻塞是常见原因之一。利用 eBPF 和 ftrace 这两大工具,可以有效地追踪不可中断进程的阻塞链,精准定位系统卡顿的根源。通过编写 eBPF 程序捕获 D 状态进程信息,再结合 ftrace 跟踪内核函数调用关系,运维人员能够深入了解系统的运行情况,从而采取有效的优化措施,提高系统的稳定性和性能。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

自2014年ST公司推出STM32CubeMX以来,这款图形化配置工具凭借“一键生成初始化代码”“跨IDE兼容”“中间件集成”等特性,迅速成为78%的STM32开发者首选工具。然而,伴随其普及的争议始终未息:STM32C...

关键字: STM32CubeMX ST公司

在工业自动化领域,Modbus协议凭借其开放性和易用性成为设备通信的"通用语言"。然而,当工程师面对Modbus RTU、ASCII和TCP三种变体时,如何根据具体场景做出最优选择?本文将从编码机制、通信效率、错误检测等...

关键字: Modbus协议 TCP

在工业自动化、能源管理等实时性要求严苛的场景中,Modbus通信系统的响应延迟直接关系到设备控制的精度与系统稳定性。从智能电表的功率调节到机器人关节的同步控制,微秒级的响应偏差都可能引发连锁故障。本文从硬件架构、软件设计...

关键字: Modbus 通信系统

在新能源发电、电动汽车、数据中心等直流供电系统中,过压故障是导致设备损坏的主要诱因之一。据统计,电力电子设备故障中约35%与过压事件相关,其中直流侧过压占比达62%。本文以基于TVS二极管与MOSFET的复合型直流过压保...

关键字: 直流过压 保护电路

在工业物联网(IIoT)与边缘计算快速发展的背景下,Modbus协议凭借其轻量化特性成为微控制器(MCU)设备互联的首选方案。然而,在资源受限的MCU(如STM32F0系列、ESP8266等,RAM通常小于32KB,Fl...

关键字: 微控制器 Modbus 工业物联网

在工业控制系统中,Modbus RTU协议的CRC校验如同通信网络的"免疫系统",某石化厂DCS系统曾因CRC计算错误导致0.3%的数据包丢失,引发连锁控制故障。本文将深入解析CRC-16/MODBUS算法原理,对比软件...

关键字: Modbus RTU CRC 算法

在工业自动化领域,Modbus协议凭借其简洁高效的设计,已成为设备间通信的"通用语言"。某智能电网项目通过Modbus RTU协议实现2000台电表的数据采集,通信成功率高达99.97%,这背后正是对消息结构的精准把控。...

关键字: Modbus 工业自动化

在工业物联网设备开发中,Modbus从站功能已成为微控制器(MCU)的标配能力。某智能电表项目通过在STM32上实现Modbus RTU从站,成功将设备接入现有SCADA系统,开发周期缩短40%。本文将系统解析MCU实现...

关键字: 微控制器 Modbus 协议栈优化

在嵌入式系统中,Flash存储器因其非易失性、高密度和低成本特性,成为代码存储和关键数据保存的核心组件。然而,MCU驱动Flash读写时,开发者常因对硬件特性理解不足或操作流程疏忽,陷入性能下降、数据损坏甚至硬件损坏的陷...

关键字: MCU驱动 Flash

在嵌入式开发中,STM32的时钟系统因其灵活性和复杂性成为开发者关注的焦点。然而,看似简单的时钟配置背后,隐藏着诸多易被忽视的陷阱,轻则导致系统不稳定,重则引发硬件损坏。本文从时钟源选择、PLL配置、总线时钟分配等关键环...

关键字: STM32 时钟系统
关闭