当前位置:首页 > 公众号精选 > 嵌入式微处理器
[导读]本文能学到 •busybox为例粗略跟踪软件执行过程方法 •如何判断文件差异 •cron 对任务计划文件要求 。

本文能学到

•busybox为例粗略跟踪软件执行过程方法
如何判断文件差异
•cron 对任务计划文件要求

1. 背景

无意中瞟一眼出厂产品的日志文件 /app/recode 大小居然有9MB,按照设计每10min执行任务检查/app/recode文件大小,该文件不会超过4MB,超过此大小则压缩处理,仅保留最近的日志内容。立马着手检查linux定时任务cron运行情况。

2. 初步排查

crontab -e 查看定时任务配置情况,其实是以root权限打开 var/spool/cron/crontabs/root 文件,第二行是本背景该执行的脚本,乍看一下没有任何问题。检查 /var/log/message 看是否有被执行的记录,“cat /var/log/message | grep cron”,干干净净!!!的确没被执行。 本来事情到此为止只算工程师一个平常无奇的日常,不过10min后再查看 /app/recode 居然从9MB变成4KB,/var/log/message也有执行记录,发生了什么?

3. 分析

为了分析具体原因,准备一新烧录的板卡作为排查对象。怀疑方向有三个,这三方面都是引起任务计划不被执行的诱因:
  • crontab file格式不正确
  • 文件系统被改写
  • crontab file所属用户不合法

3.1. x11 crontab file 格式不正确

crontab file文件位于 var/spool/cron/crontabs/root,当使用crontab -e命令打开该文件,不做任何修改并退出,cron任务计划能被运行。 怀疑var/spool/cron/crontabs/root文件里可能包含不合法字符或语法不正确,如:文件末尾有\r、\n、一行里有多个空格会影响cron解析该文件。 于是执行如下步骤排查:
  • 1.备份配置文件 cp var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;
  • 2.执行crontab -e;
  • 3.cron任务计划是否被执行,需查看记录 watch -n 1 cat /var/log/message。
  • 4.计算两文件md5是否一致 md5sum var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;
结果:文件一致。
证明:“crontab file 格式不正确”不是诱因。

3.2. x12 文件系统被改写

crontab -e虽然没有修改var/spool/cron/crontabs/root,但无法证明它有没有改写文件系统其他文件。于是在一块重新烧录镜像的板卡执行如下步骤排查:
  • 获取文件系统所有文件的MD5保存为/tmp/a.txt;
    find arch bin etc home lib media opt \root sbin tmp usr var -name "*" | \xargs md5sum > /unuse/a.txt 

  • 执行crontab -e;
  • 获取文件系统所有文件的MD5保存为/tmp/b.txt;
    find arch bin etc home lib media opt \root sbin tmp usr var -name "*" | \xargs md5sum > /unuse/b.txt
  • 比较a.txt和b.txt是否一致,从而证明crontab -e是否修改文件系统内容
结果:a.txt,b.txt文件一致。
证明:“x12 文件系统被改写”不是诱因。

3.3. x13 crontab file所属用户不合法

产品的cron是busybox的组件,源码面前无秘密。开始跟踪crond执行过程。

在busybox源码的miscutils/crond.c添加若干 “printf(”LINE %d", __ LINE __);"跟踪程序运行。
cron在前台运行,执行crond -f var/spool/cron/crontabs/root; 发现947行没有被执行,且文件指针是0; 推断:var/spool/cron/crontabs/root没有被读取。 跟踪文件读取函数load_crontab发现438行的if第二个条件不满足,DEAMON_UID是0,只有当sbuf.st_uid也等于0时才能执行文件读取,实际返回1000。变量sbuf.st_uid表示文件所属用户的UID。
  • •修改crontab file文件的UID和GID都是0,chown 0:0 /var/spool/cron/crontabs/root;
  • •重新启动crond:crond -f var/spool/cron/crontabs/
  • •10min后在/var/log/message里看到任务计划执行痕迹
    Jan 10 12:00:00 (none) cron.info crond[854]: USER root pid 3506 cmd /usr/bin/compresslog.shJan 10 12:00:00 (none) cron.info crond[854]: USER root pid 3508 cmd /usr/local/bin/recode_check.shJan 10 12:10:00 (none) cron.info crond[854]: USER root pid 5007 cmd /usr/local/bin/recode_check.shJan 10 12:20:00 (none) cron.info crond[854]: USER root pid 6506 cmd /usr/local/bin/recode_check.sh 
结果:修改“crontab file所属用户”有效,任务计划可以正常运行。
证明:“crontab file所属用户不合法”是诱因

4. 推断过程

 看到这个1000我已经觉察到问题根本原因,看我娓娓道来。 /etc/passwd记录linux用户所属UID、GID。UID=0、GID=0属于root用户。passwd有若干ID号,普通预设的用户的UID、GID在1~999,adduser创建的用户ID从1000开始,启动crond守护进程时会根据当前用名去 /var/spool/cron/crontabs/ 目录下寻找与用户名同名的文件,顺带检查该文件的所属用户UID,只有文件存在、UID相同才读取该文件。 按照设想,那么crontab -e执行后应该会修改用户所属ID,下面是实验步骤。
  • 再修改用户组为 1000 “chown 1000:root /var/spool/cron/crontabs/root”
  • 观察crontab -e执行前后文件所属用户是否改变
  • 实践和设想一致:crontab会修改文件所属用户。

5. 为什么测试阶段没发现问题

我的Linux系统开发环境普通用户编码从1000开始,为避免使用root用户误操作危害开发环境,一切文件均在普通用户环境下编辑,为有编辑权限,曾执行过 chown up /var/spool/cron/crontabs/root(不理解cron设计者为什么要去检查文件所属UID,即使当前已经是root权限),这个up就是我的用户名,up的UID=1000。 之所以在软件测试阶段未发现问题,原因在于任务计划默认10min才执行一次,为缩短测试时间而修改任务计划执行频率,提高测试效率,修改方法就是crontab -e编辑
/var/spool/cron/crontabs/root。
当初只注重recode_check.sh执行的正确性。
END

来源:写个解,作者:吴解君

免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

嵌入式ARM

扫描二维码,关注更多精彩内容

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

为了满足日益增长的数据处理需求,铁威马NAS推出了全新的性能巅峰2024年旗舰之作F4-424 Pro,并搭载了最新的操作系统--TOS 6。这款高效办公神器的问世,无疑将为企业和专业人士带来前所未有的便捷与效率。

关键字: 存储 Linux 服务器

双系统将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对双系统的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 双系统 Windows Linux

安装Linux操作系统并不复杂,下面是一个大致的步骤指南,以帮助您完成安装。1. 下载Linux发行版:首先,您需要从Linux发行版官方网站下载最新的ISO镜像文件。

关键字: Linux 操作系统 ISO镜像

计算机是由一堆硬件组成的,为了有限的控制这些硬件资源,于是就有了操作系统的产生,操作系统是软件子系统的一部分,是硬件基础上的第一层软件。

关键字: Linux 操作系统 计算机

Linux操作系统是一套免费使用和自由传播的类Unix操作系统,通常被称为GNU/Linux。它是由林纳斯·托瓦兹在1991年首次发布的,并基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。Lin...

关键字: Linux 操作系统

所谓进程间通信就是在不同进程之间传播或交换信息,它是一组编程接口,让程序员能够协调不同的进程,使之能在一个操作系统里同时运行,并相互传递、交换信息;还可以让一个程序能够在同一时间里处理许多用户的需求。

关键字: Linux 进程通信 编程接口

串口通信作为一种最传统的通信方式,在工业自动化、通讯、控制等领域得到广泛使用。

关键字: Linux 串口通信 通讯

2023年11月16日: MikroElektronika(MIKROE) ,作为一家通过提供基于成熟标准的创新式硬软件产品来大幅缩短开发时间的嵌入式解决方案公司,今天宣布推出一款基于单线设备的软硬件开源解决方案Cli...

关键字: 嵌入式 Linux 操作系统

Linux是一种免费使用和自由传播的类Unix操作系统,其内核由林纳斯·本纳第克特·托瓦兹于1991年10月5日首次发布。它主要受到Minix和Unix思想的启发,是一个基于POSIX的多用户、多任务、支持多线程和多CP...

关键字: Linux 操作系统

本文中,小编将对嵌入式予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 嵌入式 Linux
关闭
关闭