当前位置:首页 > 公众号精选 > 后端技术指南针
[导读]在使用C++开发的服务端程序中多线程还是主流,一般来说会有个线程池来处理接收的请求,这样可以有效提供服务器的并发能力和CPU的利用率。但是,多线程也是一把双刃剑。

1. 骚动的周五

小黑是大白前同事,现在俩人在不同的公司,但是都做后端开发工作。

虽然两个人都在北京,但是距离不算近,一个在望京,一个在中关村,算是北京几大IT聚集圈之二了。

两个人日常除了工作,业余活动并不多,当然头发也不多,宇宙中心五道口成了二人的集结地。

眨了5次眼,又到周五了,仿佛空气都弥漫着明天放假的欢快气息,当然还有骚动的大白和小黑:

大白看着时间差不多了,检查完上线监控报警,没啥问题,背上电脑走出了写字楼。

中关村到五道口还是比较近的,扫上低碳环保的青桔单车,一路向北到北大东门转弯来到了五道口地区。

小黑也坐上13号线,人贴人差点挤成肉饼,美食召唤下他还是在8点准时到了老地方。

大白:黑哥,你啥时候面的腾讯?挂了?你咋不找我内推我们公司呀!

小黑:还没挂,等GM面呢,你们公司手撕红黑树,整不了啊。

大白:就你这样,这么喜欢穿红卫衣和黑裤子,不问你红黑树才怪。话说腾讯都问啥了?

小黑:腾讯的面试整体感觉还是不错的,面试很宽泛,从操作系统、网络到系统设计、常用组件都会问,并且不偏不怪。

大白:那确实不错,是本着去挖掘和探测候选人技术边界,有啥奈斯的问题吗?讲讲啊

小黑:有个问题算是我的盲区了,给了几个Linux系统函数,让我看哪些是线程安全的,哪些是可重入的,并解释下为啥。

大白:哦哦,这是考察对线程安全函数和可重入函数的理解。那你咋回答的?

小黑:卧槽,我说我不太会呀,然后就jump下一题了。要不你给我讲讲?我先干一个!

小黑说完,吨吨吨,一大杯啤酒下肚了,大白见状扶了扶好几年没换的眼镜,开始和小黑讨论什么是线程安全和可重入。

2. 多线程和并发

在使用C++开发的服务端程序中多线程还是主流,一般来说会有个线程池来处理接收的请求,这样可以有效提供服务器的并发能力和CPU的利用率。
但是,多线程也是一把双刃剑。
单线程模式下,一切都是那么单调而稳定,所有的资源都是自己的,我的资源我做主。
多线程模式下,一个进程下装载了多个线程,每个线程除了部分资源是独享外,多个线程对大部分系统资源是共享的。
多个线程共享的进程资源:
  • 内存
  • 文件描述符
  • 地址空间
  • 全局数据
  • ...
每个线程独享的资源:
  • 线程寄存器
  • 线程栈
  • 线程ID、错误返回码、信号屏蔽码
  • ...
敲黑板划重点
1.进程是系统进行资源分配和调度的基本单位,线程是CPU调度和分派的基本单位;
2.进程是线程的载体,进程有独立地址空间,所有线程共享所在进程的地址空间;
3.进程是系统资源的大股东,而线程基本上不拥有系统资源,只占用少量在运行中必不可少的资源,比如程序计数器、一组寄存器和调用栈;
同一个进程中的多个线程有点像合租,大家共用大部分资源,自己独占一小部分资源,相互影响,然而但单进程单线程就是整租,自己独占所有资源,谁也不影响。
掌握多线程中资源共享和相互影响的特点之后,再来看看线程安全和可重入就容易很多。


3. 什么是线程安全

计算机中所谓的安全大多是指结果的正确且可预测性。
前面我们知道,多线程运行起来虽然可以提高并发能力,但是多个线程会共享很多资源,比如写全局数据,这种情况下就需要额外干预,否则将引发错乱的结果。

线程安全是在拥有共享数据的多条线程并行执行的进程中,可以正常且正确的执行,不会出现数据污染等意外情况,反之则称为线程不安全。

通俗一点讲,线程安全就怎么跑都不乱,线程不安全就是一跑就可能五花八门。

所以可能产生线程不安全根本原因在于:共享数据且共享数据可变。
这些共享数据包括全局变量、局部静态变量等,每个线程都可能对这个数据进行操作,并且操作结果会影响其他线程。
我们还经常提到另外一个术语:线程安全函数/线程安全类。
线程安全函数的一些特征:
  • 无任何共享的数据,都是局部数据;
  • 存在写共享数据,但是进行了加锁处理,可以实现多线程的同步调用;
  • 存在读但无写共享数据,无需加锁;
从图中可以看到
  • 同一进程内有四个工作线程;
  • 公共函数A 只执行打印操作,无论何时何线程调用,结果都是确定且正确的,因此是线程安全函数;
  • 公共函数B 使用了全局变量Count,并对其进行递增1操作,但是没有进行加锁同步处理,因此结果是不确定的,为线程不安全函数;
  • 公共函数C 使用了全局变量Factor,并对其进行递增2操作,使用了互斥锁进行同步确保结果的正确,是线程安全函数;
在编写多线程程序时,如果涉及多个线程操作一个公共函数,如果该函数本身不是线程安全的。
例如当一个函数F是线程安全函数,但是F调用线程不安全函数G时,同样需要对G进行加锁处理,否则函数F也将不安全。
在《深入理解计算机系统》一书中深入指出了线程不安全函数的分类:
  • 不保护共享产量的函数
  • 保持跨越多个调用状态的函数
  • 返回指向静态变量的指针的函数
  • 调用线程不安全函数的函数
前面介绍的几个例子大部分都是全局变量的不加锁控制相关的,还有两种就是:
  • 函数本次调用依赖于上次调用结果,也就是所谓的跨状态,典型的Linux中的rand()函数;
  • 函数将结果放在一个全局的指针中,典型的gethostbyname、localtime、strtok等;
// 函数原型
struct tm * localtime(const time_t *clock);

/* localtime example */
#include  
#include  

int main ()
{
  time_t rawtime;
  struct tm * timeinfo;

  time (&rawtime);
  timeinfo = localtime (&rawtime);

  return 0;
}
在localtime中将结果存放在timeinfo中,这个全局变量可以被任意的线程操作,因此将引发线程不安全。
对于Linux中线程不安全的函数可以查阅:
https://man7.org/linux/man-pages/man7/pthreads.7.html

4. 可重入函数

在理解了线程安全的相关定义和形成原因之后,我们来看下什么是可重入。
先来看看可重入的相关定义

一个程序可以在任意时刻被中断,然后系统去执行另外一段代码,结束后又调用继续原来的子程序不会出错,则称其为可重入(reentrant或re-entrant)。

从根本上来说
  • 可重入函数只使用自己栈上的变量,不依赖任何外部数据,可以允许有该函数的多个副本在运行,因为每个调用者产生的函数栈都是相互独立的;
  • 不可重入函数使用了一些系统资源,如果被中断的话,可能会出现问题;
可重入函数又分为两大类
  • 显式可重入:所有函数的参数都是值传递,并且只使用本地栈变量,那么函数就是显示可重入的,无论如何调用,都是可重入的,是绝对无条件的。

  • 隐式可重入:可重入函数中的一些参数是引用传递,只有在调用线程的时候传递指向非共享数据的指针时,它才是可重入的,是相对有条件的。

可重入函数需要满足以下几个条件
  • 函数内部不使用静态或者全局数据
  • 函数不返回静态或全局数据,数据的产生都由调用者提供
  • 不调用不可重入函数
从本质上来说,可重入函数实现了算法和数据的分离,函数内部的计算不依赖于外部,不影响也不受外部影响,是一种高效且安全的函数。
可重入函数都是线程安全函数,线程安全不一定是可重入函数。
不可重入函数可以遵守可重入规则去改造,从而变为可重入函数。

5. 小结

本文从多线程并发编程的一些特征进行阐述,引出了多线程下资源的共享本质。
正因为临界资源和竞态条件的存在,就产生了线程安全问题,在编写多线程程序时一定要考虑线程不安全带来的问题。
在理解线程安全的概念之后进一步引出了可重入函数。
从本质上来说,都是并发环境下由于共享资源带来的问题。
就这样,小黑听完之后虽然一知半解,但也频频点头,一看表快10点了,两个打工人结完账,消失在了去13号线五道口站的夜色中。

免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

机器人操作系统(ROS)驱动程序基于ADI产品而开发,因此可直接在ROS生态系统中使用这些产品。本文将概述如何在应用、产品和系统(例如,自主导航、安全气泡地图和数据收集机器人)中使用和集成这些驱动程序;以及这样将如何有助...

关键字: 电机控制器 机器人 嵌入式

支持高达48V@5A的PD受电模式,达到目前USB PD最高标准。

关键字: 嵌入式 开发板

【2024年4月8日,德国慕尼黑讯】低碳化和数字化是当今时代人们面临的两大核心挑战,人类社会需要依靠创新和先进的技术,才能破除挑战、推动转型进程。在德国纽伦堡举办的2024国际嵌入式展(Embedded World 20...

关键字: 半导体 微控制器 嵌入式

TDK 株式会社(TSE:6762)进一步扩充 Micronas 嵌入式电机控制器系列 HVC 5x,完全集成电机控制器与 HVC-5222D 和 HVC-5422D,以驱动小型有刷(BDC)、无刷(BLDC)或步进电机...

关键字: 嵌入式 电机控制器 内存

嵌入式开发作为信息技术领域的重要分支,其涉及的语言种类繁多,各具特色。这些语言的选择取决于目标平台的特性、性能需求、开发者的熟练程度以及项目的具体要求。本文将详细介绍几种常见的嵌入式开发语言,包括C语言、C++、汇编语言...

关键字: 嵌入式开发 C语言

嵌入式开发作为信息技术领域的重要分支,在当今智能化社会中的地位日益显著。它不仅在日常生活中的消费电子产品、工业自动化、汽车电子、航空航天等诸多领域发挥着不可或缺的作用,而且随着物联网、大数据、人工智能技术的发展,嵌入式开...

关键字: 嵌入式 信息技术

中国,北京和德国,纽伦堡 - EQS Newswire - 2024年4月2日 - 绿芯将于4月9日至11日在德国纽伦堡举行的2024年嵌入式世界展会 ((embedded world 2024),4A号馆606展位)展...

关键字: 固态硬盘 嵌入式 智能交通

虽然嵌入式芯片架构市场上有明确的引领者,但该行业正在快速扩张,预计未来几年将出现许多新的机会。当然,在这样的热门行业中,永远有创新技术和新产品的一席之地。

关键字: 嵌入式 处理器 RISC-V

2024年3月8日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 即日起供货Advantech的VEGA-P110 PCIe Intel® Arc A37...

关键字: 嵌入式 GPU卡 边缘AI
关闭
关闭