当前位置:首页 > 公众号精选 > Linux阅码场
[导读]作者简介胡哲宁,西安邮电大学计算机科学与技术专业大二学生。GoogleSwitchTo由于协程本身对操作系统的不可见性,协程中出现的BUG往往不能通过一些已有的工具去排查。在谷歌内部有一套闭源的用户态任务调度框架SwitchTo,这个框架可以为谷歌提供延迟敏感的服务,对运行的内容...


作者简介


胡哲宁,西安邮电大学计算机科学与技术专业大二学生。

Google SwitchTo

由于协程本身对操作系统的不可见性,协程中出现的 BUG 往往不能通过一些已有的工具去排查。在谷歌内部有一套闭源的用户态任务调度框架 SwitchTo, 这个框架可以为谷歌提供延迟敏感的服务,对运行的内容进行细粒度的用户空间控制/调度,它可以让内核来实现上下文的切换,同时将任务何时切换,何时恢复的工作交给了用户态的程序来做,这样既可以实现在任务间协作式切换的功能,又可以不丧失内核对于任务的控制和观察能力。谷歌去年恢复尝试将其 SwitchTo API 上游引入 Linux。相关补丁见:[1],[2],[3],[4].

1pid_t switchto_wait(timespec *timeout)
2/*  Enter an 'unscheduled state', until our control is re-initiated by another thread or external event (signal). */
3void switchto_resume(pid_t tid)
4/* Resume regular execution of tid */
5pid_t switchto_switch(pid_t tid)
6/* Synchronously transfer control to target sibling thread, leaving the current thread unscheduled.Analogous to:Atomically { Resume(t1); Wait(NULL); }
7*/

这是使用 SwitchTo 和使用其他线程间切换的组件的上下文切换性能对比:

BenchmarkTime(ns)CPU(ns)Iterations
BM_Futex290519581000000
BM_GoogleMutex310223261000000
BM_SwitchTo1791783917412
BM_SwitchResume273415541000000
可以看到在使用 SwitchTo 后切换的性能比其他组件提高了一个数量级别。

SwitchTo 是如何做到在切换性能上大幅度领先的呢?我们暂时可能无法看到它们,但让我们来看看 Peter Oskolkov 向 LKML(Linux Kernel Mail List) 提出的补丁中有关 futex_swap() 的实现。可以确定的是,SwitchTo 构建在这个内核函数之上。

什么是 futex

futex 全称 fast user-space locking,快速用户空间互斥锁,作为内核中一种基本的同步原语,它提供了非常快速的无竞争锁获取和释放,用于构建复杂的同步结构:互斥锁、条件变量、信号量等。由于 futex 的一些机制和使用过于复杂,glibc 没有为 futex 提供包装器,但我们仍然可以使用 syscall 来调用这个 极其 hack 的系统调用。

1static int futex(uint32_t *uaddr, int futex_op, uint32_t val,
2                 const struct timespec *timeout, uint32_t *uaddr2,
3                 uint32_t val3)

4 
{
5  return syscall(SYS_futex, uaddr, futex_op, val, timeout, uaddr2, val3);
6}
  • uaddr: 一个四字节的用户空间地址。多个任务间可以通过 *uaddr 的值的变化来控制阻塞或者运行。

  • futex_op: 用于控制 futex 执行的命令 如 FUTEX_WAITFUTEX_WAKEFUTEX_LOCK_PIFUTEX_UNLOCK_PI

  • val: 在不同的 futex_op 具有不同的含义,如在 futex(uaddr, FUTEX_WAKE) 中作为唤醒等待在该 futex 上所有任务的数量。

  • timeout: 作为等待(如 FUTEX_WAIT)的超时时间。

  • uaddr2: uaddr2 参数是一个四字节的用户空间地址 在需要的场景使用(如后文的 FUTEX_SWAP )。

  • val3: 整数参数val3的解释取决于在操作上。

为什么 futex “快速”?

由于用户模式和内核模式之间的上下文切换很昂贵,futex 实现的同步结构会尽可能多地留在用户空间,这意味着它们只需要执行更少的系统调用。futex 的状态存储在用户空间变量中,futex 可以通过一些原子操作在没有竞争的情况下更改 futex 的状态,而无需系统调用的开销。

futex_wait() 和 futex_wake()

在看 futex_swap() 之前让我们先看看 内核中 与 futex 最重要的两个内核函数:

1static int futex_wait(u32 __user *uaddr, unsigned int flags, u32 val, ktime_t *abs_time, u32 bitset);
简单来说 对于 futex_wait() 有用的参数就只有 uaddrvalabs_time,就像 futex_wait(uaddr,val,abs_time)。其含义是当这个用户空间地址 uaddr的值等于传入的参数 val 的时候睡眠,即 if (*uaddr == val) wait(). futex_wake() 可以将它唤醒,另外还可以通过指定超时时间来超时唤醒。

1static int futex_wait(u32 __user *uaddr, unsigned int flags, u32 val,
2              ktime_t *abs_time, u32 bitset)

3
{
4    struct hrtimer_sleeper timeout, *to;
5    struct restart_block *restart;
6    struct futex_hash_bucket *hb;
7    struct futex_q q = futex_q_init;
8    int ret;
9
10    if (!bitset)
11        return -EINVAL;
12    q.bitset = bitset;
13  /* 设置定时器 */
14    to = futex_setup_timer(abs_time, 
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

共创包容性数字未来 新加坡2024年5月8日 /美通社/ -- 5月29日至31日,亚洲旗舰科技平台新加坡亚洲科技大会(Asia Tech x Singapore,简称AT...

关键字: 新加坡 ATX AN TE

深圳2024年5月6日 /美通社/ -- 从4月23日的一场大会开始,到24-26日的IOTE会展节,我们共同见证了物联网领域的最新技术、产品和解决方案的集中展示,感受到了AIoT释放数字经济潜力的巨大能量。今天以展商满...

关键字: IoT 物联网 TE AIOT

德国斯图加特和加利福尼亚州普莱森顿2024年4月16日 /美通社/ -- 全球高科技设施设计、工程和交付的领先企业Exyte宣布,计划收购全球领先的安装服务、设备和技术设施管理提供商—Kinetics集团(简称"Kine...

关键字: NET TI TE IC

上海2023年9月25日 /美通社/ -- 在9月20日举行的2023华为全联接大会(Huawei Connect 2023) TECH4ALL峰会,邀请全球TECH4ALL合作伙伴,针对科技与伙伴关系在支持创造更平等、...

关键字: 华为 TE AI SI

深圳2023年9月22日 /美通社/ -- 9月20 - 9月22日,全球物联网行业的重要盛会"IOTE 2023国际物联网展"在深圳国际会展中心 (宝安) 盛大启幕。全球领先的移动通信物联网平台 —...

关键字: 智能制造 物联网 TE IoT

科威特科威特城2023年9月21日 /美通社/ -- 秉承去年突破性科技、金融和数字银行创新峰会的势头,/MoneyTech将于11月12日重返科威特。  请在 aljaridasummits.com ...

关键字: MONEY TE BSP MIT

苏州太仓2023年9月21日 /美通社/ -- 2023年9月21日,施迈茨公司庆祝了以"施迈茨(中国)有限公司开业典礼暨施迈茨深耕中国20年"为主题的活动。 施迈茨集团成立于1910年,总部位于德...

关键字: 自动化 BSP 元器件 TE

- 经过升级后,MediaGo的IVT过滤器可以识别40多种无效流量 旧金山2023年9月21日 /美通社/ -- 百度国际事业部旗下基于深度学习的智能广告平台MediaGo今天宣布与世界领先的全渠道广告欺诈...

关键字: MEDIA TE PI GO

赋能员工职涯 开创智慧未来 上海2023年9月18日 /美通社/ -- 长期致力于人才培育并重视员工职涯发展的台达,9月8日于知名人力资源服务平台HRtech在深圳举办的“数字化与全面体验时代——2023人力资源科技年...

关键字: CHINA TE 数字化 AI

(全球TMT2023年9月15日讯)SAI.TECH Global Corporation宣布其旗下ULTIWIT业务线已开始研发和生产一体化浸没集装箱AI数据中心产品A1,该产品将搭配技嘉科技HPC浸没服务器结合使用...

关键字: AI 数据中心 TE PC
关闭
关闭