当前位置:首页 > 公众号精选 > CPP开发者
[导读]我们知道为了CPU之间减少“干扰”,每个CPU上都有一个任务队列。运行的过程种可能会出现有的CPU很忙,有的CPU很闲,如下图所示:为了避免这个问题的出现,Linux内核实现了CPU可运行进程队列之间的负载均衡。因为负载均衡是在多个核上的均衡,所以在讲解负载均衡之前,我们先看下多...

我们知道为了 CPU 之间减少“干扰”,每个 CPU 上都有一个任务队列。运行的过程种可能会出现有的 CPU 很忙,有的 CPU 很闲,如下图所示:

为了避免这个问题的出现,Linux 内核实现了 CPU 可运行进程队列之间的负载均衡

因为负载均衡是在多个核上的均衡,所以在讲解负载均衡之前,我们先看下多核的架构。

将 task 从负载较重的 CPU 上转移到负载相对较轻的 CPU 上执行,这个过程就是负载均衡的过程。

多核架构

这里以 Arm64 的 NUMA(Non Uniform Memory Access) 架构为例,看下多核架构的组成。

从图中可以看出,这是非一致性内存访问。每个 CPU 访问 local memory,速度更快,延迟更小。因为 Interconnect 模块的存在,整体的内存会构成一个内存池,所以 CPU 也能访问 remote memory,但是相对 local memory 来说速度更慢,延迟更大。

我们知道一个多核心的 SOC 片上系统,内部结构是很复杂的。内核采用 CPU 拓扑结构来描述一个 SOC 的架构,使用调度域和调度组来描述 CPU 之间的层次关系。

CPU 拓扑

每一个 CPU 都会维护这么一个结构体实例,用来描述 CPU 拓扑。

struct cpu_topology {
 int thread_id;
 int core_id;
 int cluster_id;
 cpumask_t thread_sibling;
 cpumask_t core_sibling;
};
  • thread_id: 从 mpidr_el1 寄存器中获取
  • core_id:从 mpidr_el1 寄存器中获取
  • cluster_id:从mpidr_el1寄存器中获取
  • thread_sibling:当前 CPU 的兄弟 thread。
  • core_sibling:当前 CPU 的兄弟Core,即在同一个 Cluster 中的 CPU。
可以通过 /sys/devices/system/cpu/cpuX/topology 查看 cpu topology 的信息。

cpu_topology 结构体是通过函数 parse_dt_topology() 解析 DTS 中的信息建立的:

kernel_init() -> kernel_init_freeable() -> smp_prepare_cpus() -> init_cpu_topology() -> parse_dt_topology()

static int __init parse_dt_topology(void)
{
 struct device_node *cn, *map;
 int ret = 0;
 int cpu;

 cn = of_find_node_by_path("/cpus");          ------(1)
 if (!cn) {
  pr_err("No CPU information found in DT\n");
  return 0;
 }

 /*
  * When topology is provided cpu-map is essentially a root
  * cluster with restricted subnodes.
  */

 map = of_get_child_by_name(cn, "cpu-map");   ------(2)
 if (!map)
  goto out;

 ret = parse_cluster(map0);                 ------(3)
 if (ret != 0)
  goto out_map;

 topology_normalize_cpu_scale();

 /*
  * Check that all cores are in the topology; the SMP code will
  * only mark cores described in the DT as possible.
  */

 for_each_possible_cpu(cpu)
  if (cpu_topology[cpu].cluster_id == -1)
   ret = -EINVAL;

out_map:
 of_node_put(map);
out:
 of_node_put(cn);
 return ret;
}
  1. 找到 dts 中 cpu topology 的根节点 "/cpus"
  2. 找到 "cpu-map" 节点
  3. 解析 "cpu-map" 中的 cluster
以 i.mx8qm 为例,topology 为:”4A53 2A72”,dts中定义如下:

# imx8qm.dtsi

cpus: cpus {
        #address-cells = <2>;
        #size-cells = <0>;

        A53_0: cpu@0 {
                device_type = "cpu";
                compatible = "arm,cortex-a53""arm,armv8";
                reg = <0x0 0x0>;
                clocks = <
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

摘要:介绍了分布式计算的定义、分类,简要说明了基于云平台部署分布式计算的优势,通过一个web负载均衡案例,分析了简单、高效地进行分布式计算部署的过程。

关键字: 云平台 分布式计算 负载均衡

(全球TMT2022年6月17日讯)日前,在由存储产业技术创新联盟主办的"元宇宙存储研究与实践"开放计算技术沙龙上,来自中科大、华中大、郑州大学以及浪潮存储的"产学研用"各界专家汇聚一堂,在关注元宇宙存储发展的同时,还...

关键字: 数据中心 节点 带宽 负载均衡

摘要:网络业务量的激增和应用的特殊化都使得负载均衡成为迫切需求,Linux虚拟服务器按传输层连接对集群节点进行业务分配的方式,能便捷而高效地实现负载均衡。文中对Linux虚拟服务器集群的结构与原理进行了讨论,重点阐述了满...

关键字: 集群 虚拟服务器集群 负载均衡

首先告诉大家一件事,在十一国庆期间,引擎的机器又又。。。又扛不住了流量。经过监控分析,发现某个服务的一个实例所在的虚拟机扛不住了,所以采取临时措施流量控制之后,问题解决了,但还是造成了不小的损失。经过此次故障,以及分析故...

关键字: 负载均衡

摘 要 :文中分析了传统软硬件划分方法的缺点,基于嵌入式系统产品开发实际,提出了一种去中心化的软硬件划分方法。文中详细描述了该方法的五条指导性原则,并用一个开发实例说明了上述原则的应用方法,验证了该方法的有效性。该划分...

关键字: 去中心化 软硬件划分 负载均衡 软件固件化 嵌入式 并发性

摘 要:针对STP和PVST协议的特点,利用网络仿真软件进行仿真,通过对仿真结果的分析和比较,掌握两种协议的工作原理及特点。特别是通过仿真环境的实现,体现出PVST协议具备负载均衡的优势。

关键字: 网络仿真 Packet Tracer 负载均衡 协议分析

摘 要:鉴于Nginx服务器在负载均衡方面的优越性能,将其运用到智慧农业系统设计中,可以很好地解决系统在大并发访问下的性能瓶颈问题。智慧系统中应用服务器来处理指令信息的中转,有很复杂的业务逻辑关系,而利用Java多线程技...

关键字: Nginx服务器 负载均衡 Java多线程 智慧农业系统

前言今天我们来深度解密一下负载均衡器LVS的秘密,相信大家看了你管这破玩意儿叫负载均衡?这篇文章后,还是有不少疑问,比如LVS看起来只有类似路由器的转发功能,为啥说它是四层(传输层)负载均衡器呢,今天我们就来逐渐揭开LV...

关键字: 负载均衡

前言今天我们来深度解密一下负载均衡器LVS的秘密,相信大家看了你管这破玩意儿叫负载均衡?这篇文章后,还是有不少疑问,比如LVS看起来只有类似路由器的转发功能,为啥说它是四层(传输层)负载均衡器呢,今天我们就来逐渐揭开LV...

关键字: 负载均衡

“为什么负载均衡一般采用混合方式七层负载为什么比四层负载性能要低?四层负载概念真的对吗?文章较长,各位能不能持久到最后?image在正式开篇之前,先说几个瓜:硬件负载均衡的性能最高,其次是软件负载均衡的四层负载,最差的是...

关键字: 负载均衡
关闭
关闭