当前位置:首页 > 单片机 > 程序喵大人
[导读]今天,我们来介绍一下 Linux 对虚拟内存空间管理的细节。

在 《漫画解说内存映射》一文中介绍过 虚拟内存物理内存 映射的原理与过程,虚拟内存与物理内存进行映射的过程被称为 内存映射。内存映射是硬件(内存管理单元)级别的功能,必须按照硬件的规范设置好内存映射的关系,进程才能正常运行。
但内存映射并不能区分内存的用途,比如我们想知道虚拟内存区间 0 ~ 2MB 是用作存储数据还是存储指令,这就很难从内存映射中获取到相关信息。所以,Linux 根据功能上的差异,来对虚拟内存空间进行管理。
今天,我们来介绍一下 Linux 对虚拟内存空间管理的细节。

之前我们说过,在 32 位的操作系统中,每个进程都拥有 4GB 的虚拟内存空间。Linux 根据功能上的差异,把整个虚拟内存空间划分为多个不同区间,称为
我们先来看看 Linux 进程虚拟内存空间的布局图,如图 1 所示:

上图展示了 Linux 进程的虚拟内存空间布局情况,我们只关注 用户空间 的布局。
从上图可以看出,进程的用户空间大小为 3GB。Linux 按照功能上的差异,把一个进程的用户空间划分为多个段,下面介绍一下各个段的作用:
  • 代码段:用于存放程序中可执行代码的段。
  • 数据段:用于存放已经初始化的全局变量或静态变量的段。如在 C 语言中,使用语句 int global = 10; 定义的全局变量。
  • 未初始化数据段:用于存放未初始化的全局变量或静态变量的段。如在 C 语言中,使用语句 int global; 定义的全局变量。
  • :用于存放使用 malloc 函数申请的内存。
  • mmap区:用于存放使用 mmap 函数映射的内存区。
  • :用于存放函数局部变量和函数参数。

虚拟内存区

从上面的介绍可知,Linux 按照功能上的差异,把虚拟内存空间划分为多个 。那么在内核中,是通过什么结构来管理这些段的呢?
答案就是:vm_area_struct


内核通过 vm_area_struct 结构(虚拟内存区)来管理各个 ,其定义如下:
1struct vm_area_struct {
2 struct mm_struct *vm_mm; /* The address space we belong to. */
3 unsigned long vm_start; /* Our start address within vm_mm. */
4 unsigned long vm_end; /* The first byte after our end address within vm_mm. */
5
6 /* linked list of VM areas per task, sorted by address */
7 struct vm_area_struct *vm_next;
8
9 pgprot_t vm_page_prot; /* Access permissions of this VMA. */
10 unsigned long vm_flags; /* Flags, see mm.h. */
11 struct rb_node vm_rb;
12 ...
13 /* Function pointers to deal with this struct. */
14 const struct vm_operations_struct *vm_ops;
15 ...
16};
下面介绍一下各个字段的作用:
  • vm_mm:指向进程的内存管理对象,每个进程都有一个类型为 mm_struct 的内存管理对象,用于管理进程的虚拟内存空间和内存映射等。
  • vm_start:虚拟内存区的起始虚拟内存地址。
  • vm_end:虚拟内存区的结束虚拟内存地址。
  • vm_next:Linux 会通过链表把进程的所有虚拟内存区连接起来,这个字段用于指向下一个虚拟内存区。
  • vm_page_prot:主要用于保存当前虚拟内存区所映射的物理内存页的读写权限。
  • vm_flags:标识当前虚拟内存区的功能特性。
  • vm_rb:某些场景中需要通过虚拟内存地址查找对应的虚拟内存区,为了加速查找过程,内核以虚拟内存地址作为key,把进程所有的虚拟内存区保存到一棵红黑树中,而这个字段就是红黑树的节点结构。
  • vm_ops:每个虚拟内存区都可以自定义一套操作接口,通过操作接口,能够让虚拟内存区实现一些特定的功能,比如:把虚拟内存区映射到文件。而 vm_ops 字段就是虚拟内存区的操作接口集,一般在创建虚拟内存区时指定。
我们通过图 2 来展示内核是怎么通过 vm_area_struct 结构来管理进程中的所有

从上图可以看出,内核通过一个链表和一棵红黑树来管理进程中所有的 mm_struct 结构的 mmap 字段就是链表的头节点,而 mm_rb 字段就是红黑树的根节点。

加载程序镜像

前面我们介绍了 Linux  会把虚拟内存地址划分为多个 ,并且使用 vm_area_struct 结构来管理这些段。那么,这些虚拟内存区是怎么建立起来的呢?
在介绍进程虚拟内存区建立的过程前,我们先来简单介绍一下 ELF文件格式

1. ELF文件

ELF 全称 Executable and Linkable Format,即可执行可链接文件格式。在 Linux 系统中,就是使用这种文件格式来存储一个可执行的应用程序。让我们来看一下 ELF 文件格式由哪些结构组成:
一般一个 ELF 文件由以下三部分组成:
  • ELF 头(ELF header):描述应用程序的类型、CPU架构、入口地址、程序头表偏移和节头表偏移等等;
  • 程序头表(Program header table):列举了所有有效的段(segments)和他们的属性,程序头表需要加载器将文件中的段加载到虚拟内存段中;
  • 节头表(Section header table):包含对节(sections)的描述。
ELF 文件的结构大概如图3所示:

当内核加载一个应用程序时,就是通过读取 ELF 文件的信息,然后把文件中所有的段加载到虚拟内存的段中。ELF 文件通过 程序头表 来描述应用程序中所有的段,表中的每一个项都描述一个段的信息。我们先来看看 程序头表 项的结构定义:
1typedef struct elf64_phdr {
2 Elf64_Word p_type; // 段的类型
3 Elf64_Word p_flags; // 可读写标志
4 Elf64_Off p_offset; // 段在ELF文件中的偏移量
5 Elf64_Addr p_vaddr; // 段的虚拟内存地址
6 Elf64_Addr p_paddr; // 段的物理内存地址
7 Elf64_Xword p_filesz; // 段占用文件的大小
8 Elf64_Xword p_memsz; // 段占用内存的大小
9 Elf64_Xword p_align; // 内存对齐
10} Elf64_Phdr;
所以,程序加载器可以通过 ELF 头中获取到程序头表的偏移量,然后通过程序头表的偏移量读取到程序头表的数据,再通过程序头表来获取到所有段的信息。
我们可以通过 readelf -S file 命令来查看 ELF 文件的段(节)信息,如下图所示:

上面列出了 代码段数据段未初始化数据段注释段 的信息。

2. 加载过程

要加载一个程序,需要调用 execve 系统调用来完成。我们来看看 execve 系统调用的调用栈:
1sys_execve
2└→ do_execve
3 └→ do_execveat_common
4 └→ __do_execve_file
5 └→ exec_binprm
6 └→ search_binary_handler
7 └→ load_elf_binary
从上面的调用者可以看出,execve 系统调用最终会调用 load_elf_binary 函数来加载程序的 ELF 文件。
由于 load_elf_binary 函数的实现比较复杂,所以我们分段来解说:
(1)读取并检查ELF头
1static int load_elf_binary(struct linux_binprm *bprm, struct pt_regs *regs)
2
{
3 ...
4 struct {
5 struct elfhdr elf_ex;
6 struct elfhdr interp_elf_ex;
7 } *loc;
8
9 loc = kmalloc(sizeof(*loc), GFP_KERNEL);
10 if (!loc) {
11 retval = -ENOMEM;
12 goto out_ret;
13 }
14
15 // 1. 获取ELF头
16 loc->elf_ex = *((struct elfhdr *)bprm->buf);
17
18 retval = -ENOEXEC;
19 // 2. 检查ELF签名是否正确
20 if (memcmp(loc->elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
21 goto out;
22
23 // 3. 是否是可执行文件或者动态库
24 if (loc->elf_ex.e_type != ET_EXEC
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭