用 C 语言写一个简单的 Unix Shell（2）

在第一部分中我们讨论了 fork 系统调用以及它的注意事项。在本文中，我们将研究怎样执行命令。

这里将介绍 exec 函数家族。即以下函数：

execl
execv
execle
execve
execlp
execvp

为了满足需要，我们将使用 execvp，它的签名看起来像这样：

int execvp(const char *file, char *const argv[]);

函数名中的 vp 表明：它接受一个文件名，将在系统 $PATH 变量中搜索此文件名，它还接受将要执行的一组参数。

你可以阅读 exec 的 man 页面以得到其它函数的更多信息。

让我们看一下以下代码，它执行命令 ls -l -h -a：

execvp.c

#include

int main() {

char *argv[] = {"ls", "-l", "-h", "-a", NULL};

execvp(argv[0], argv);

return 0;

}

关于 execvp 函数，有几点需要注意：

第一个参数是命令名。
第二个参数由命令名和传递给命令自身的参数组成。并且它必须以 NULL 结束。
它将当前进程的映像交换为被执行的命令的映像，后面再展开说明。

如果你编译并执行上面的代码，你会看到类似于下面的输出：

total 32

drwxr-xr-x 5 dhanush staff 170B Jun 11 11:32 .

drwxr-xr-x 4 dhanush staff 136B Jun 11 11:30 ..

-rwxr-xr-x 1 dhanush staff 8.7K Jun 11 11:32 a.out

drwxr-xr-x 3 dhanush staff 102B Jun 11 11:32 a.out.dSYM

-rw-r--r-- 1 dhanush staff 130B Jun 11 11:32

它和你在你的主 shell 中手动执行ls -l -h -a的结果完全相同。

既然我们能执行命令了，我们需要使用在第一部分中学到的fork 系统调用构建有用的东西。事实上我们要做到以下这些：

当用户输入时接受命令。
调用 fork 以创建一个子进程。
在子进程中执行命令，同时父进程等待命令完成。
回到第一步。

我们看看下面的函数，它接收一个字符串作为输入。我们使用库函数 strtok 以空格分割该字符串，然后返回一个字符串数组，数组也用 NULL来终结。

include <stdlib.h>

#include

char **get_input(char *input) {

char **command = malloc(8 * sizeof(char *));

char *separator = " ";

char *parsed;

int index = 0;

parsed = strtok(input, separator);

while (parsed != NULL) {

command[index] = parsed;

index++;

parsed = strtok(NULL, separator);

}

command[index] = NULL;

return command;

}

如果该函数的输入是字符串 "ls -l -h -a"，那么函数将会创建这样形式的一个数组：["ls", "-l", "-h", "-a", NULL]，并且返回指向此队列的指针。

现在，我们在主函数中调用 readline 来读取用户的输入，并将它传给我们刚刚在上面定义的 get_input。一旦输入被解析，我们在子进程中调用 fork 和 execvp。在研究代码以前，看一下下面的图片，先理解 execvp 的含义：

当 fork 命令完成后，子进程是父进程的一份精确的拷贝。然而，当我们调用 execvp 时，它将当前程序替换为在参数中传递给它的程序。这意味着，虽然进程的当前文本、数据、堆栈段被替换了，进程 id 仍保持不变，但程序完全被覆盖了。如果调用成功了，那么 execvp 将不会返回，并且子进程中在这之后的任何代码都不会被执行。这里是主函数：

#include

#include

#include

#include

#include

#include

int main() {

char **command;

char *input;

pid_t child_pid;

int stat_loc;

while (1) {

input = readline("unixsh> ");

command = get_input(input);

child_pid = fork();

if (child_pid == 0) {

/* Never returns if the call is successful */

execvp(command[0], command);

printf("This won't be printed if execvp is successuln");

} else {

waitpid(child_pid, &stat_loc, WUNTRACED);

}

free(input);

free(command);

}

return 0;

}

全部代码可在此处的单个文件中获取。如果你用 gcc -g -lreadline shell.c 编译它，并执行二进制文件，你会得到一个最小的可工作 shell，你可以用它来运行系统命令，比如 pwd 和 ls -lha：

unixsh> pwd

/Users/dhanush/github.com/indradhanush.github.io/code/shell-part-2

unixsh> ls -lha

total 28K

drwxr-xr-x 6 root root 204 Jun 11 18:27 .

drwxr-xr-x 3 root root 4.0K Jun 11 16:50 ..

-rwxr-xr-x 1 root root 16K Jun 11 18:27 a.out

drwxr-xr-x 3 root root 102 Jun 11 15:32 a.out.dSYM

-rw-r--r-- 1 root root 130 Jun 11 15:38 execvp.c

-rw-r--r-- 1 root root 997 Jun 11 18:25 shell.c

unixsh>

注意：fork 只有在用户输入命令后才被调用，这意味着接受用户输入的用户提示符是父进程。

错误处理

到目前为止，我们一直假设我们的命令总会完美的运行，还没有处理错误。所以我们要对 shell.c做一点改动：

fork – 如果操作系统内存耗尽或是进程数量已经到了允许的最大值，子进程就无法创建，会返回 -1。我们在代码里加上以下内容：

...

while (1) {

input = readline("unixsh> ");

command = get_input(input);

child_pid = fork();

if (child_pid < 0) {

perror("Fork failed");

exit(1);

}

...

execvp – 就像上面解释过的，被成功调用后它不会返回。然而，如果执行失败它会返回 -1。同样地，我们修改 execvp 调用：

...

if (execvp(command[0], command) < 0) {

perror(command[0]);

exit(1);

}

...

注意：虽然fork之后的exit调用终止整个程序，但execvp之后的exit 调用只会终止子进程，因为这段代码只属于子进程。

malloc – 如果操作系统内存耗尽，它就会失败。在这种情况下，我们应该退出程序：

char **get_input(char *input) {

char **command = malloc(8 * sizeof(char *));

if (command == NULL) {

perror("malloc failed");

exit(1);

}

...

动态内存分配 – 目前我们的命令缓冲区只分配了8个块。如果我们输入的命令超过8个单词，命令就无法像预期的那样工作。这么做是为了让例子便于理解，如何解决这个问题留给读者作为一个练习。

上面带有错误处理的代码可在这里（https://indradhanush.github.io/code/shell-part-2/shell_with_error_handling.c）获取。

内建命令

如果你试着执行 cd 命令，你会得到这样的错误：

cd: No such file or directory

我们的 shell 现在还不能识别cd命令。这背后的原因是：cd不是ls或pwd这样的系统程序。让我们后退一步，暂时假设cd 也是一个系统程序。你认为执行流程会是什么样？在继续阅读之前，你可能想要思考一下。

流程是这样的：

用户输入 cd /。
shell对当前进程作 fork，并在子进程中执行命令。
在成功调用后，子进程退出，控制权还给父进程。
父进程的当前工作目录没有改变，因为命令是在子进程中执行的。因此，cd 命令虽然成功了，但并没有产生我们想要的结果。

因此，要支持 cd，我们必须自己实现它。我们也需要确保，如果用户输入的命令是 cd（或属于预定义的内建命令），我们根本不要 fork 进程。相反地，我们将执行我们对 cd（或任何其它内建命令）的实现，并继续等待用户的下一次输入。，幸运的是我们可以利用 chdir 函数调用，它用起来很简单。它接受路径作为参数，如果成功则返回0，失败则返回 -1。我们定义函数：

int cd(char *path) {

return chdir(path);

}

并且在我们的主函数中为它加入一个检查：

while (1) {

input = readline("unixsh> ");

command = get_input(input);

if (strcmp(command[0], "cd") == 0) {

if (cd(command[1]) < 0) {

perror(command[1]);

}

/* Skip the fork */

continue;

}

...

带有以上更改的代码可从这里（https://indradhanush.github.io/code/shell-part-2/shell_with_builtin.c）获取，如果你编译并执行它，你将能运行 cd 命令。这里是一个示例输出：

unixsh> pwd

/Users/dhanush/github.com/indradhanush.github.io/code/shell-part-2

unixsh> cd /

unixsh> pwd

/

unixsh>

第二部分到此结束。