使用用户名称空间隔离容器

预计阅读时间：10分钟

Linux名称空间为运行中的进程提供了隔离，从而限制了它们对系统资源的访问，而运行中的进程却没有意识到这些限制。有关Linux名称空间的更多信息，请参见 Linux名称空间。

防止来自容器内部的特权升级攻击的最佳方法是将容器的应用程序配置为以非特权用户身份运行。对于其进程必须以该root容器内的用户身份运行的容器，您可以将该用户重新映射到Docker主机上的特权较低的用户。已为映射的用户分配了一系列UID，这些UID在名称空间中的功能与普通UID相同，范围为0到65536，但对主机本身没有特权。

关于重新映射和下级用户和组ID

重新映射本身由两个文件处理：/etc/subuid和/etc/subgid。每个文件的工作原理相同，但一个文件与用户ID范围有关，另一个文件与组ID范围有关。考虑以下内容/etc/subuid：

testuser:231072:65536

这意味着将依次testuser分配一个下级用户ID范围231072和下一个65536个整数。UID231072作为UID 0（root）在名称空间内（在这种情况下，在容器内）映射。UID231073 映射为UID 1，依此类推。如果某个进程尝试将特权升级到名称空间之外，则该进程将作为主机上的非特权高编号UID运行，甚至不会映射到真实用户。这意味着该进程在主机系统上根本没有任何特权。

多个范围

通过在/etc/subuidor/etc/subgid文件中为同一用户或组添加多个不重叠的映射，可以为给定的用户或组分配多个下属范围。在这种情况下，泊坞窗只使用前五个映射，按照只有五个条目内核的限制/proc/self/uid_map和/proc/self/gid_map。

在将Docker配置为使用userns-remap功能时，可以选择指定现有用户和/或组，也可以指定default。如果指定default，dockremap则会创建一个用户和组并将其用于此目的。

警告：某些发行版，例如RHEL和CentOS 7.3，不会自动将新组添加到/etc/subuid和/etc/subgid文件中。在这种情况下，您负责编辑这些文件并分配不重叠的范围。先决条件中介绍了此步骤。

范围不要重叠是非常重要的，以使进程无法在其他名称空间中获得访问权限。在大多数Linux发行版中，添加或删除用户时，系统实用程序都会为您管理范围。

这种重新映射对容器是透明的，但是在容器需要访问Docker主机上的资源的情况下（例如将绑定装载绑定到系统用户无法写入的文件系统区域中），会带来一些配置复杂性。从安全角度来看，最好避免这些情况。

先决条件

从属UID和GID范围必须与现有用户相关联，即使该关联是实现细节。用户在下拥有命名空间的存储目录/var/lib/docker/。如果您不想使用现有用户，Docker可以为您创建一个并使用它。如果要使用现有的用户名或用户ID，则它必须已经存在。通常，这意味着相关条目需要位于 /etc/passwd和中/etc/group，但是如果您使用其他身份验证后端，则此要求可能会有所不同。

要验证这一点，请使用以下id命令：
```
$ id testuser

uid=1001(testuser) gid=1001(testuser) groups=1001(testuser)
```
在主机上处理名称空间重映射的方式是使用两个文件 /etc/subuid和/etc/subgid。添加或删除用户或组时，通常会自动管理这些文件，但是在某些发行版（例如RHEL和CentOS 7.3）上，可能需要手动管理这些文件。

每个文件包含三个字段：用户的用户名或ID，后跟开头的UID或GID（在名称空间中被视为UID或GID 0）以及用户可用的最大UID或GID。例如，给定以下条目：
```
testuser:231072:65536
```
这意味着由开头的用户命名进程testuser由主机UID 231072（看起来像0名称空间中的UID ）通过296607（231072 + 65536-1）拥有。这些范围不应重叠，以确保命名空间进程不能访问彼此的命名空间。

添加用户后，检查/etc/subuid并/etc/subgid查看您的用户是否在每个条目中都有一个条目。如果不是，则需要添加它，请注意避免重叠。

如果要使用dockremap由Docker自动创建的用户，请在配置和重新启动Docker之后检查dockremap这些文件中的条目。
如果Docker主机上的任何位置都需要非特权用户进行写操作，请相应地调整这些位置的权限。如果要使用dockremap由Docker自动创建的用户，也是如此，但是只有在配置并重新启动Docker之后才能修改权限。
userns-remap有效启用将掩盖现有的图像和容器层以及内的其他Docker对象/var/lib/docker/。这是因为Docker需要调整这些资源的所有权并将其实际存储在的子目录中/var/lib/docker/。最好在新的Docker安装上而不是现有的Docker上启用此功能。

同样，如果禁用userns-remap，则无法访问在启用该资源时创建的任何资源。
检查用户名称空间的限制，以确保可以使用。

在守护程序上启用userns-remap

您可以从标志开始dockerd，也可以--userns-remap按照以下过程使用daemon.json配置文件来配置守护程序。daemon.json建议使用该方法。如果使用标志，请使用以下命令作为模型：

$ dockerd --userns-remap="testuser:testuser"

编辑/etc/docker/daemon.json。假设该文件先前为空，则以下条目启用userns-remap使用名为的用户和组 testuser。您可以按ID或名称寻址用户和组。如果组名或ID与用户名或ID不同，则只需要指定即可。如果同时提供了用户名和组名或ID，请用冒号（:）分隔。以下格式的值的所有作品，假定的UID和GIDtestuser是1001：
- testuser
- testuser:testuser
- 1001
- 1001:1001
- testuser:1001
- 1001:testuser
```
{
  "userns-remap": "testuser"
}
```
注意：要使用dockremap用户并让Docker为您创建用户，请将值设置为default而不是testuser。

保存文件并重新启动Docker。
如果您使用的是dockremap用户，请验证Docker是否使用id命令创建了该用户。
```
$ id dockremap

uid=112(dockremap) gid=116(dockremap) groups=116(dockremap)
```
验证条目已添加到/etc/subuid和/etc/subgid：
```
$ grep dockremap /etc/subuid

dockremap:231072:65536

$ grep dockremap /etc/subgid

dockremap:231072:65536
```
如果这些条目不存在，请以root用户身份编辑文件并分配一个起始UID和GID，该ID是分配的最高UID和GID（在本例中为65536）。注意不要在范围内有任何重叠。
使用该docker image ls 命令验证先前的图像不可用。输出应为空。
从hello-world图像启动一个容器。
```
$ docker run hello-world
```

验证命名空间中是否存在/var/lib/docker/以该命名空间用户的UID和GID命名的命名空间目录，该目录由该UID和GID所拥有，并且不是组或世界可读的。某些子目录仍归所有者所有，root并具有不同的权限。

$ sudo ls -ld /var/lib/docker/231072.231072/

drwx------ 11 231072 231072 11 Jun 21 21:19 /var/lib/docker/231072.231072/

$ sudo ls -l /var/lib/docker/231072.231072/

total 14
drwx------ 5 231072 231072 5 Jun 21 21:19 aufs
drwx------ 3 231072 231072 3 Jun 21 21:21 containers
drwx------ 3 root   root   3 Jun 21 21:19 image
drwxr-x--- 3 root   root   3 Jun 21 21:19 network
drwx------ 4 root   root   4 Jun 21 21:19 plugins
drwx------ 2 root   root   2 Jun 21 21:19 swarm
drwx------ 2 231072 231072 2 Jun 21 21:21 tmp
drwx------ 2 root   root   2 Jun 21 21:19 trust
drwx------ 2 231072 231072 3 Jun 21 21:19 volumes

您的目录列表可能会有一些差异，特别是如果您使用的容器存储驱动程序不同于aufs。

使用由重新映射的用户拥有的目录，而不是直接位于其下方的相同目录，/var/lib/docker/并且/var/lib/docker/tmp/可以删除未使用的版本（例如此处的示例）。userns-remap启用后，Docker不会使用它们。

禁用容器的名称空间重新映射

如果在守护程序上启用了用户名称空间，则所有容器都将在默认情况下启用用户名称空间的情况下启动。在某些情况下，例如特权容器，您可能需要禁用特定容器的用户名称空间。有关这些限制中的某些限制，请参见用户名称空间的已知限制。

为了禁用用户命名空间特定容器中，添加--userns=host 标志到docker container create，docker container run或docker container exec命令。

使用此标志时会产生副作用：不会对该容器启用用户重新映射，但是由于容器之间共享了只读（图像）层，因此仍将重新映射容器文件系统的所有权。

这意味着整个容器文件系统将属于--userns-remap守护程序配置中指定的用户（231072在上面的示例中）。这可能导致容器内程序的意外行为。例如sudo（检查其二进制文件是否属于user 0）或带有setuid标志的二进制文件。

用户名称空间的已知限制

以下标准Docker功能与在启用了用户命名空间的情况下运行Docker守护程序不兼容：

与主机（--pid=host或--network=host）共享PID或NET名称空间。
外部（卷或存储）驱动程序，这些驱动程序不知道或无法使用守护程序用户映射。
--privileged在docker run未指定的情况下使用mode标志--userns=host。

用户名称空间是一项高级功能，需要与其他功能配合。例如，如果从主机装载了卷，则必须预先安排文件所有权，需要对卷内容的读取或写入访问权限。

尽管用用户命名空间的容器进程中的root用户具有该容器内超级用户的许多预期特权，但Linux内核基于内部知识（这是一个用用户命名空间的过程）施加了限制。一个值得注意的限制是无法使用该mknod命令。由root用户运行时，在容器内创建设备的权限被拒绝。

安全性，名称空间