CPU|IBM 为 Linux 内核提出新的命名空间机制 Linux|IBM|操作系统

出品|开源中国
文|Travis
命名空间（Namespace）是 Linux 内核的一个特性，它对内核资源进行分区，使得一组进程看到一组资源，而另一组进程看到一组不同的资源。该功能的工作原理是为一组资源和进程使用相同的命名空间，但这些命名空间引用不同的资源。资源可能存在于多个空间中。此类资源的示例包括进程 ID、主机名、用户 ID、文件名以及一些与网络访问和进程间通信相关的名称。
IBM 工程师 Pratik Sampat 了 Linux 内核的 CPU Namespace 接口的早期原型。设计这个命名空间是为了解决当前查看可用 CPU 资源的方法的一致性问题，以及解决因了解系统上的资源访问/位置而可能产生的安全问题。
如今，在容器上运行的应用程序在 cgroups 的帮助下执行它们的 CPU、内存限制与要求。然而，许多应用程序通过 sysfs/procfs 继承或以其他方式获得系统的视图，并根据这些信息分配资源，如线程/进程的数量，内存分配。这可能会导致意外的运行行为，并对性能产生很大影响。
除了一致性问题，目前的处理方式也给多租户系统带来了安全和公平使用的影响，例如：
攻击者可以在知道 CPU 节点拓扑的情况下调度工作负载并选择 CPU ，从而使总线被淹没而造成拒绝服务攻击；以及识别 CPU 系统拓扑结构可以帮助识别靠近总线和外围设备（如 GPU）的内核，以便从其他工作负载中获得不适当的延迟优势。
因此，由 IBM 领导的 CPU Namespace 提案追求以下设计：

这个原型补丁集引入了一个新的内核命名空间机制 —— CPU Namespace 。
CPU Namespace 通过虚拟化逻辑 CPU ID 和创建相同的虚拟 CPU 映射来隔离 CPU 信息。它锁定在 task_struct 上，并且 CPU 转化被设计成扁平的层次结构，这意味着每个虚拟命名空间 CPU 在创建命名空间时都映射到一个物理 CPU ，转化速度更快；并且子代不需要向上遍历树来检索转化。
该命名空间允许控制和显示接口都能够感知 CPU 命名空间上下文，这样命名空间内的任务只能通过虚拟 CPU 映射获取视图并因此控制它，以及查看可用的 CPU 资源。

【CPU|IBM 为 Linux 内核提出新的命名空间机制】在用 Nginx Web 服务器进行的测试中，内存利用率下降了 92-95% ，延迟减少了 64% ，每秒的请求和传输等吞吐量没有显著变化。虽然目前的设计仍有存在一些缺陷，但随着 IBM 的持续改进， Linux 的性能有望大幅提升。