IBM 为 Linux 内核提出新的命名空间机制

命名空间（Namespace）是 Linux 内核的一个特性，它对内核资源进行分区，使得一组进程看到一组资源，而另一组进程看到一组不同的资源。该功能的工作原理是为一组资源和进程使用相同的命名空间，但这些命名空间引用不同的资源。资源可能存在于多个空间中。此类资源的示例包括进程 ID、主机名、用户 ID、文件名以及一些与网络访问和进程间通信相关的名称。

IBM 工程师 Pratik Sampat 近日发表了 Linux 内核的 CPU Namespace 接口的早期原型。设计这个命名空间是为了解决当前查看可用 CPU 资源的方法的一致性问题，以及解决因了解系统上的资源访问/位置而可能产生的安全问题。

如今，在容器上运行的应用程序在 cgroups 的帮助下执行它们的 CPU、内存限制与要求。然而，许多应用程序通过 sysfs/procfs 继承或以其他方式获得系统的视图，并根据这些信息分配资源，如线程/进程的数量，内存分配。这可能会导致意外的运行行为，并对性能产生很大影响。

除了一致性问题，目前的处理方式也给多租户系统带来了安全和公平使用的影响，例如：

攻击者可以在知道 CPU 节点拓扑的情况下调度工作负载并选择 CPU，从而使总线被淹没而造成拒绝服务攻击；以及识别 CPU 系统拓扑结构可以帮助识别靠近总线和外围设备（如 GPU）的内核，以便从其他工作负载中获得不适当的延迟优势。

因此，由 IBM 领导的 CPU Namespace 提案追求以下设计：

这个原型补丁集引入了一个新的内核命名空间机制 —— CPU Namespace。
CPU Namespace 通过虚拟化逻辑 CPU ID 和创建相同的虚拟 CPU 映射来隔离 CPU 信息。它锁定在 task_struct 上，并且 CPU 转化被设计成扁平的层次结构，这意味着每个虚拟命名空间 CPU 在创建命名空间时都映射到一个物理 CPU，转化速度更快；并且子代不需要向上遍历树来检索转化。
该命名空间允许控制和显示接口都能够感知 CPU 命名空间上下文，这样命名空间内的任务只能通过虚拟 CPU 映射获取视图并因此控制它，以及查看可用的 CPU 资源。
在用 Nginx Web 服务器进行的测试中，内存利用率下降了 92-95%，延迟减少了 64%，每秒的请求和传输等吞吐量没有显著变化。虽然目前的设计仍有存在一些缺陷，但随着 IBM 的持续改进，Linux 的性能有望大幅提升。

来源：开源中国，转载已获授权
原文链接：https://www.oschina.net/news/163474/ibm-linux-cpu-namespace

IBM 为 Linux 内核提出新的命名空间机制原创

本月精选性能专题

本月精选线上案例

本月精选原创好文

联系我们

网媒渠道

友情链接