操作系统性能文章 | HeapDump性能社区

Linux内核中用GFP_ATOMIC申请内存究竟意味着什么？

cpu

perf

本文使用了xpocket工具包的插件链接xpocket地址: [https://plugin.xpocket.perfma.com](https://plugin.xpocket.perfma.com

小子z5年前

9713

操作系统

编译选项和内核编译首先我们都知道,Linux内核如果用O0编译，是无法编译过的，Linux的内核编译，要么是O2，要么是Os，这点从Linux的Makefile里面可以看出：当选择了```CONFIG

coffeeboy5年前

9515

操作系统

从Linux源码看Socket(TCP)的accept

GFP_ATOMIC vs. GFP_KERNEL我们都知道，在中断、软中断、spinlock等原子上下文里面，申请内存，应该使用GFP_ATOMIC标记，譬如内核中有大量的kmalloc/GFP_A

牧杨5年前

9185

操作系统

socket

前言笔者一直觉得如果能知道从应用到框架再到操作系统的每一处代码，是一件Exciting的事情。今天笔者就从Linux源码的角度看下Server端的Socket在进行Accept的时候到底做了哪些事情

记一次 Kotlin Ktor 库的 PR 提交记录（TCP 自连接）

10246

其他

TCP 自连接

ktor

常见线上问题分析-Linux性能观测篇（下）（实战PPT分享）

前言去年 techday 上有幸邀请到了 Go 夜读的大佬杨文，他跟我们分享了开源的主题，深受鼓舞。正好前段时间测试 Kotlin 的官方库 ktor 发现了一个很冷门的问题，于是提了一个 PR。经过

挖坑的张师傅5年前

8766

操作系统

180页ppt，内容涉及：计算机体系结构、计算机组成原理、操作系统、网络协议等基础知识。从CPU、内存、I/O、网络协议栈等几个部分切入，全面覆盖Linux性能观测

步崖5年前

8631

操作系统

我相信大家都遇到过内存占用率过高的情况，在排查过程中，我们会用到一些命令或工具，下面来看下这些你都用过吗？ top 命令首先比较常用的就是 top 命令，是性能监控的常用命令，该命令可以实时显示系统中

武培轩5年前

9979

操作系统

如何 60 秒内进行 Linux 性能分析

从Linux源码看Socket(TCP)的listen及连接队列

性能工具

当你登陆一台 Linux 服务器之后，因为一个问题要做性能分析时：你会在第 1 分钟内做哪些检测呢？在 Netflix，我们有很多 EC2 的 Linux 机器，并且也需要很多性能分析工具来监控和检查

Linux内核之旅5年前

8772

操作系统

TCP

client

前言如果能知道从应用到框架再到操作系统的每一处代码，是一件Exciting的事情。今天笔者是从Linux源码的角度看下Server端的Socket在进行listen的时候到底做了哪些事情(基于Lin

从Linux源码看Socket(TCP)的bind

9588

操作系统

bind

性能

前言之前笔者分享了关于Client端的Socket在进行Connect的时候到底做了哪些事情~今天笔者就来继续从Linux源码的角度看下Server端的Socket在进行bind的时候到底做了哪些事情

从Linux源码看TIME_WAIT状态的持续时间

9998

操作系统

TCL

TIME_WAIT

前言笔者一直以为在Linux下TIME_WAIT状态的Socket持续状态是60s左右。线上实际却存在TIME_WAIT超过100s的Socket。由于这牵涉到最近出现的一个复杂Bug的分析。所以，笔

8726

操作系统

用eBPF/bcc分析系统性能的一个简单案例

bcc

bcc是eBPF的一种前端，当然这个前端特别地简单好用。可以直接在python里面嵌入通过C语言写的BPF程序，并帮忙产生BPF bytecode和load进入kernel挂载kprobe、trace

技术小助手5年前

9822

其他

这篇文章是介绍一下线程与栈相关的话题，文章比较长，主要会聊聊下面这些话题：- 进程与线程的本质区别，线程与内存共享- Linux pthread 与 Guard 区域- Hotspot 线程栈的 Gu

挖坑的张师傅5年前

9155

Java语言

使用虚线程进行同步网络 IO 的不阻塞原理

java

网络

使用虚线程进行网络 IOProject Loom 主要目标是在 Java 平台上提供一种易于使用、高吞吐量的轻量级并发性和新的编程模型的 JVM 特性和API。这带来了许多有趣和令人兴奋的前景，其中之

已注销2505205年前

10772

操作系统

Linux 内核源码分析之进程概要及调度时机

这篇文章从 Linux 内核层面分享进程概要及调度时机。

闪电侠4年前

9536

操作系统

一张图看懂linux内核中percpu变量的实现

【全网首发】聊聊Linux中线程和进程的联系与区别！

percpu

我们在使用各种编程语言进行多线程编程时，经常会用到thread local变量。所谓thread local变量，就是对于同一个变量，每个线程都有自己的一份，对该变量的访问是线程隔离的，它们之间不会相

KINGYT5年前

8290

操作系统

【全网首发】Linux：十五条网络性能优化建议

大家好，我是飞哥！最近我出了一本非常受欢迎的新书 -- 《深入理解Linux网络》。这本书首发当日就登上了京东的科技类销量日冠军，刚上市三个星期就已经印刷了三次，非常的热门。在这本书中我们深入地讨论了很多内核网络模块相关的问题。讨论了一个网络包是如何从网卡到达用户进程的，聊了同步阻塞和多路复

飞哥开发内功4年前

8692

操作系统

大家好，我是飞哥！关于进程和线程，在 Linux 中是一对儿很核心的概念。但是进程和线程到底有啥联系，又有啥区别，很多人还都没有搞清楚。在网上对进程和线程的讨论中，很多都是聚集在这二位有啥不同。但事实在 Linux 上，进程和线程的相同点要远远大于不同点。在 Linux 下的线程甚至都被称为了轻

8860

操作系统

谈一谈Linux让实时/高性能任务独占CPU的事

线程

隔离

内容简介本文主要讨论在高实时要求、高效能计算、DPDK等领域，Linux如何让某一个线程排他性独占CPU；独占CPU涉及的线程、中断隔离原理；以及如何在排他性独占的情况下，甚至让系统的timer tick也不打断独占任务，从而实现最低的延迟抖动。阅读本文大约需要20分钟。

10140

操作系统

关于Linux网络的网络性能优化建议

问题排查

导语我们在Linux性能方面有哪些优化手段可用呢？我在本章中给出一些开发或者运维中的性能优化建议。注意，我用的字眼是建议，而不是原则之类的。每一种性能优化方法都有它适用或者不适用的应用场景。你应当根据你当前的项目现状灵活来选择用或者不用。正文1、网络请求优化建议1：尽量减少不必

【译】一次交易类场景CPU飙升100%的故障排除案例

9574

操作系统

cpu

【全网首发】从 Linux 内核角度探秘 JDK NIO 文件读写本质

故障排查

在本文中，我们将讨论如何解决北美主要交易应用程序中出现的 CPU 峰值问题。突然之间，这个应用程序的 CPU 开始飙升至 100%。事实上，这个团队没有进行任何新的代码部署，没有进行任何环境更改，也没有翻转任何标志设置——但突然间，CPU 开始飙升。我们甚至验证了流量是否增加

willberthos3年前

8195

操作系统

JDK NIO

1. 前言笔者在《从 Linux 内核角度看 IO 模型的演变》一文中曾对 Socket 文件在内核中的相关数据结构为大家做了详尽的阐述。又在此基础之上介绍了针对 socket 文件的相关操作及其对应在内核中的处理流程：并与 epoll 的工作机制进行了串联：通过这些内容的串联介绍，

【全网首发】内核是如何给容器中的进程分配CPU资源的？

9323

操作系统

容器中的核是真的逻辑核吗？Linux 是如何对容器下的进程进行 CPU 限制的，底层是如何工作的？容器中的 throttle 是什么意思？为什么关注容器 CPU 性能的时候，除了关注使用率，还要关注 throttle 的次数和时间？

8387

操作系统

作者简介：程磊，一线码农，在某手机公司担任系统开发工程师，阅码场荣誉总编辑，日常喜欢研究内核基本原理。目录：一、基本概念解析1.1 系统调用的来源与作用1.2 API的来源与作用1.3 API与系统调用的关系1.4 系统调用机制的基本原理二、API的制定与实现2.1 POSIX A

9898

操作系统

聊聊 Linux 中断机制

中断

中断的历史原因在聊中断机制之前，我想先和大家聊一聊中断机制出现的前因后果。最一开始计算机操作系统的设计是能够一次性的执行所有的计算任务的，这被称为顺序执行，也是批处理操作系统（Batch system）。顺序执行的意思是一个任务接着一个任务的依次执行，就像我们编写代码的时候，我们肯定是写完一行代

cxuan3年前

8050

操作系统

一次死锁导致CPU异常飘高的整个故障排查过程

中断

【全网首发】一步一图带你深入理解 Linux 虚拟内存管理

2021年4月2号，晚上10.45分左右，线上业务异常，后排查线上服务器CPU 异常高，机器是 16核 64G的。但是实际负载已经达到了 140左右。

自由早晚乱余生3年前

7999

操作系统

Linux上TCP的几个内核参数调优

内核参数

参数调优

Linux作为一个强大的操作系统，提供了一系列内核参数供我们进行调优。光TCP的调优参数就有50多个。在和线上问题斗智斗勇的过程中，笔者积累了一些在内网环境应该进行调优的参数。在此分享出来，希望对大家有所帮助。调优清单好了，在这里先列出调优清单。请记住，这里只是笔者在

巡山小汪4年前

6782

操作系统

虚拟内存

性能优化

写在本文开始之前…从本文开始我们就正式开启了 Linux 内核内存管理子系统源码解析系列，笔者还是会秉承之前系列文章的风格，采用一步一图的方式先是详细介绍相关原理，在保证大家清晰理解原理的基础上，我们再来一步一步的解析相关内核源码的实现。有了源码的辅证，这样大家看得也安心，理解起来也放心，最起码可

【全网首发】Linux 中 CPU 利用率是如何算出来的？

8849

操作系统

top 输出的利用率信息是如何计算出来的，它精确吗？ ni 是 cpu 在处理啥时的开销？ wa 代表的是 io wait，那么这段时间中 cpu 到底是忙碌还是空闲？以上问题本文将为你解答！

7383

操作系统

你好，我是悟空。最近遇到一个服务器的问题：磁盘满了，占用率 100%~这个问题太常见了，于是先来排查一波是哪些文件占用了大量磁盘。一、排查磁盘占用率100%1.1 查看磁盘使用的大致情况第一个命令就是 df -h，来查看磁盘的占用情况。df 是 disk free 的缩写，用于显示目前在 L

悟空聊架构3年前

6768

操作系统

人人都应该知道的CPU缓存运行效率

性能优化

cpu

CPU除了利用率之外，还有很容易被人忽视的指标，就是指令的运行效率。

详解同步阻塞网络 IO—高性能网络开发路上的绊脚石

7831

操作系统

大家好，我是树哥。对于服务器系统来说，上下文切换也是影响系统性能的一个重要因素。深入理解上下文切换的原理，有利于我们做好性能优化工作。今天我将带大家了解下上下文切换的几种情形，以及其背后发生切换的具体信息，接着介绍一些监测上下文切换指标的工具，最后总结一些上下文切换异常可能得场景。1. 什么是

树哥聊编程3年前

7897

操作系统

同步阻塞网络 IO

故障排查

网络

在网络开发模型中，有一种非常易于开发同学使用的方式，那就是同步阻塞的网络 IO（在 Java 中习惯叫 BIO）。例如我们想请求服务器上的一段数据，那么 C 语言的一段代码 demo 大概是下面这样：int main(){ int sk = socket(AF_INET, SOCK_STREA

michi4年前

6807

操作系统

我们都知道操作系统的一个重要功能就是进行进程管理，而进程管理就是在合适的时机选择合适的进程来执行，在单个cpu运行队列上各个进程宏观并行微观串行执行，多个cpu运行队列上的各个进程之间完全的并行执行。

【全网首发】从进程栈内存底层原理到Segmentation fault报错

8785

操作系统

虚拟内存

栈内存

这篇文章中我给大家介绍进程栈的初始化过程、栈对应的物理内存是如何分配的、以及栈的自动增长。也会看到“Segmentation fault (core dumped)”产生的的根本原因。

6333

操作系统

踩了个DNS解析的坑，但我还是没想通

dns

问题排查

hello大家好，我是小楼。最近踩了个DNS解析的小坑，虽然问题解决了，但排查过程比较曲折，最后还是有一点没有想通，整个过程分享给大家。背景最近负责的服务要置换机器。置换机器可能很多小伙伴不知道是干啥，因为大家平时接触不到，我简单解释一下什么是机器置换以及为什么需要机器置换。机器置换通俗

捉虫大师4年前

7309

操作系统

超极速优化：网络开发中的请求合并！

请求合并

网络

导语今天，xjjdog来分享网络开发中的一个超级技巧。它可以把两个请求合并为一个请求，使得服务在弱网环境中性能得到极大的改善。说开了很容易，但却很难想到。正文需求如果我有大量的物联网设备，比如说100万台。如果这些设备平均每10秒产生一个请求，那么QPS就是10W，这对于任何公

小姐姐味道4年前

6243

操作系统

一、中断基本原理中断是计算机中非常重要的功能，其重要性不亚于人的神经系统加脉搏。虽然图灵机和冯诺依曼结构中没有中断，但是计算机如果真的没有中断的话，那么计算机就相当于是半个残疾人。今天我们就来全面详细地讲一讲中断。1.1 中断的定义我们先来看一下中断的定义：中断机制：CPU在执行指令时，收到

11462

操作系统

深入理解Linux进程管理

进程管理

作者简介：程磊，一线码农，在某手机公司担任系统开发工程师，日常喜欢研究内核基本原理。目录一、进程基本概念1.1 进程与程序1.2 进程与线程1.3 进程与内核1.4 进程与内存1.5 进程运行状态1.6 进程亲缘关系二、进程的实现2.1 基本原理2.2 进程结构体2.3 进

【全网首发】深入理解 Linux 物理内存分配全链路实现

7177

操作系统

kernel

前文回顾在上篇文章《深入理解 Linux 物理内存管

8460

操作系统

先来看段代码：这段代码非常简单，就是先用mmap的方式，为该进程分配10GiB的虚拟内存，然后再用page写的方式，让操作系统为这10GiB虚拟内存，分配对应的物理内存，最后sleep，等待我们测试。

KINGYT5年前

6026

操作系统

这篇文章主要整理了一下计算机种的内存结构，以及 CPU 是如何读写内存种的数据的，如何维护 CPU 缓存中的数据一致性。什么是虚拟内存，以及它存在的必要性。如有不对请多多指教。概述目前在计算机中，主要有两大存储器 SRAM 和 DRAM。主存储器是由 DRAM 实现的，也就是我们常说的内存，在

luozhiyun3年前

16615

操作系统

【全网首发】如何正确获取容器的CPU利用率？

docker

如何正确地获取容器中的 cpu 利用率？容器 cpu 使用率的指标项为什么比物理机上少了 nice/irq/softirq？

8816

操作系统

Linux swap分区工作原理及问题定位

swap

一、文件页和匿名页1、文件页当发生了内存泄漏时，或者运行了大内存的应用程序，导致系统的内存资源紧张时，系统又会如何应对呢？内存回收和 OOM 杀死进程。内存资源紧张导致的 OOM（Out Of Memory），指的是系统杀死占用大量内存的进程，释放这些内存，再分配给其他更需要的进程。内存回收

心动心动3年前

9367

操作系统

一个内核oops问题的分析及解决

故障排查

实战案例

问题再现最近在调试设备时，遇到了一个偶发的开机死机问题。通过查看输出日志，发现内核报告了oops错误，如下所示（中间省略了部分日志，以......代替）：Unable to handle kernel NULL pointer dereference at virtual address 000

【全网首发】从内核源码看 slab 内存池的创建初始化流程

7151

操作系统

记一次CPU使用率低负载高的排查过程

导语：在linux的系统维护中，可能需要经常查看cpu使用率，分析系统整体的运行情况。而监控CPU的性能一般包括以下3点：运行队列、CPU使用率和上下文切换。对于每一个CPU来说运行队列最好不要超过3，例如，如果是双核CPU就不要超过6。如果队列长期保持在3以上，说明任何一个进程运行时都不能马上

(งᵒ̌皿ᵒ̌)ง⁼³₌₃4年前

7490

操作系统

slab cache 机制确实比较复杂，涉及到的场景又很多，大家读到这里，我想肯定会好奇或者怀疑笔者在上篇文章中所论述的那些原理的正确性，毕竟 talk is cheap ，所以为了让大家看着安心，理解起来放心，从本文开始，我们将正式进入 show you the code 的阶段

【全网首发】为什么新版内核将进程pid管理从bitmap替换成了radix-tree？

7861

操作系统

进程

性能优化

今天我来给大家聊聊为什么 Linux 内核要将 bitmap 替换成基数树，最后也看看这次替换的性能效果。

从内核世界透视 mmap 内存映射的本质（原理篇）

7134

其他

CPU 使用率是最直观和最常用的系统性能指标，是在排查性能问题时会关注的第一个指标。而在导致CPU使用率过高的因素中，进程切换问题也是非常常见的。进程上下文切换次数较多的情况下，很容易导致CPU 将大

小子z4年前

7730

操作系统

本文基于内核 5.4 版本源码讨

9074

操作系统

【全网首发】Linux 中的负载高低和 CPU 开销并不完全对应

负载是查看 Linux 服务器运行状态时很常用的一个性能指标。但是很多同学都没有搞清楚的是，负载高低状态并不是和CPU利用率完全对应的。

【全网首发】一步一图带你构建 Linux 页表体系—详解虚拟内存如何与物理内存进行映射

5930

操作系统

笔者这次想让虚拟内存和物理内存两者一起动态联动起来，在这个联动的过程中将之前的这些静态知识点统统串联起来，形成一条内存管理的主线

8585

操作系统

谈谈Linux内核的栈回溯与妙用

栈回溯

前言说起linux内核的栈回溯功能，我想这对每个Linux内核或驱动开发人员来说，太常见了。如下演示的是linux内核崩溃的一个栈回溯打印，有了这个崩溃打印我们能很快定位到在内核哪个函数崩溃，大概在函数什么位置，大大简化了问题排查过程。网上或多或少都能找到栈回溯的一些文章，但是讲的都并不完整，

NODE_EXPORTER+PROMETHEUS+GRAFANA 快速实现LINUX系统性能数据提取、存储和可视化展示

8941

操作系统

性能分析里面，TCP传输问题很关键哦！

5474

操作系统

大家好，我是树哥！性能优化这个专题，是每个想成为架构师的小伙伴必须学习的知识。在学习性能优化的过程中，我们要学会各种 Linux 命令和工具去检测服务器的 CPU、内存等资源。很多情况下，我们的 CPU、内存资源都是很平稳的，不利于我们学习这些性能检测命令。今天就介绍一个 Linux 系统压力测

树哥聊编程3年前

7024

操作系统

当今互联网中的大千世界都驻足于TCP/IP协议之上。而通过Socket操作TCP/IP协议已经成为了事实上的标准,Socket甚至已经成为了网络编程的同义词。当然了，由于我们早已习惯于各种封装/框架，很少裸用Socket，所以对它的理解始终有一种模糊的感觉。今天，我就来介绍一下Socket。S

巡山小汪3年前

6220

操作系统

本篇文章的内核的代码是 Linux 0.11上一篇文章我们看了计算机系统中的异常和中断是怎么做的，这篇文章我们来看看 fork 是如何利用异常实现进程的创建，以及 COW 实现原理使用fork 函数是一个系统调用函数，它是用来创建一个新的进程，如下：#include <unistd.h

luozhiyun3年前

6265

操作系统

虚拟机中GUEST OS时钟(TIMEKEEP)问题的探讨

1. 前言本文将通过Node_exporter+Prometheus+Grafana三者结合，快速提取Linux内核数据，数据包括但不限于CPU、内存、磁盘、网络IO等，并进行可视化展示。当然，这一套

Linux内核之旅5年前

6311

操作系统

虚拟机

操作系统的时钟处理按理来说应该是个早已成熟的技术,不必再费口舌讨论什么。事实也的确如此。然而在虚拟环境下(不仅仅是xen,vmware这些虚拟机)，对时钟的处理可绝非轻而易举，如果你耐心看看你虚拟环境

Linux内核之旅5年前

6253

操作系统

作者介绍：张子恒，西安邮电大学研一在读，导师陈莉君老师，刚刚踏入Linux内核学习的小白一枚。段落引用背景介绍：问题：vmstat只能实时统计进程上下文切换的次数，具有一定的局限性，如果已经发生了高上下文切换的情况，那么该如何找到高上下文切换问题的原因在哪？想法：进程切换最核心的地方就

Linux内核之旅3年前

6722

操作系统

深入理解Linux进程管理

Linux进程

作者简介：程磊，某手机大厂系统开发工程师，阅码场荣誉总编辑，最大的爱好是钻研Linux内核基本原理。目录一、进程基本概念1.1 进程与程序1.2 进程与线程1.3 进程与内核1.4 进程与内存1.5 进程运行状态1.6 进程亲缘关系二、进程的实现2.1 基本原理2.2 进程

【全网首发】深度解析 slab 内存池回收内存以及销毁全流程

6877

操作系统

一步一图带你深入理解 Linux 物理内存管理

深入理解 Linux 物理内存管理

9068

操作系统

容器DNS异常处理问题详情最近公司开发使用的一个 maven 仓库(nexus) 说同步阿里云Maven 源失败，这个仓库是使用容器部署的。排查问题首先就是登陆到容器， ping www.baidu.com 发现网络不可达，确定是容器网络不能访问外网。第二步查看容器的网络模式，使用的桥

自由早晚乱余生3年前

6552

操作系统

这篇报告主要根据CPU性能指标——运行队列长度、调度延迟和平均负载，对系统的性能影响进行简单分析。

Linux内核之旅3年前

6729

操作系统

笔者详细地为大家介绍了 slab cache 进行内存分配的整个链路实现，本文我们就来到了 slab cache 最后的一部分内容了，当申请的内存使用完毕之后，下面就该释放内存了。

通过性能指标学习Linux Kernel - （上）

6460

操作系统

哈喽，我是子牙，一个很卷的硬核男人深入研究计算机底层、Windows内核、Linux内核、Hotspot源码……聚焦做那些大家想学没地方学的课程。为了保证课程质量及教学效果，一年磨一剑，三年先后做了三个课程：手写JVM、手写OS及带你用纯汇编写OS、手写64位多核OS及

子牙_公号硬核子牙2年前

7487

操作系统

概述本程序在谢宝友老师[1]所提供的高负载处理模块的代码[2]基础上，根据5.15版内核的变化，修改出的。本程序是一个内核模块，用于监控系统负载，在平均负载超过4时，打印所有进程的调用栈。本程序分为三个文件：main.c、load.h、Makefile。其中，main.c是本内核模块的主程序；l

Linux内核之旅3年前

6304

操作系统

Linux Kernel

性能指标

Linux内核之旅社区联合thoughtworks未济实验室在中科院开源之夏和CCF暑期夏令营活动中发布了13个题目，我们也一直在思考如何让大家通过这次暑期活动更好地提升自己。这次分享是通过具体的一个性能指标，利用现有的工具来定位内核代码，从而圈定学习 Kernel 的目标范围，因此这次分享是想给社

Linux内核之旅4年前

6924

操作系统

【译】Linux——内存管理是如何工作的？