中间件性能文章 | HeapDump性能社区

jvm

在最近的一次百万长连接压测中，32C 128G 的四台 Nginx 频繁出现 OOM，出现问题时的内存监控如下所示。排查的过程记录如下。现象描述这是一个 websocket 百万长连接收发消息的压测

挖坑的张师傅6年前

15828

中间件

这么流行的ZooKeeper，原来是这样设计的！

zookeeper

为什么会有ZooKeeper 我们知道要写一个分布式应用是非常困难的，主要原因就是局部故障。一个消息通过网络在两个节点之间传递时，网络如果发生故障，发送方并不知道接收方是否接收到了这个消息。有可能是收

13871

中间件

什么？搞不定Kafka重复消费？

今天我们聊一个话题，如何保证 Kafka 消息不重复消费？在使用 Kafka 的时候一般都会设置重试的次数，但是因为网络的一些原因，设置了重试就有可能导致有些消息重复发送了（当然导致消息重复也有可能是其他原因），那么怎么解决消息重复这个问题呢？

13581

中间件

大数据中台之Kafka，到底好在哪里？

Hello，大家好，今天给大家分享一个大数据里面很火的技术——Kafka，Kafka 是一个分布式的消息系统，其高性能在圈内很出名。本人阅读过多个大数据生态的开源技术的源码，个人感觉 Kafka 的源

13094

中间件

Kafka的生产者优秀架构设计

前言 Kafka 是一个高吞吐量的分布式的发布订阅消息系统，在全世界都很流行，在大数据项目里面使用尤其频繁。笔者看过多个大数据开源产品的源码，感觉 Kafka 的源码是其中质量比较上乘的一个，这得益于

网络 IO 高级篇：一次有趣的 Docker 网络问题排查

12840

中间件

一次 Docker 容器内大量僵尸进程排查分析

docker

进程

前段时间线上的一个使用 Google Puppeteer 生成图片的服务炸了，每个 docker 容器内都有几千个孤儿僵死进程没有回收，如下图所示。这篇文章比较长，主要就讲了下面这几个问题。- 什么情

挖坑的张师傅6年前

15414

中间件

docker

Systemtap

TCP

前段时间公司的安卓打包服务出现问题，现象是在上传 360 服务器进行加固的时候，非常大概率会卡在上传阶段，长时间重试最后失败。我对这个情况进行了一些排查分析，解决了这个问题，写了这篇长文复盘了排查的经

12835

Java语言

又踩到Dubbo的坑，但是这次我笑不出来

惊：Dubbo居然有必现StackOverflowError的Bug

前言直入主题，线上应用发现，偶发性出现如下异常日志。当然由于线上具体异常包含信息量过大，秉承让肥朝的粉丝没有难调试的代码的原则，我特意抽取了一个复现的demo放在了git,让你不在现场，一样享受到排查

肥朝5年前

12178

中间件

StackOverFlow

栈溢出

说明：本文场景基于dubbo-2.5.3版本。如果你对StackOverflowError有一定的了解，就可以知道出现这个问题的主要原因就是调用栈太深，比如常见的无限递归调用。那本文要介绍的Dub

阿飞Javaer6年前

12237

中间件

前言dubbo是一个成熟且被广泛运用的框架。饶是如此,在某些极端条件下基于dubbo的应用还会出现无法重连zookeeper的问题。由于此问题容易导致比较大的故障，所以笔者费了一番功夫去定位，现将排查

kill -9 导致 Kakfa 重启失败的惨痛经历！

11969

Java语言

背景在 2 月10 号下午大概 1 点半左右，收到用户方反馈，发现日志 kafka 集群 A 主题的 34 分区选举不了 leader，导致某些消息发送到该分区时，会报如下 no leader 的错

后端进阶5年前

11984

中间件

如此火爆的ZooKeeper，到底如何选主？

zookeeper

前言前面一篇文章我们已经给大家讲解了ZooKeeper的核心的原理，这一篇我们重点分析ZooKeeper的Leader选举算法。Leader的选举是ZooKeeper的最重要技术之一，也是保证分布式

看了 Spring 官网脚手架真香，也撸一个 SpringBoot DDD 微服务的脚手架！

11496

中间件

以下文章来源于匠心零度，作者零度冰炫在学习Netty的时候，ByteBuf随处可见，但是如何高效分配ByteBuf还是很复杂的，Netty的池化内存分配这块还是比较难的，很多人学习过，看过但是还是

占小狼6年前

11991

Java语言

SpringBoot

脚手架

作者：小傅哥博客：[https://bugstack.cn](https://bugstack.cn) 沉淀、分享、成长，让自己和他人都能有所收获！😄 一、前言`为什么我们要去造轮子？`造轮子的核心

小傅哥 | bugstack.cn5年前

15992

数据库

从一次数据库问题排查实战

sql

Mybatis

前言上周五,一同事在开发时遇到了一个问题,叫我帮忙看下.在描述这个同事遇到问题之前,我先简单做一些知识的铺垫,否则不好描述.这里面涉及到的知识点有Spring的事务传播机制、数据库的隔离级别等.本篇重

肥朝5年前

11156

Java语言

What？一个 Dubbo 服务启动要两个小时！

一次 APISIX 网关 503 的问题排查（DNS篇）

前言前几天在测试环境碰到一个非常奇怪的与 ```dubbo``` 相关的问题，事后我在网上搜索了一圈并没有发现类似的帖子或文章，于是便有了这篇。希望对还未碰到或正在碰到的朋友有所帮助。现象现象是这样

crossoverJie6年前

11155

中间件

一次 DNS 造成的服务故障排查，抽丝剥茧，逐步定位问题

挖坑的张师傅4年前

13819

中间件

RPC的超时设置，一不小心就是线上事故

RPC

RPC接口超时设置，不仅涉及到接口幂等、服务降级和熔断、性能评估和优化，同时还需要从业务角度评估必要性。通过一个真实的线上事故系统性地介绍在微服务架构下，如何正确设置RPC接口的超时时间：超时的实现原理是什么？设置超时时间到底是为了解决什么问题？应该如何合理的设置超时时间？

Rockets5年前

16043

操作系统

Nginx 502 Bad Gateway

Linux

内核

前言事实证明，读过Linux内核源码确实有很大的好处，尤其在处理问题的时刻。当你看到报错的那一瞬间，就能把现象/原因/以及解决方案一股脑的在脑中闪现。甚至一些边边角角的现象都能很快的反应过来是为何。笔

一次StackOverflowError排查，原因竟然和Dubbo有关！

11092

Java语言

StackOverflowError

废弃fastjson！大型项目迁移Gson保姆级实战

前言某天业务方的同事和我反馈,说系统出现了StackOverflowError.坦白说,Exception见得过了,但是Error倒是很少出现,此时他的心情是这样的一波猛如虎的操作我们先来看血淋淋的

肥朝6年前

11578

Java语言

gson

fastjson

记一次通过Arthas定位解决spring-boot中内嵌tomcat的Bug问题

前言大家好，又双叒叕见面了，我是天天放大家鸽子的蛮三刀。本篇文章是我这一个多月来帮助组内废弃fastjson框架的总结，我们将大部分Java仓库从fastjson迁移至了Gson。这么做的主要的原因是

后端技术漫谈5年前

12145

Java语言

SpringBoot

arthas

背景公司有个渠道系统，专门对接三方渠道使用，没有什么业务逻辑，主要是转换报文和参数校验之类的工作，起着一个承上启下的作用。最近在优化接口的响应时间，优化了代码之后，但是时间还是达不到要求；有一个诡异的

空无6年前

12027

中间件

导读Netty 是一个异步事件驱动的网络通信层框架，用于快速开发高可用高性能的服务端网络框架与客户端程序，它极大地简化了 TCP 和 UDP 套接字服务器等网络编程。Netty 底层基于 JDK 的

技术小助手6年前

11345

中间件

Prometheus时序数据库-数据的插入

数据库

时序

前言在之前的文章里，笔者详细的阐述了Prometheus时序数据库在内存和磁盘中的存储结构。有了前面的铺垫，笔者就可以在本篇文章阐述下数据的插入过程。监控数据的插入在这里，笔者并不会去讨论Promt

10287

中间件

Prometheus时序数据库-报警的计算

监控

数据库

前言在前面的文章中，笔者详细的阐述了Prometheus的数据插入存储查询等过程。但作为一个监控神器，报警计算功能是必不可少的。自然的Prometheus也提供了灵活强大的报警规则可以让我们自由去发挥

10178

中间件

RocketMQ 在使用上的一些排坑和优化

RocketMQ

后端

前言：RocketMQ 在我们的项目中使用非常广泛，在使用的过程中，也遇到了很多的问题。比如没有多环境的隔离，在多个版本同时开发送测的情况下，互相干扰严重。RocketMQ 的投递可能会失败，导致丢失

Netty + JavaFx 实战：仿桌面版微信聊天

11363

其他

起源于Thread.sleep最近在系统调优过程中遇到一个比较有意思的高CPU消耗的问题（当时CPU使用率已经到90%左右），先上图感受一下。是的，就是Thread.sleep这个方法，消耗了大概34

开翻挖掘机4年前

10555

中间件

netty

仿PC微信

DDD架构

作者：小傅哥博客：[https://bugstack.cn](https://bugstack.cn) 沉淀、分享、成长，让自己和他人都能有所收获！😄 一、前言本项目是作者小傅哥使用```JavaF

小傅哥 | bugstack.cn5年前

10093

中间件

Prometheus时序数据库-数据的抓取

Prometehus

数据

时序

前言在之前的文章里，笔者详细的阐述了数据的存储/写入以及查询过程。那么Prometheus又是怎么去主动获得数据的呢？这个问题，笔者将在本篇文章详细阐述。 Pull模式Prometheus是通过pul

《吃透 MQ 系列》之 Kafka 存储选型的奥秘

10490

中间件

谈到 Kafka 的存储设计，了解不多的同学，可能会有这样的疑惑：为什么 Kafka 会采用 Logging（日志文件）这种很原始的方式来存储消息，而没考虑用数据库或者 KV 来做存储？

Rockets4年前

10179

中间件

Prometheus时序数据库-数据的查询

数据库

前言在之前的博客里，笔者详细阐述了Prometheus数据的插入过程。但我们最常见的打交道的是数据的查询。Prometheus提供了强大的Promql来满足我们千变万化的查询需求。在这篇文章里面，笔者

11012

中间件

Prometheus时序数据库-内存中的存储结构

存储结构

时序数据库

前言笔者最近担起了公司监控的重任，而当前监控最流行的数据库即是Prometheus。按照笔者打破砂锅问到底的精神，自然要把这个开源组件源码搞明白才行。在经过一系列源码/资料的阅读以及各种Debug之后

通过调试 Nginx 源码来定位有趣 Nginx 转发合并斜杠和编码问题

10686

中间件

后端

源码

背景前段时间出现了一个请求在测试环境签名成功，在线上环境签名失败的情况，排查原因是线上url中有双斜杠会被合并成一个传给后端，在测试环境中不会出现。这个就比较神奇了，Nginx 版本完全一样。确认问题

一次 Kafka 导致的 Sentry 无法处理 MiniDump 问题分析

9885

中间件

问题排查实录，wireshark 使用

8960

中间件

彻底弄懂 Nginx location 匹配

后端

Nginx 的 location 实现了对请求的细分处理，有些 URI 返回静态内容，有些分发到后端服务器等，今天来彻底弄懂它的匹配规则一个最简单的 location 的例子如下```server {

12258

中间件

用隧道协议实现不同dubbo集群间的透明通信

zookeeper

前言笔者最近完成了一个非常有意思的隧道机制(已在产线运行)，可以让注册到不同zookeeper之间的dubbo集群之间能够正常进行通信。如下图所示: 例如图中A/B两个网络隔离的集群，两者只能通过专线