Skip to content

Commit cd508da

Browse files
committed
[docs add]JVM线上问题排查和性能调优案例
1 parent 8b2241b commit cd508da

6 files changed

+58
-5
lines changed

docs/.vuepress/sidebar/index.ts

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -136,8 +136,8 @@ export default sidebar({
136136
"class-loading-process",
137137
"classloader",
138138
"jvm-parameters-intro",
139-
"jvm-intro",
140139
"jdk-monitoring-and-troubleshooting-tools",
140+
"jvm-in-action",
141141
],
142142
},
143143
{

docs/java/jvm/jdk-monitoring-and-troubleshooting-tools.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: JDK 监控和故障处理工具总结
2+
title: JDK监控和故障处理工具总结
33
category: Java
44
tag:
55
- JVM

docs/java/jvm/jvm-garbage-collection.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: JVM 垃圾回收详解(重点)
2+
title: JVM垃圾回收详解(重点)
33
category: Java
44
tag:
55
- JVM

docs/java/jvm/jvm-in-action.md

Lines changed: 53 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,53 @@
1+
---
2+
title: JVM线上问题排查和性能调优案例
3+
category: Java
4+
tag:
5+
- JVM
6+
---
7+
8+
JVM 线上问题排查和性能调优也是面试常问的一个问题,尤其是社招中大厂的面试。
9+
10+
这篇文章,我会分享一些我看到的相关的案例。
11+
12+
下面是正文。
13+
14+
[一次线上 OOM 问题分析 - 艾小仙 - 2023](https://juejin.cn/post/7205141492264976445)
15+
16+
- **现象**:线上某个服务有接口非常慢,通过监控链路查看发现,中间的 GAP 时间非常大,实际接口并没有消耗很多时间,并且在那段时间里有很多这样的请求。
17+
- **分析**:使用 JDK 自带的`jvisualvm`分析 dump 文件(MAT 也能分析)。
18+
- **建议**:对于 SQL 语句,如果监测到没有`where`条件的全表查询应该默认增加一个合适的`limit`作为限制,防止这种问题拖垮整个系统
19+
- **资料**[实战案例:记一次 dump 文件分析历程转载 - HeapDump - 2022](https://heapdump.cn/article/3489050)
20+
21+
[生产事故-记一次特殊的 OOM 排查 - 程语有云 - 2023](https://www.cnblogs.com/mylibs/p/production-accident-0002.html)
22+
23+
- **现象**:网络没有问题的情况下,系统某开放接口从 2023 年 3 月 10 日 14 时许开始无法访问和使用。
24+
- **临时解决办法**:紧急回滚至上一稳定版本。
25+
- **分析**:使用 MAT (Memory Analyzer Tool)工具分析 dump 文件。
26+
- **建议**:正常情况下,`-Xmn`参数(控制 Young 区的大小)总是应当小于`-Xmx`参数(控制堆内存的最大大小),否则就会触发 OOM 错误。
27+
- **资料**[最重要的 JVM 参数总结 - JavaGuide - 2023](https://javaguide.cn/java/jvm/jvm-parameters-intro.html)
28+
29+
[一次大量 JVM Native 内存泄露的排查分析(64M 问题) - 掘金 - 2022](https://juejin.cn/post/7078624931826794503)
30+
31+
- **现象**:线上项目刚启动完使用 top 命令查看 RES 占用了超过 1.5G。
32+
- **分析**:整个分析流程用到了较多工作,可以跟着作者思路一步一步来,值得学习借鉴。
33+
- **建议**:远离 Hibernate。
34+
- **资料**[Linux top 命令里的内存相关字段(VIRT, RES, SHR, CODE, DATA)](https://liam.page/2020/07/17/memory-stat-in-TOP/)
35+
36+
[YGC 问题排查,又让我涨姿势了! - IT 人的职场进阶 - 2021](https://www.heapdump.cn/article/1661497)
37+
38+
- **现象**:广告服务在新版本上线后,收到了大量的服务超时告警。
39+
- **分析**:使用 MAT (Memory Analyzer Tool) 工具分析 dump 文件。
40+
- **建议**:学会 YGC(Young GC) 问题的排查思路,掌握 YGC 的相关知识点。
41+
42+
[听说 JVM 性能优化很难?今天我小试了一把! - 陈树义 - 2021](https://shuyi.tech/archives/have-a-try-in-jvm-combat)
43+
44+
通过观察 GC 频率和停顿时间,来进行 JVM 内存空间调整,使其达到最合理的状态。调整过程记得小步快跑,避免内存剧烈波动影响线上服务。 这其实是最为简单的一种 JVM 性能调优方式了,可以算是粗调吧。
45+
46+
[你们要的线上 GC 问题案例来啦 - 编了个程 - 2021](https://mp.weixin.qq.com/s/df1uxHWUXzhErxW1sZ6OvQ)
47+
48+
- **案例 1**:使用 guava cache 的时候,没有设置最大缓存数量和弱引用,导致频繁触发 Young GC
49+
- **案例 2**: 对于一个查询和排序分页的 SQL,同时这个 SQL 需要 join 多张表,在分库分表下,直接调用 SQL 性能很差。于是,查单表,再在内存排序分页,用了一个 List 来保存数据,而有些数据量大,造成了这个现象。
50+
51+
[Java 中 9 种常见的 CMS GC 问题分析与解决 - 美团技术团 - 2020](https://tech.meituan.com/2020/11/12/java-9-cms-gc.html)
52+
53+
这篇文章共 2w+ 字,详细介绍了 GC 基础,总结了 CMS GC 的一些常见问题分析与解决办法。

docs/java/jvm/jvm-parameters-intro.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: 最重要的 JVM 参数总结
2+
title: 最重要的JVM参数总结
33
category: Java
44
tag:
55
- JVM

docs/java/jvm/memory-area.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
---
2-
title: Java 内存区域详解(重点)
2+
title: Java内存区域详解(重点)
33
category: Java
44
tag:
55
- JVM

0 commit comments

Comments
 (0)