当前位置:首页 > 公众号精选 > 架构师社区
[导读]一个诡异的线上问题:线上程序使用了 NIO FileChannel 的 堆内内存作为缓冲区,读写文件,逻辑可以说相当简单,但根据监控却发现堆外内存飙升,导致了 OutOfMemeory。

引子

记得那是一个风和日丽的周末,太阳红彤彤,花儿五颜六色,96 年的普哥微信找到我,描述了一个诡异的线上问题:线上程序使用了 NIO FileChannel 的 堆内内存作为缓冲区,读写文件,逻辑可以说相当简单,但根据监控却发现堆外内存飙升,导致了 OutOfMemeory 的异常。

由这个线上问题,引出了这篇文章的主题,主要包括:FileChannel 源码分析,堆外内存监控,堆外内存回收。

问题分析&源码分析

根据异常日志的定位,发现的确使用的是 HeapByteBuffer 来进行读写,但却导致堆外内存飙升,随即翻了 FileChannel 的源码,来一探究竟:

FileChannel 使用的是 IOUtil 来进行读写(只分析读的逻辑,写的逻辑行为和读其实一致,不进行重复分析)

			
  1. //sun.nio.ch.IOUtil#read

  2. static int read(FileDescriptor var0, ByteBuffer var1, long var2, NativeDispatcher var4) throws IOException {

  3. if (var1.isReadOnly()) {

  4. throw new IllegalArgumentException("Read-only buffer");

  5. } else if (var1 instanceof DirectBuffer) {

  6. return readIntoNativeBuffer(var0, var1, var2, var4);

  7. } else {

  8. ByteBuffer var5 = Util.getTemporaryDirectBuffer(var1.remaining());

  9. int var7;

  10. try {

  11. int var6 = readIntoNativeBuffer(var0, var5, var2, var4);

  12. var5.flip();

  13. if (var6 > 0) {

  14. var1.put(var5);

  15. }

  16. var7 = var6;

  17. } finally {

  18. Util.offerFirstTemporaryDirectBuffer(var5);

  19. }

  20. return var7;

  21. }

  22. }

可以发现当使用 HeapByteBuffer 时,会走到下面这行比较奇怪的代码分支:

			
  1. Util.getTemporaryDirectBuffer(var1.remaining());

这个 Util 封装了更为底层的一些 IO 逻辑

			
  1. package sun.nio.ch;

  2. public class Util {

  3. private static ThreadLocal<Util.BufferCache> bufferCache;


  4. public static ByteBuffer getTemporaryDirectBuffer(int var0) {

  5. if (isBufferTooLarge(var0)) {

  6. return ByteBuffer.allocateDirect(var0);

  7. } else {

  8. // FOUCS ON THIS LINE

  9. Util.BufferCache var1 = (Util.BufferCache)bufferCache.get();

  10. ByteBuffer var2 = var1.get(var0);

  11. if (var2 != null) {

  12. return var2;

  13. } else {

  14. if (!var1.isEmpty()) {

  15. var2 = var1.removeFirst();

  16. free(var2);

  17. }


  18. return ByteBuffer.allocateDirect(var0);

  19. }

  20. }

  21. }

  22. }

isBufferTooLarge 这个方法会根据传入 Buffer 的大小决定如何分配堆外内存,如果过大,直接分布大缓冲区;如果不是太大,会使用 bufferCache 这个 ThreadLocal 变量来进行缓存,从而复用(实际上这个数值非常大,几乎不会走进直接分配堆外内存这个分支)。这么看来似乎发现了两个不得了的结论:

  1. 使用 HeapByteBuffer 读写都会经过 DirectByteBuffer,写入数据的流转方式其实是:HeapByteBuffer -> DirectByteBuffer -> PageCache -> Disk,读取数据的流转方式正好相反。

  2. 大多数情况下,会申请一块跟线程绑定的堆外缓存,这意味着,线程越多,这块临时的堆外缓存就越大。

看到这儿,似乎线上的问题有了一点眉目:很有可能是多线程使用堆内内存写入文件,而额外分配这块堆外缓存导致了内存溢出。在验证这个猜测之前,我们最好能直观地监控到堆外内存的使用量,这才能增加我们定位问题的信心。

实现堆外内存的监控

JDK 提供了一个非常好用的监控工具 —— Java VisualVM。我们只需要为他安装 2 个插件,即可很方便地实现堆外内存的监控。

进入本地 JDK 的可执行目录(在我本地是:/Library/Java/JavaVirtualMachines/jdk1.8.0_181.jdk/Contents/Home/bin),找到 jvisualvm 命令,双击即可打开一个可视化的界面

左侧树状目录可以选择需要监控的 Java 进程,右侧是监控的维度信息,除了 CPU、线程、堆、类等信息,还可以通过上方的【工具(T)】 安装插件,增加 MBeans、Buffer Pools 等维度的监控。

Buffer Pools 插件可以监控堆外内存(包含 DirectByteBuffer 和 MappedByteBuffer),如下图所示:

左侧对应 DirectByteBuffer,右侧对应 MappedByteBuffer。

复现问题

为了复现线上的问题,我们使用一个程序,不断开启线程使用堆内内存作为缓冲区进行文件的读取操作,并监控该进程的堆外内存使用情况。

			
  1. public class ReadByHeapByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. File data = new File("/tmp/data.txt");

  4. FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();

  5. ByteBuffer buffer = ByteBuffer.allocate(4 * 1024 * 1024);

  6. for (int i = 0; i < 1000; i++) {

  7. Thread.sleep(1000);

  8. new Thread(new Runnable() {

  9. @Override

  10. public void run() {

  11. try {

  12. fileChannel.read(buffer);

  13. buffer.clear();

  14. } catch (IOException e) {

  15. e.printStackTrace();

  16. }

  17. }

  18. }).start();

  19. }

  20. }

  21. }

运行一段时间后,我们观察下堆外内存的使用情况

如上图左所示,堆外内存的确开始疯涨了,符合我们的预期,堆外缓存和线程绑定,当线程非常多时,即使只使用了 4M 的堆内内存,也可能会造成极大的堆外内存膨胀,在中间发生了一次断崖,推测是线程执行完毕 or GC,导致了内存的释放。

知晓了这一点,相信大家今后使用堆内内存时可能就会更加注意了,我总结了两个注意点:

  1. 使用 HeapByteBuffer 还需要经过一次 DirectByteBuffer 的拷贝,在追求极致性能的场景下是可以通过直接复用堆外内存来避免的。

  2. 多线程下使用 HeapByteBuffer 进行文件读写,要注意 ThreadLocal<Util.BufferCache>bufferCache导致的堆外内存膨胀的问题。

问题深究

那大家有没有想过,为什么 JDK 要如此设计?为什么不直接使用堆内内存写入 PageCache 进而落盘呢?为什么一定要经过 DirectByteBuffer 的拷贝呢?

在知乎的相关问题中,R 大和曾泽堂 两位同学进行了解答,是我比较认同的解释:

作者:RednaxelaFX

链接:https://www.zhihu.com/question/57374068/answer/152691891

来源:知乎

这里其实是在迁就OpenJDK里的HotSpot VM的一点实现细节。

HotSpot VM 里的 GC 除了 CMS 之外都是要移动对象的,是所谓“compacting GC”。

如果要把一个Java里的 byte[] 对象的引用传给native代码,让native代码直接访问数组的内容的话,就必须要保证native代码在访问的时候这个 byte[] 对象不能被移动,也就是要被“pin”(钉)住。

可惜 HotSpot VM 出于一些取舍而决定不实现单个对象层面的 object pinning,要 pin 的话就得暂时禁用 GC——也就等于把整个 Java 堆都给 pin 住。

所以 Oracle/Sun JDK / OpenJDK 的这个地方就用了点绕弯的做法。它假设把 HeapByteBuffer 背后的 byte[] 里的内容拷贝一次是一个时间开销可以接受的操作,同时假设真正的 I/O 可能是一个很慢的操作。

于是它就先把 HeapByteBuffer 背后的 byte[] 的内容拷贝到一个 DirectByteBuffer 背后的 native memory去,这个拷贝会涉及 sun.misc.Unsafe.copyMemory() 的调用,背后是类似 memcpy() 的实现。这个操作本质上是会在整个拷贝过程中暂时不允许发生 GC 的。

然后数据被拷贝到 native memory 之后就好办了,就去做真正的 I/O,把 DirectByteBuffer 背后的 native memory 地址传给真正做 I/O 的函数。这边就不需要再去访问 Java 对象去读写要做 I/O 的数据了。

总结一下就是:

  • 为了方便 GC 的实现,DirectByteBuffer 指向的 native memory 是不受 GC 管辖的

  • HeapByteBuffer 背后使用的是 byte 数组,其占用的内存不一定是连续的,不太方便 JNI 方法的调用

  • 数组实现在不同 JVM 中可能会不同

堆外内存的回收

继续深究一下一个话题,也是我的微信交流群中曾经有人提出过的一个疑问,到底该如何回收 DirectByteBuffer?既然可以监控堆外内存,那验证堆外内存的回收就变得很容易实现了。

CASE 1:分配 1G 的 DirectByteBuffer,等待用户输入后,赋值为 null,之后阻塞持续观察堆外内存变化

			
  1. public class WriteByDirectByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);

  4. System.in.read();

  5. buffer = null;

  6. new CountDownLatch(1).await();

  7. }

  8. }

结论:变量虽然置为了 null,但内存依旧持续占用。

CASE 2:分配 1G DirectByteBuffer,等待用户输入后,赋值为 null,手动触发 GC,之后阻塞持续观察堆外内存变化

			
  1. public class WriteByDirectByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);

  4. System.in.read();

  5. buffer = null;

  6. System.gc();

  7. new CountDownLatch(1).await();

  8. }

  9. }

结论:GC 时会触发堆外空闲内存的回收。

CASE 3:分配 1G DirectByteBuffer,等待用户输入后,手动回收堆外内存,之后阻塞持续观察堆外内存变化

			
  1. public class WriteByDirectByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);

  4. System.in.read();

  5. ((DirectBuffer) buffer).cleaner().clean();

  6. new CountDownLatch(1).await();

  7. }

  8. }

结论:手动回收可以立刻释放堆外内存,不需要等待到 GC 的发生。

对于 MappedByteBuffer 这个有点神秘的类,它的回收机制大概和 DirectByteBuffer 类似,体现在右边的 Mapped 之中,我们就不重复 CASE1 和 CASE2 的测试了,直接给出结论,在 GC 发生或者操作系统主动清理时 MappedByteBuffer 会被回收。但也不是不进行测试,我们会对 MappedByteBuffer 进行更有意思的研究。

CASE 4:手动回收 MappedByteBuffer。

			
  1. public class MmapUtil {

  2. public static void clean(MappedByteBuffer mappedByteBuffer) {

  3. ByteBuffer buffer = mappedByteBuffer;

  4. if (buffer == null || !buffer.isDirect() || buffer.capacity() == 0)

  5. return;

  6. invoke(invoke(viewed(buffer), "cleaner"), "clean");

  7. }


  8. private static Object invoke(final Object target, final String methodName, final Class... args) {

  9. return AccessController.doPrivileged(new PrivilegedAction<Object>() {

  10. public Object run() {

  11. try {

  12. Method method = method(target, methodName, args);

  13. method.setAccessible(true);

  14. return method.invoke(target);

  15. } catch (Exception e) {

  16. throw new IllegalStateException(e);

  17. }

  18. }

  19. });

  20. }


  21. private static Method method(Object target, String methodName, Class[] args)

  22. throws NoSuchMethodException {

  23. try {

  24. return target.getClass().getMethod(methodName, args);

  25. } catch (NoSuchMethodException e) {

  26. return target.getClass().getDeclaredMethod(methodName, args);

  27. }

  28. }


  29. private static ByteBuffer viewed(ByteBuffer buffer) {

  30. String methodName = "viewedBuffer";

  31. Method[] methods = buffer.getClass().getMethods();

  32. for (int i = 0; i < methods.length; i++) {

  33. if (methods[i].getName().equals("attachment")) {

  34. methodName = "attachment";

  35. break;

  36. }

  37. }

  38. ByteBuffer viewedBuffer = (ByteBuffer) invoke(buffer, methodName);

  39. if (viewedBuffer == null)

  40. return buffer;

  41. else

  42. return viewed(viewedBuffer);

  43. }

  44. }

这个类曾经在我的《文件 IO 的一些最佳实践》中有所介绍,在这里我们将验证它的作用。编写测试类:

			
  1. public class WriteByMappedByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. File data = new File("/tmp/data.txt");

  4. data.createNewFile();

  5. FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();

  6. MappedByteBuffer map = fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);

  7. System.in.read();

  8. MmapUtil.clean(map);

  9. new CountDownLatch(1).await();

  10. }

  11. }

结论:通过一顿复杂的反射操作,成功地手动回收了 Mmap 的内存映射。

CASE 5:测试 Mmap 的内存占用

			
  1. public class WriteByMappedByteBufferTest {

  2. public static void main(String[] args) throws IOException, InterruptedException {

  3. File data = new File("/tmp/data.txt");

  4. data.createNewFile();

  5. FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();

  6. for (int i = 0; i < 1000; i++) {

  7. fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);

  8. }

  9. System.out.println("map finish");

  10. new CountDownLatch(1).await();

  11. }

  12. }

我尝试映射了 1000G 的内存,我的电脑显然没有 1000G 这么大内存,那么监控是如何反馈的呢?

几乎在瞬间,控制台打印出了 map finish 的日志,也意味着 1000G 的内存映射几乎是不耗费时间的,为什么要做这个测试?就是为了解释内存映射并不等于内存占用,很多文章认为内存映射这种方式可以大幅度提升文件的读写速度,并宣称“写 MappedByteBuffer 就等于写内存”,实际是非常错误的认知。通过控制面板可以查看到该 Java 进程(pid 39040)实际占用的内存,仅仅不到 100M。(关于 Mmap 的使用场景和方式可以参考我之前的文章)

结论:MappedByteBuffer 映射出一片文件内容之后,不会全部加载到内存中,而是会进行一部分的预读(体现在占用的那 100M 上),MappedByteBuffer 不是文件读写的银弹,它仍然依赖于 PageCache 异步刷盘的机制。通过 Java VisualVM 可以监控到 mmap 总映射的大小,但并不是实际占用的内存量

总结

本文借助一个线上问题,分析了使用堆内内存仍然会导致堆外内存分析的现象以及背后 JDK 如此设计的原因,并借助安装了插件之后的 Java VisualVM 工具进行了堆外内存的监控,进而讨论了如何正确的回收堆外内存,以及纠正了一个很多人对于 MappedByteBuffer 的错误认知。


免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

日前Intel的12代酷睿处理器BIOS源码泄露引发网络热议,网上信息显示文件容量高达6GB,主要用于创建及优化12代酷睿的UEFI BIOS。考虑到BIOS的重要性,这次泄露引发了很多人担心,不过Intel官方已经出来...

关键字: Intel 源码 酷睿 BIOS

在我看来最不值得一提的BUG是那种可以重复复现的,他的稳定复现通常排查起来没啥技术含量, 早些年我处理一个不值得一提的BUG,BUG也很好复现,难点是复现时间固定在4小时左右,BUG由于文件资源未释放引起进程访问文件数目...

关键字: 低级BUG 源码

在上海港,出口挪威的比亚迪100台唐EV新能源汽车等待装船。 比亚迪供图在上海海通国际汽车码头,装载着各大品牌新能源汽车的大拖车排起长队,等待着漂洋过海,抵达欧洲、中东、南美等地。

关键字: 一度电 回收 动力电池

作者:vivo互联网服务器团队-ZhangZhenglin一、简介RocketMQ是阿里巴巴开源的分布式消息中间件,它借鉴了Kafka实现,支持消息订阅与发布、顺序消息、事务消息、定时消息、消息回溯、死信队列等功能。Ro...

关键字: 源码 存储模块 ck

来源:https://www.cnblogs.com/deng-cc/p/6927447.html最近正好也没什么可忙的,就回过头来鼓捣过去的知识点,到Servlet部分时,以前学习的时候硬是把从上到下的继承关系和接口实...

关键字: IDE 源码 Diagram

一、前言老周这里编译Kafka的版本是2.7,为啥采用这个版本来搭建源码的阅读环境呢?因为该版本相对来说比较新。而我为啥不用2.7后的版本呢?比如2.8,这是因为去掉了ZooKeeper,还不太稳定,生产环境也不太建议使...

关键字: 源码 编译

国庆的时候闲来无事,就随手写了一点之前说的比赛的代码,目标就是保住前100混个大赛的文化衫就行了。现在还混在前50的队伍里面,稳的一比。其实我觉得大家做柔性负载均衡那题的思路其实都不会差太多,就看谁能把关键的信息收集起来...

关键字: 源码

对于大部分人而言购物已经成为了我们生活当中的一种习惯,因为在现在人们的生活水平质量在飞速的提高,所以我们的手里面都有了一些多余的钱,然而这些钱我们大多数会用于我们的日常生活购物方面。然而我们今天要为大家带来的就是我们在购...

关键字: 变频器 回收 报废

点击上方“小麦大叔”,选择“置顶/星标公众号”福利干货,第一时间送达大家好,我是小麦,以前用单片机做用户交互的菜单的时候,都比较痛苦,如何写一个复用性高,方便维护,可扩展性高的GUI框架呢?当然可以自己动手写一个,这个过...

关键字: 单片机 源码

知道有多少人折腾过液晶显示的菜单,我觉得很多人都应该搞过,我还记得以前大学参加电子设计竞赛获奖的作品,我就用到了一个12864,里面有菜单功能。以前可能觉得菜单高大上,其实并不是想象中的复杂,本文为大家分享一个用单色屏做...

关键字: 源码
关闭
关闭