当前位置:首页 > 科技  > 软件

【故障现场】多线程性能优化最大的坑,99%人都不自知

来源: 责编: 时间:2024-01-22 17:25:45 389观看
导读1. 问题&分析当我们在处理慢接口问题时,经常会使用多线程技术,将能够并行处理的任务拆分到不同的线程中处理,等任务处理完成后,再收集各线程的处理结果,进行后续的处理。整体思路如下图所示:图片这样可以将并行部分的总耗时

1. 问题&分析

当我们在处理慢接口问题时,经常会使用多线程技术,将能够并行处理的任务拆分到不同的线程中处理,等任务处理完成后,再收集各线程的处理结果,进行后续的处理。整体思路如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

这样可以将并行部分的总耗时从 sum 降为 max,从而大幅降低接口的响应时间。ryN28资讯网——每日最新资讯28at.com

1.1. 案例

订单详情页耗时严重,p99 将近3秒,已经验证影响用户体验,本次迭代小艾专门对该接口进行优化。迭代刚上线,该接口的响应时间大幅降低,p99 降低到 800 毫秒以内,大家纷纷向小艾发来祝贺。但好景不长,随着流量的增加,接口响应时间也在逐渐变长,p99 超过 5 秒,最后系统抛出大量的 RejectedExecutionException 异常,这个接口不可用。最终,QA伙伴火速进行回滚操作,系统恢复正常。ryN28资讯网——每日最新资讯28at.com

系统恢复后,小艾仔细查看系统监控,CPU使用率并不高,内存也处于正常水位,接口性能居然比优化前还差,真心不知道哪里出了问题。ryN28资讯网——每日最新资讯28at.com

优化前代码:ryN28资讯网——每日最新资讯28at.com

public RestResult<OrderDetailVO> getOrderDetail(@PathVariable Long orderId){        Stopwatch stopwatch = Stopwatch.createStarted();        OrderService.Order order = this.orderService.getById(orderId);        if (order == null){            return RestResult.success(null);        }        OrderDetailVO orderDetail = new OrderDetailVO();        orderDetail.setUser(userService.getById(order.getUserId()));        orderDetail.setAddress(addressService.getById(order.getUserAddressId()));        orderDetail.setCoupon(couponService.getById(order.getCouponId()));        orderDetail.setProduct(productService.getById(order.getProductId()));        log.info("串行 Cost {} ms", stopwatch.stop().elapsed(TimeUnit.MILLISECONDS));        return RestResult.success(orderDetail);}

优化前耗时:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

优化后代码:ryN28资讯网——每日最新资讯28at.com

public RestResult<OrderDetailVO> getOrderDetailNew(@PathVariable Long orderId){        Stopwatch stopwatch = Stopwatch.createStarted();        OrderService.Order order = this.orderService.getById(orderId);        if (order == null){            return RestResult.success(null);        }        Future<UserService.User> userFuture = this.executorService.submit(() -> userService.getById(order.getUserId()));        Future<AddressService.Address> addressFuture = this.executorService.submit(() -> addressService.getById(order.getUserAddressId()));        Future<CouponService.Coupon> couponFuture = this.executorService.submit(() -> couponService.getById(order.getCouponId()));        Future<ProductService.Product> productFuture = this.executorService.submit(() -> productService.getById(order.getProductId()));        OrderDetailVO orderDetail = new OrderDetailVO();        orderDetail.setUser(getFutureValue(userFuture));        orderDetail.setProduct(getFutureValue(productFuture));        orderDetail.setAddress(getFutureValue(addressFuture));        orderDetail.setCoupon(getFutureValue(couponFuture));        log.info("并行 Cost {} ms", stopwatch.stop().elapsed(TimeUnit.MILLISECONDS));        return RestResult.success(orderDetail);    }

优化后耗时:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

可见采用并行优化后,接口的响应时间从 4 秒 将至 1 秒,效果还是非常明显的。ryN28资讯网——每日最新资讯28at.com

但,继续加大请求量,系统便出现问题,如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

图片ryN28资讯网——每日最新资讯28at.com

在流量逐渐增加的过程中,从日志中可以得到以下信息:ryN28资讯网——每日最新资讯28at.com

初期耗时稳定,基本在 1 秒左右ryN28资讯网——每日最新资讯28at.com

接口耗时逐渐增大,甚至远超串行处理的耗时(大于 4 秒)ryN28资讯网——每日最新资讯28at.com

有些请求直接抛出 RejectedExecutionException 异常ryN28资讯网——每日最新资讯28at.com

1.2. 问题分析

从代码中并未发现任何问题,设计思路也非常清晰,其核心问题在线程池使用上,项目线程池配置如下:ryN28资讯网——每日最新资讯28at.com

int coreSize = Runtime.getRuntime().availableProcessors();executorService = new ThreadPoolExecutor(coreSize, coreSize * 5,        5L, TimeUnit.MINUTES,        new LinkedBlockingQueue<Runnable>(1024)        );

核心配置为:ryN28资讯网——每日最新资讯28at.com

  1. 核心线程数为 cpu 核数
  2. 最大线程数为 cpu 核数的 5 倍
  3. 空闲线程存活时间为 5 分钟
  4. 任务队列为 LinkedBlockingQueue 大小为 1024

在这个配置下,我们推演下以上的三个现象。ryN28资讯网——每日最新资讯28at.com

1.2.1. 线程资源充足

如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

整体流程如下:ryN28资讯网——每日最新资讯28at.com

  1. 主线程向线程池提交 Task
  2. 由于线程处于空闲状态,立即接受并处理问题
  3. 线程池线程处理完任务,将最终的处理结果写回到 Future
  4. 主线程等待所有任务执行完成,获取所有执行结果,然后执行后续流程

这正是想要的执行结果,任务被并行执行,大幅降低接口耗时。ryN28资讯网——每日最新资讯28at.com

1.2.2. 任务进入等待队列

随着流量的增加,所有的核心线程都处于忙碌状态,此时新任务将进入等待队列,具体如下:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

整体流入如下:ryN28资讯网——每日最新资讯28at.com

  1. 主线程向线程池提交任务
  2. 由于没有核心线程可用,任务被放置到任务队列
  3. 主线程进入等待状态,等待时间包括两部分:

任务在队列中等待线程调度时间ryN28资讯网——每日最新资讯28at.com

任务分配到线程后,任务实际执行时间ryN28资讯网——每日最新资讯28at.com

  1. 如果前面等待的任务非常多,那等待时间将变的非常长

主线程等待时间 = 队列等待时间 + 任务执行时间。当任务队列非常长时,整体时间将远超串行执行时间。ryN28资讯网——每日最新资讯28at.com

1.2.3. 资源耗尽触发拒绝策略

流量继续增加,线程池的任务队列已满并且线程数量也达到上限,此时会触发拒绝策略,具体如下:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

线程池默认拒绝策略为:AbortPolicy,直接抛出 RejectedExecutionException,从而触发接口异常。ryN28资讯网——每日最新资讯28at.com

还有更可怕的情况,就是部分提交,也就是主线程已经成功提交几个任务,如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

核心流程如下:ryN28资讯网——每日最新资讯28at.com

  1. 主线程已经成功提交两个任务
  2. 在提交第三个任务时,由于资源不够触发拒绝策略,抛出异常导致主线程提前结束
  3. 已经成功提交的任务仍旧会被线程执行,由于主线程已经退出,执行结果没有任何意义,从而白白浪费系统资源

2. 解决方案

前面已经分析的很清楚,问题的本质就是线程池资源分配不合理,核心参数设置错误:ryN28资讯网——每日最新资讯28at.com

  1. 队列设置错误。在该场景下,需要充分利用线程资源,将任务放入队列会增加任务在队列的等待时间,队列长度越大对系统的伤害越大;
  2. 拒绝策略设置错误。直接抛出异常会中断主流程,导致部分无效任务(无意义任务)提交,白白浪费系统资源;

除线程池参数问题外,还有个小问题:主线程完成任务提交后处于等待状态,未执行任何有意义的操作,存在资源浪费。ryN28资讯网——每日最新资讯28at.com

2.1. 线程池改进方案

改进线程池如下所示:ryN28资讯网——每日最新资讯28at.com

int coreSize = Runtime.getRuntime().availableProcessors();executorService = new ThreadPoolExecutor(coreSize, coreSize * 5,        5L, TimeUnit.MINUTES,        new SynchronousQueue<>(),        new ThreadPoolExecutor.CallerRunsPolicy()        );

线程池配置如下:ryN28资讯网——每日最新资讯28at.com

  1. 核心线程数不变,仍旧是 cpu 数;
  2. 最大线程数不变,仍旧是 cpu 数的5倍;
  3. 空闲线程存活时间不变,仍旧是 5 分钟;
  4. 使用 SynchronousQueue 替代 LinkedBlockingQueue(1024)。SynchronousQueue 是一个特殊的队列,其最大容量是1。也就是说,任何一次插入操作都必须等待一个相应的删除操作,反之亦然。如果没有相应的操作正在进行,则该线程将被阻塞;
  5. 指定拒绝策略为 CallerRunsPolicy。当线程池资源不够时,由主线程来执行任务;

在这个配置下,及时线程池中的所有资源全部耗尽,也只会降级到串行执行,不会让系统变的更糟糕。ryN28资讯网——每日最新资讯28at.com

新配置下,系统表现如下:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

在最差的情况下也仅仅与串行执行耗时一致。ryN28资讯网——每日最新资讯28at.com

总体来说就一句话:线程池有资源可用,那就为主线程分担部分压力;如果没有资源可用,那就由主线程独自完成。ryN28资讯网——每日最新资讯28at.com

2.1. 充分利用主线程

上面提到一个小问题,在资源充足情况下,所有任务均有线程池线程完成,主线程一致处于等待状态,存在一定的资源浪费。ryN28资讯网——每日最新资讯28at.com

如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

3 个任务耗费 4 个线程资源:ryN28资讯网——每日最新资讯28at.com

  1. 线程池3个线程负责执行任务
  2. 主线程等待执行结果,一直处于阻塞状态

为了充分利用线程资源,可以让主线程负责执行任意一个任务。如下图所示:ryN28资讯网——每日最新资讯28at.com

图片图片ryN28资讯网——每日最新资讯28at.com

主线程不在盲目等待,也负责一个任务的执行,这样 3 个任务只需 3 个线程即可。ryN28资讯网——每日最新资讯28at.com

代码上也非常简单,具体如下:ryN28资讯网——每日最新资讯28at.com

public RestResult<OrderDetailVO> getOrderDetailNew(@PathVariable Long orderId){    Stopwatch stopwatch = Stopwatch.createStarted();    OrderService.Order order = this.orderService.getById(orderId);    if (order == null){        return RestResult.success(null);    }    Future<UserService.User> userFuture = this.executorService.submit(() -> userService.getById(order.getUserId()));    Future<AddressService.Address> addressFuture = this.executorService.submit(() -> addressService.getById(order.getUserAddressId()));    Future<CouponService.Coupon> couponFuture = this.executorService.submit(() -> couponService.getById(order.getCouponId()));//        Future<ProductService.Product> productFuture = this.executorService.submit(() -> productService.getById(order.getProductId()));    OrderDetailVO orderDetail = new OrderDetailVO();    // 由主线程负责运行    orderDetail.setProduct(productService.getById(order.getProductId()));    orderDetail.setUser(getFutureValue(userFuture));    orderDetail.setAddress(getFutureValue(addressFuture));    orderDetail.setCoupon(getFutureValue(couponFuture));    log.info("并行 Cost {} ms", stopwatch.stop().elapsed(TimeUnit.MILLISECONDS));    return RestResult.success(orderDetail);}

主线程执行不同的任务,会对接口的响应时间产生影响吗?ryN28资讯网——每日最新资讯28at.com

不会,并行执行整体耗时为 max(任务耗时),主线程必须获取全部结果才能运行,所以必须等待这么长时间。ryN28资讯网——每日最新资讯28at.com

  1. 如果主线程运行的任务不是最耗时任务,则需要等待最耗时任务执行完成才能执行后续逻辑;
  2. 如果主线程运行的是最耗时任务,则其他线程已经执行完成并提前释放资源;

3. 示例&源码

代码仓库:https://gitee.com/litao851025/learnFromBugryN28资讯网——每日最新资讯28at.com

代码地址:https://gitee.com/litao851025/learnFromBug/tree/master/src/main/java/com/geekhalo/demo/thread/paralleltaskryN28资讯网——每日最新资讯28at.com


ryN28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-66204-0.html【故障现场】多线程性能优化最大的坑,99%人都不自知

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: CSS 滚动驱动动画实现圆弧滚动条

下一篇: 牢记这 16 个 SpringBoot 扩展接口,写出更加漂亮的代码

标签:
  • 热门焦点
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • 太卷!Redmi MAX 100英寸电视便宜了:12999元买Redmi史上最大屏

    8月5日消息,从小米商城了解到,Redmi MAX 100英寸巨屏电视日前迎来官方优惠,到手价12999元,比发布价便宜了7000元,在大屏电视市场开卷。据了解,Redmi MAX 100
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
  • 引领旗舰级影像能力向中端机普及 OPPO K11 系列发布 1799 元起

    7月25日,OPPO正式发布K系列新品—— OPPO K11 。此次 K11 在中端手机市场长期被忽视的影像板块发力,突破性地搭载索尼 IMX890 旗舰大底主摄,支持 OIS
Top