漫画:聊聊线程池中,线程的增长/回收策略

开发
我们今天就来借这个问题,聊聊线程池中维护的线程,它增长和回收的策略是什么样的?

 一、序

 

 

public static ExecutorService newThreadPool() { return new ThreadPoolExecutor( 30, 60, 60L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue());}

 

 

 

 

我们今天就来借这个问题,聊聊线程池中维护的线程,它增长和回收的策略是什么样的?

二、线程池的策略

2.1 线程池的各项参数

当我们聊到线程池中线程的增长策略的时候,最抓眼球的就是它的核心线程数(corePoolSize)和最大线程数(maximumPoolSize),但是仅看这两个参数是不够全面的,线程数量的增长,还与任务等待队列有关系。

我们先来看看 ThreadPoolExecutor 最全参数的构造方法:

  1. public ThreadPoolExecutor( 
  2.   int corePoolSize, 
  3.   int maximumPoolSize, 
  4.   long keepAliveTime, 
  5.   TimeUnit unit, 
  6.   BlockingQueue<Runnable> workQueue, 
  7.   ThreadFactory threadFactory, 
  8.   RejectedExecutionHandler handler) { 
  9.   // ... 

简单解释一下各个参数是什么意思:

  • corePoolSize:核心线程数;
  • maximumPoolSize:线程池的最大线程数;
  • keepAliveTime:核心线程数之外的线程,最大空闲存活的时长;
  • unit:keepAliveTime 的时间单位;
  • workQueue:线程池的任务等待队列;
  • threadFractory:线程工厂,用来为线程池创建线程;
  • handler:拒绝策略,当线程池无法处理任务时的拒绝方式;

这其中很多参数的配置,都是相互影响的。例如任务等待队列 workQueue 配置不当,可能导致线程池中的线程,永远无法增长到核心线程数(maximumPoolSize)配置的线程数。

2.2 线程池中线程的增长策略

看到这里你应该就清楚了,线程池线程的增长策略,和 3 个参数有关系:

  • corePoolSize:核心线程数
  • maximumPoolSize:最大线程数;
  • workQueue:等待任务队列;

它们之前的关系是这样的:

 

 

 

 

接下来我们看看理想情况下,线程池中线程的增长策略。

默认情况下,初始时线程池是空的,当有新任务来了时,线程池开始通过线程工厂(threadFractory)创建线程来处理任务。

新的任务会不断的触发线程池中线程的创建,直到线程数量达到核心线程数(corePoolSize),接下来会停止线程的创建,而是将这个新任务放入任务等待队列(workQueue)。

新任务不断进入任务等待队列,当该队列满了时,开始重新创建线程处理任务,直到线程池中线程的数量,到达 maximumPoolSize 配置的数量。

到这一步时,线程池的线程数达到最大值,并且没有空闲的线程,任务队列也存满了任务,这时如果还有新的任务进来,就会触发线程池的拒绝策略(handler),如果没有配置拒绝策略就会抛出 RejectedExecutionException 异常。

到这里线程的增长策略就说清楚了,我们可以通过下图来了解完整的流程。

 

 

 

 

其中比较关键的就是任务的等待队列,无论等待队列的实现结构是什么样的,只有在它满的时候,线程池中的线程才会向最大线程数增长。但是一个能够满的队列,它的前提是必须是一个有界队列。

这就是文章开头举的例子暗藏的坑,我们回顾一下前面构造的线程池。

  1. public static ExecutorService newThreadPool() { 
  2.   return new ThreadPoolExecutor( 
  3.     30, 60, 
  4.     60L, TimeUnit.MILLISECONDS, 
  5.     new LinkedBlockingQueue<Runnable>()); 

可以看到,这里虽然最大线程数是大于核心线程数的,但是它的等待队列配置的是一个 LinkedBlockingQueue,从名字上可以看出这是一个基于链表实现的阻塞队列,而用它的默认构造方法构造时,其容量设定为 Integer.MAX_VALUE,可以简单理解它是一个无界队列。

  1. public LinkedBlockingQueue() { 
  2.   this(Integer.MAX_VALUE); 
  3.  
  4. public LinkedBlockingQueue(int capacity) { 
  5.   if (capacity <= 0) throw new IllegalArgumentException(); 
  6.   this.capacity = capacity; 
  7.   last = head = new Node<E>(null); 

这也就是为什么说,这样构造的线程池,核心线程数的配置参数,永远都用不到,因为它的等待队列永远没有满的时候。

2.3 线程池中线程的收缩策略

线程池中执行的任务,总有执行结束的时候。那么线程池当线程池中存在大量空闲线程时,也会有一定的收缩策略,来回收线程池中多余的线程。

线程池中线程的收缩策略,和以下几个参数相关:

  • corePoolSize:核心线程数;
  • maximumPoolSize:线程池的最大线程数;
  • keepAliveTime:核心线程数之外的线程,空闲存活的时长;
  • unit:keepAliveTime 的时间单位;

corePoolSize 和 maximumPoolSize 我们比较熟悉了,另外能够控制它的就是 keepAliveTime 空闲存活时长,以及这个时长的单位。

当线程池中的线程数,超过核心线程数时。此时如果任务量下降,肯定会出现有一些线程处于无任务执行的空闲状态。那么如果这个线程的空闲时间超过了 keepAliveTime&unit 配置的时长后,就会被回收。

需要注意的是,对于线程池来说,它只负责管理线程,对于创建的线程是不区分所谓的「核心线程」和「非核心线程」的,它只对线程池中的线程总数进行管理,当回收的线程数达到 corePoolSize 时,回收的过程就会停止。

对于线程池的核心线程数中的线程,也有回收的办法,可以通过 allowCoreThreadTimeOut(true) 方法设置,在核心线程空闲的时候,一旦超过 keepAliveTime&unit 配置的时间,也将其回收掉。

 

  1. public void allowCoreThreadTimeOut(boolean value) { 
  2.   if (value && keepAliveTime <= 0) 
  3.     throw new IllegalArgumentException("Core threads must have nonzero keep alive times"); 
  4.   if (value != allowCoreThreadTimeOut) { 
  5.     allowCoreThreadTimeOut = value; 
  6.     if (value) 
  7.       interruptIdleWorkers(); 
  8.   } 

allowCoreThreadTimeOut() 能被设置的前提是 keepAliveTime 不能为 0。

2.3 查缺补漏

1. 等待队列还会影响拒绝策略

等待队列如果配置成了无界队列,不光影响线程数量从核心线程数向最大线程数的增长,还会导致配置的拒绝策略永远得不到执行。

因为只有在线程池中的工作线程数量已经达到核心线程数,并且此时等待队列也满了的情况下,拒绝策略才能生效。

2. 核心线程数可以被「预热」

前面提到默认的情况下,线程池中的线程是根据任务来增长的。但如果有需要,我们也可以提前准备好线程池的核心线程,来应对突然的高并发任务,例如在抢购系统中就经常有这样的需要。

此时就可以利用 prestartCoreThread() 或者 prestartAllCoreThreads() 来提前创建核心线程,这种方式被我们称为「预热」。

3. 对于需要无界队列的场景,怎么办?

需求是多变的,我们肯定会碰到需要使用无界队列的场景,那么这种场景下配置的 maximumPoolSize 就是无效的。

此时就可以参考 Executors 中 newFixedThreadPool() 创建线程池的过程,将 corePoolSize 和 maximumPoolSize 保持一致即可。

  1. public static ExecutorService newFixedThreadPool(int nThreads) { 
  2.   return new ThreadPoolExecutor( 
  3.     nThreads, nThreads, 
  4.     0L, TimeUnit.MILLISECONDS, 
  5.     new LinkedBlockingQueue<Runnable>()); 

此时核心线程数就是最大线程数,只有增长到这个数量才会将任务放入等待队列,来保证我们配置的线程数量都得到了使用。

4. 线程池是公平的吗?

所谓的公平,就是先到的任务会被先执行。这在线程池中,显然是不公平的。

不提线程池中线程执行任务是通过系统去调度的,这一点就决定了任务的执行顺序是无法保证的,这就是是非公平的。另外只从线程池本身的角度来看,我们只看提交的任务顺序来看,它也是非公平的。

首先前面到的任务,如果线程池的核心线程已经分配出去了,此时这个任务就会进入任务队列,那么如果任务队列满了之后,新到的任务会直接由线程池新创建线程去处理,直到线程数达到最大线程数。

那么此时,任务队列中的任务,虽然先添加进线程池等待处理,但是这些任务的处理时机,是晚于后续新创建线程去处理的任务的,所以说仅从任务的角度,依然是非公平的。

三、小结时刻

本文我们聊到了线程池中,对于线程数量的增长和收缩策略。

在这里我们简单总结一下:

1. 增长策略。默认情况下,线程池是根据任务先创建足够核心线程数的线程去执行任务,当核心线程满了时将任务放入等待队列。待队列满了的时候,继续创建新线程执行任务直到到达最大线程数停止。再有新任务的话,那就只能执行拒绝策略或是抛出异常。

2. 收缩策略。当线程池线程数量大于核心线程数 && 当前有空闲线程 && 空闲线程的空闲时间大于 keepAliveTime 时,会对该空闲线程进行回收,直到线程数量等于核心线程数为止。

总之要谨记,慎用无界队列。

责任编辑:武晓燕 来源: 承香墨影
相关推荐

2023-02-02 08:56:25

线程池线程submit

2020-12-28 08:03:26

多线程进程浏览器

2023-04-02 17:53:10

多线程编程自测

2024-03-12 13:11:20

powerjob单机线程

2021-11-29 10:55:11

线程池Java面试

2021-03-11 00:07:30

线程Thread程序

2022-02-07 11:55:00

linux进程线程

2021-02-01 08:28:24

Linux线程池Linux系统

2022-08-29 09:06:43

hippo4j动态线程池

2022-06-07 23:28:05

线程安全后端

2023-10-26 08:25:35

Java线程周期

2020-11-25 11:33:47

Java线程技术

2020-06-11 11:36:49

线程池Java场景

2024-01-08 09:09:40

线程池异常黑洞Futrue

2017-03-23 10:24:33

2019-11-07 09:20:29

Java线程操作系统

2023-03-14 11:00:05

过期策略Redis

2022-06-07 08:20:49

线程安全多线程

2022-11-22 14:39:40

CPU单核多核

2022-10-12 09:01:52

Linux内核线程
点赞
收藏

51CTO技术栈公众号