在上一篇博客,简单的说下了AQS的基本概念,核心源码解析,但是还有一部分内容没有涉及到,就是AQS对条件变量的支持,这篇博客将着重介绍这方面的内容。
条件变量
基本应用
我们先通过模拟一个消费者/生产者模型来看下条件变量的基本应用:
- 当有数据的时候,生产者停止生产数据,通知消费者消费数据;
- 当没有数据的时候,消费者停止消费数据,通知生产者生产数据;
public class CommonResource { private boolean isHaveData = false; Lock lock = new ReentrantLock(); Condition producer_con = lock.newCondition(); Condition consumer_con = lock.newCondition(); public void product() { lock.lock(); try { while (isHaveData) { try { System.out.println("还有数据,等待消费数据"); producer_con.await(); } catch (InterruptedException e) { } } System.out.println("生产者生产数据了"); try { TimeUnit.SECONDS.sleep(3); } catch (InterruptedException e) { e.printStackTrace(); } isHaveData = true; consumer_con.signal(); } finally { lock.unlock(); } } public void consume() { lock.lock(); try { while (!isHaveData) { try { System.out.println("没有数据了,等待生产者消费数据"); consumer_con.await(); } catch (InterruptedException e) { } } System.out.println("消费者消费数据"); try { TimeUnit.SECONDS.sleep(3); } catch (InterruptedException e) { e.printStackTrace(); } isHaveData = false; producer_con.signal(); } finally { lock.unlock(); } }}
public class Main { public static void main(String[] args) { CommonResource resource = new CommonResource(); new Thread(() -> { while (true) { resource.product(); } }).start(); new Thread(() -> { while (true) { resource.consume(); } }).start(); }}
运行结果:
这就是条件变量的应用,第一反应是不是和object中的wait/nofity很像,wait/nofity是配合synchronized工作的,而条件变量的await/signal是配合使用AQS实现的锁
来完成工作的,当然也要看用AQS实现的锁是否支持了条件变量。synchronized只能与一个共享变量进行工作,而AQS实现的锁支持多个条件变量。我们试着分析下上面的代码:
首先创建了两个条件变量,一个条件变量用来阻塞/唤醒消费者线程,一个条件变量用来阻塞/唤醒生产者线程。
生产者,首先获取了独占锁,判断是否有数据:
- 如果有数据,则调用条件变量producer_con的await方法,阻塞当前线程,当消费者线程再次调用该条件变量producer_con的signal方法,就会唤醒该线程。
- 如果没有数据,则生产数据,并且调用条件变量consumer_con的signal方法,唤醒因为调用consumer_con的await方法而被阻塞的消费者线程。
最终释放锁。
消费者,首先获取了独占锁,判断是否有数据:
- 如果没有数据,则调用条件变量consumer_con的await方法,阻塞当前线程,当生产者线程再次调用该条件变量consumer_con的signal方法,就会唤醒该线程。
- 如果有数据,则消费数据,并且调用条件变量producer_con的signal方法,唤醒因为调用producer_con的await方法而被阻塞的生产者线程。
最终释放锁。
这里有两点需要特别注意:
- 释放锁,一般应该放在finally里面,以防中间出现异常,锁没有被释放。
- 判断是否有数据,其实用if在绝大部分情况也可以,但是用while更好一些,可以防止虚假唤醒。
为了加深对条件变量的理解,我们再来看一个例子,两个线程交替打印奇偶数:
public class Test { private int num = 0; private Lock lock = new ReentrantLock(); Condition condition = lock.newCondition(); public void add() { while(num<100) { try { lock.lock(); System.out.println(Thread.currentThread().getName() + ":" + num++); condition.signal(); condition.await(); } catch (InterruptedException e) { e.printStackTrace(); } finally { lock.unlock(); } } }}
public class Main { public static void main(String[] args) { Test test=new Test(); new Thread(() -> { test.add(); }).start(); new Thread(() -> { test.add(); }).start(); }}
运行结果:
翻阅网上的大多数案例是分两个线程方法交替打印,同时开两个条件变量,其中一个条件变量负责阻塞/唤醒打印奇数的线程,一个变量负责阻塞/唤醒打印偶数的线程,但是个人觉得没什么必要,两个线程共用一个线程方法,共用一个条件变量也可以。不知道各位看官是什么想的?
源码解析
当我们点开lock.newCondition,发现它有好几个实现类:
我们选择ReentrantLock的实现类,实际上其他实现类也是相同的,只是为了和上面案例中的对应起来,所以先选择ReentrantLock的实现类:public Condition newCondition() { return sync.newCondition(); }
继续往下点:
final ConditionObject newCondition() { return new ConditionObject(); }
可以看到,当我们调用lock.newnewCondition,最终会new出一个ConditionObject对象,而ConditionObject类是AbstractQueuedSynchronizer的内部类,我们先看下ConditionObject的UML图:
其中firstWaiter保存的是该条件变量下条件队列的首节点,lastWaiter保存的是该条件变量下条件队列的尾节点。这里只保存了条件队列的首节点和尾节点,中间的节点保存在哪里呢? 让我们点开await方法:public final void await() throws InterruptedException { if (Thread.interrupted()) throw new InterruptedException(); Node node = addConditionWaiter(); int savedState = fullyRelease(node); int interruptMode = 0; while (!isOnSyncQueue(node)) { LockSupport.park(this); if ((interruptMode = checkInterruptWhileWaiting(node)) != 0) break; } if (acquireQueued(node, savedState) && interruptMode != THROW_IE) interruptMode = REINTERRUPT; if (node.nextWaiter != null) // clean up if cancelled unlinkCancelledWaiters(); if (interruptMode != 0) reportInterruptAfterWait(interruptMode); }
在这里,我们就搞清楚三个问题即可:
- 完整的条件队列保存在哪里,以什么方式保存?
- await方法,是如何释放锁的?
- await方法,是如何阻塞线程的?
第一个问题在addConditionWaiter方法可以得到答案:
private Node addConditionWaiter() { Node t = lastWaiter; // If lastWaiter is cancelled, clean out. if (t != null && t.waitStatus != Node.CONDITION) { unlinkCancelledWaiters(); t = lastWaiter; } Node node = new Node(Thread.currentThread(), Node.CONDITION); if (t == null) firstWaiter = node; else t.nextWaiter = node; lastWaiter = node; return node; }
首先是判断条件队列中的尾节点是否被取消了,如果被取消了,执行unlinkCancelledWaiters方法。我们这里肯定没有被取消,事实上,如果是第一次调用await方法,lastWaiter是为空的,所以肯定不会进入第一个if。随后,新建一个Node,这个Node类就是上一篇博客中大量介绍过的,也是AbstractQueuedSynchronizer的内部类,也就是新建了一个Node节点,其中保存了当前线程和Node的类型,这里Node的类型是CONDITION,如果t==null,则说明新建的Node是第一个节点,所以赋值给firstWaiter ,否则将尾节点的nextWaiter设置为新Node,形成一个单向链表,这个nextWaiter在哪里呢,它是通过node点出来的,也就是它也属于node类的一个字段:
这说明了一个比较重要的问题: AQS的阻塞队列是以双向的链表的形式保存的,是通过prev和next建立起关系的,但是AQS中的条件队列是以单向链表的形式保存的,是通过nextWaiter建立起关系的,也就是AQS的阻塞队列和AQS中的条件队列并非同一个队列。其实,AQS中的条件队列也是一个阻塞队列,只是为了方便,所以在本篇博客中出现的AQS中的条件队列特指在被条件变量await的,而阻塞队列特指FIFO双向链表队列。
第一个问题解决了,我们再来看第二个问题,第二个问题答案在await的第二个方法:
final int fullyRelease(Node node) { boolean failed = true; try { int savedState = getState(); if (release(savedState)) { failed = false; return savedState; } else { throw new IllegalMonitorStateException(); } } finally { if (failed) node.waitStatus = Node.CANCELLED; } }
首先调用getState方法,这个state是什么,不知大家是否还有印象,对于ReentrantLock来说,state就是重入次数,随后调用release方法,传入state。也就是不管重入了多少次,这里是一次性把锁完全释放掉。
public final boolean release(int arg) { if (tryRelease(arg)) { Node h = head; if (h != null && h.waitStatus != 0) unparkSuccessor(h); return true; } return false; }
可以看到释放锁还是调用了tryRelease方法,这个方法正是需要被重写的。
当完成了前两个方法的调用后,就会进行一个判断isOnSyncQueue,一般来说会进入这个if,park这个线程,等待唤醒,这就解决了第三个问题。
下面我们再来看看signal方法,同样的,我们需要解决几个问题:
- AQS的条件队列和阻塞队列既然不是同一个队列,那么是不是被await的线程永远不会进入阻塞队列?
- signal方法是如何唤醒线程的?
public final void signal() { if (!isHeldExclusively()) throw new IllegalMonitorStateException(); Node first = firstWaiter; if (first != null) doSignal(first); }
重点在于doSignal中的transferForSignal方法:
final boolean transferForSignal(Node node) { /* * If cannot change waitStatus, the node has been cancelled. */ if (!compareAndSetWaitStatus(node, Node.CONDITION, 0)) return false; /* * Splice onto queue and try to set waitStatus of predecessor to * indicate that thread is (probably) waiting. If cancelled or * attempt to set waitStatus fails, wake up to resync (in which * case the waitStatus can be transiently and harmlessly wrong). */ Node p = enq(node); int ws = p.waitStatus; if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL)) LockSupport.unpark(node.thread); return true;
在这个方法中,我们可以会调用enq方法,把条件队列的线程放入阻塞队列中,然后调用unpark方法,唤醒线程。
本篇博客到这里也结束了。
经过上下两篇博客,相信大家对AQS一定有了一个比较浅显的理解。聪明的你,可以看出来,其实这两篇博客有很多内容都没有讲透,甚至有点模棱两可,只是“蜻蜓点水”,所以这也符合了我的标题:难以理解的AQS。的确,AQS要深入研究的话,不比线程池简单多少。看,我又再给自己找理由了。希望经过今后的沉淀,我可以把这两篇博客重写下,然后换个标题“彻底理解AQS”,嘿嘿。