Java-高级

Posted by Alex on August 10, 2019

JDK1.8

主要新特性讨论

语言新特性

  • Lambda表达式和函数式接口,允许将函数作为参数,使用函数式编程的概念。
  • 接口的默认方法和静态方法
  • 方法引用
    • 构造器引用,语法是Class::new
    • 静态方法引用,语法是Class::static_method
    • 某个类的成员方法的引用,语法是Class::method
    • 某个实例对象的成员方法的引用,语法是instance::method
  • 重复注解,@Repeatable注解定义重复注解
  • 更好的类型推断
  • 拓宽注解的应用场景:注解几乎可以使用在任何元素上,局部变量、接口类型、超类、接口实现类、函数的异常定义。
  • Jdk1.6之后对 Synchronized 进行了性能优化,轻量级锁、偏向锁。

Java官方库的新特性

  • Optional
  • Streams
  • Date/Time API(JSR 310)
  • Nashorn JavaScript引擎: 可以在JVM上开发和运行JS应用
  • Base64
  • 并行数组
  • 并发性: 为java.util.concurrent.ConcurrentHashMap类添加了新的方法来支持聚焦操作

DateTimeFormatter

  • java8之前,时间格式化主要是使用 SimpleDateFormat,是非线程安全的。
    • SimpleDateFormat之所以是线程不安全的就是因为Calendar是线程不安全的,后者之所以是线程不安全的是因为其中存放日期数据的变量都是线程不安全的
  • java8中,主要是使用 DateTimeFormatter, 是线程安全的。

实例参考

Java8处理日期和时间示例

字符串和Long时间戳互转

Java 多线程

线程状态

  • 新建(New)
  • 可运行(Runnable):Java线程中将就绪(ready)和运行中(running)统称为可运行
  • 阻塞(Blocked):线程阻塞于锁
  • 无限期等待(Waiting):进入该状态的线程需要等待其他线程做出一些特定动作(通知或中断)
  • 限期等待(Timed Waiting):指定的时间后自行返回
  • 死亡(Terminated) thread

创建线程

继承 Thread 类

  • 重写该类的run()方法。该方法为线程执行体。
  • 创建Thread子类的实例。即线程对象。
  • 调用线程对象的start()方法启动该线程
public static class MyThread extends Thread {
    public void run() {
        // ...
    }
}
new MyThread().start();

实现 Runnable 接口

  • 重写该接口的run()方法。该方法为线程执行体。
  • 创建Runnable实现类的实例。并以此实例作为Thread的target来创建Thread对象。该Thread对象才是真正的线程对象。
  • 调用线程对象(该Thread对象)的start()方法启动该线程。
public class MyRunnable implements Runnable {
    public void run() {
        // ...
    }
}
new Thread(new MyRunnable(),"thread1").start();

new Thread(()->{...},"thread2").start();

实现 Callable 接口

  • 与 Runnable 相比,Callable 可以有返回值,返回值通过 FutureTask 进行封装。
  • 通过Future 对象的 get() 获取到Callable任务返回的Object了。get方法是阻塞的,即:线程无返回结果,get方法会一直等待。
public class MyCallable implements Callable<Integer> {
    public Integer call() {
        return 123;
    }
}
FutureTask<Integer> ft = new FutureTask<>(new MyCallable());

FutureTask<Integer> ft = new FutureTask<>(() -> {
    Thread.sleep(100);
    return 1;
});
new Thread(ft).start();

建议 实现接口 > 继承 Thread

  • Java 不支持多重继承,因此继承了 Thread 类就无法继承其它类,但是可以实现多个接口;
  • 类可能只要求可执行就行,继承整个 Thread 类开销过大。

线程池 Executors

Executor:提供了一系列工厂方法用于创建线程池,返回的线程池都实现了ExecutorService接口。

  • newCachedThreadPool():创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程。
    • 线程池为无限大,当执行第二个任务时第一个任务已经完成,会复用执行第一个任务的线程,而不用每次新建线程。
  • newFixedThreadPool(int nThreads):创建定长线程池,可控制线程最大并发数,超出的线程会在队列中等待。
  • newSingleThreadExecutor():创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序(FIFO, LIFO, 优先级)执行。
  • newScheduledThreadPool():创建一个支持定时及周期性的任务执行的线程池,多数情况下可用来替代Timer类。
ExecutorService threadPool = Executors.newFixedThreadPool(10);
threadPool.execute(()->{});

线程池作用:

  • 减少了创建和销毁线程的次数,每个工作线程都可以被重复利用,可执行多个任务。
  • 调整线程池中工作线线程的数目,防止因为消耗过多的内存。

ThreadPoolExecutor 核心参数

corePoolSize:核心线程数,线程池启动时就会创建的线程数量。即使核心线程是空闲的,也不会被回收,除非调用了allowsCoreThreadTimeOut方法为true。

maximumPoolSize:最大线程数,线程池中最大的线程数量。

keepAliveTime:线程超时时间,看源码可知,该参数的意义是线程从工作队列中取出任务的超时时间。

unit:超时时间的单位。

workQueue:工作队列。 BlockingQueue是双缓冲队列。BlockingQueue内部使用两条队列,允许两个线程同时向队列一个存储,一个取出操作。在保证并发安全的同时,提高了队列的存取效率。

  • ArrayBlockingQueue(int i):规定大小的BlockingQueue,其构造必须指定大小。其所含的对象是FIFO顺序排序的。
  • LinkedBlockingQueue()或者(int i):大小不固定的BlockingQueue,若其构造时指定大小,生成的BlockingQueue有大小限制,不指定大小,其大小有Integer.MAX_VALUE来决定。其所含的对象是FIFO顺序排序的。
  • PriorityBlockingQueue()或者(int i):类似于LinkedBlockingQueue,但是其所含对象的排序不是FIFO,而是依据对象的自然顺序或者构造函数的Comparator决定。
  • SynchronizedQueue():特殊的BlockingQueue,对其的操作必须是放和取交替完成。

threadFactory:线程工厂,要实现ThreadFactory接口,线程池创建线程时会调用ThreadFactory的newThread方法创建线程。

RejectedExecutionHandler:饱和策略。

线程池与 WorkQueue 加载过程

  1. 线程池刚创建时,里面没有一个线程。任务队列是作为参数传进来的。不过,就算队列里面有任务,线程池也不会马上执行它们。
  2. 当调用 execute() 方法添加一个任务时,线程池会做如下判断:

    • 如果正在运行的线程数量小于 corePoolSize,那么马上创建线程运行这个任务;
    • 如果正在运行的线程数量大于或等于 corePoolSize,那么将这个任务放入队列。
    • 如果这时候队列满了,而且正在运行的线程数量小于 maximumPoolSize,那么还是要创建(非核心)线程运行这个任务;
    • 如果队列满了,而且正在运行的线程数量大于或等于 maximumPoolSize,那么线程池会抛出异常,告诉调用者“我不能再接受任务了”。
  3. 当一个线程完成任务时,它会从队列中取下一个任务来执行。
  4. 当一个线程无事可做,超过一定的时间(keepAliveTime)时,线程池会判断,如果当前运行的线程数大于 corePoolSize,那么这个线程就被停掉。所以线程池的所有任务完成后,它最终会收缩到 corePoolSize 的大小。

这个过程说明,并不是先加入任务就一定会先执行。假设队列大小为 4,corePoolSize为2,maximumPoolSize为6,那么当加入15个任务时,执行的顺序类似这样:首先执行任务 1、2,然后任务3~6被放入队列。这时候队列满了,任务7、8、9、10 会被马上执行,而任务 11~15 则会抛出异常。最终顺序是:1、2、7、8、9、10、3、4、5、6。

当然这个过程是针对指定大小的ArrayBlockingQueue来说,如果是LinkedBlockingQueue,因为该队列无大小限制,所以不存在上述问题。

守护线程

Java中有两类线程:User Thread(用户线程)、Daemon Thread(守护线程) 。

  • 当所有非守护线程结束时,程序也就终止,同时会杀死所有守护线程。
  • 线程启动之前使用 setDaemon() 方法可以将一个线程设置为守护线程。
  • 在守护线程中产生的新线程也是守护线程。

线程切换

join 在线程A 中调用另一个线程B 的 join() 方法,会将当前线程A 挂起,而不是忙等待,直到目标线程B 结束。

wait & notify & notifyAll 调用 wait() 使得线程等待某个条件满足,线程在等待时会被挂起,当其他线程的运行使得这个条件满足时,其它线程会调用 notify() 或者 notifyAll() 来唤醒挂起的线程。

  • 只能用在同步方法或者同步控制块中使用。
  • notify()或者notifyAll()方法并不是真正释放锁,必须等到synchronized方法或者语法块执行完才真正释放锁(或者wait释放锁);
  • 调用notifyAll()方法能够唤醒所有正在等待这个对象的monitor的线程,唤醒的线程获得锁的概率是随机的,取决于cpu调度;
  • wait 和 sleep 区别
    • wait() 是 Object 的方法,而 sleep() 是 Thread 的静态方法;
    • wait() 会释放锁,sleep() 不会;
  • Thread.yield():使用yield()的目的是让相同优先级的线程之间能适当的轮转执行。但是,实际中无法保证yield()达到让步目的,因为让步的线程还有可能被线程调度程序再次选中。

await & signal & signalAll java.util.concurrent 类库中提供了 Condition 类来实现线程之间的协调,可以在 Condition 上调用 await() 方法使线程等待,其它线程调用 signal() 或 signalAll() 方法唤醒等待的线程。

  • 相比于 wait() 这种等待方式,await() 可以指定等待的条件,因此更加灵活。
  • 使用 Lock 来获取一个 Condition 对象。

线程间通信

  • 同步:多个线程通过synchronized关键字这种方式来实现线程间的通信。
    • 本质上就是“共享内存”式的通信。多个线程需要访问同一个共享变量,谁拿到了锁(获得了访问权限),谁就可以执行。
  • while轮询的方式
    • 注意volatile关键字的可见性
  • wait/notify机制
  • 管道通信
    • 使用java.io.PipedInputStream 和 java.io.PipedOutputStream进行通信

Java 锁种类: 悲观/乐观锁,公平/非公平锁,自旋锁/适应性自旋锁,可重入/非可重入锁,排他/共享锁,无锁/偏向锁/轻量级锁/重量级锁。

  • java.util.concurrent包中的原子类就是通过CAS来实现了乐观锁, synchronized 这种独占锁属于悲观锁
  • ReentrantReadWriteLock.ReadLock 是共享锁,WriteLock 是排他锁;
  • ReentrantLock默认使用非公平锁
    • ReentrantLock里面有一个内部类Sync,有公平锁FairSync和非公平锁NonfairSync两个子类。
    • 公平锁是指多个线程按照申请锁的顺序来获取锁,线程直接进入队列中排队,队列中的第一个线程才能获得锁。公平锁的优点是等待锁的线程不会饿死;
  • ReentrantLock和synchronized都是可重入锁
    • 可重入锁又名递归锁,是指在同一个线程在外层方法获取锁的时候,再进入该线程的内层方法会自动获取锁(前提锁对象得是同一个对象或者class),避免死锁。

ReentrantLock的实现原理

ReentrantLock 底层使用 AQS 实现。

AbstractQueuedSynchronizer简介

AQS 可用于构建阻塞锁或者其他相关同步器的基础框,是Java并发包的基础工具类。通过AQS这个框架可以对同步状态原子性管理、线程的阻塞和解除阻塞、队列的管理进行统一管理。

内部结构: 一个双向链表和一个单向链表.

  • 双链表为同步队列,队列中的每个节点对应一个Node内部类,AQS通过控制链表的节点而达到阻塞、同步的目的;
  • 单链表为条件队列,可以把同步队列和条件队列理解成储存等待状态的线程的队列;
  • 但是条件队列中的线程并不能直接去获取资源,而要先从条件队列转到同步队列中排队获取;
  • 同步队列的唤醒结果是线程去尝试获取锁,而条件队列的唤醒结果是把线程从条件队列移到同步队列中;
  • 一个线程要么是在同步队列中,要么是在条件队列中,不可能同时存在这两个队列里面。

Monitor

  • Monitor可以理解为一个同步工具或一种同步机制,通常被描述为一个对象。每一个Java对象就有一把看不见的锁,称为内部锁或者Monitor锁。
  • Monitor是线程私有的数据结构,每一个线程都有一个可用monitor record列表,同时还有一个全局的可用列表。每一个被锁住的对象都会和一个monitor关联,同时monitor中有一个Owner字段存放拥有该锁的线程的唯一标识,表示该锁被这个线程占用。
  • synchronized通过Monitor来实现线程同步,Monitor是依赖于底层的操作系统的Mutex Lock(互斥锁)来实现的线程同步。
  • 自旋锁里 “阻塞或唤醒Java线程需要操作系统切换CPU” , 这种基于Mutex Lock(互斥锁) 效率很低,成为“重量级锁”。Jdk 1.6 之后引入了 “偏向锁” 和 “轻量级锁”。

锁一共有4种状态,级别从低到高依次是:无锁、偏向锁、轻量级锁和重量级锁。锁状态只能升级不能降级。

无锁: 特点就是修改操作在循环内进行,线程会不断的尝试修改共享资源。比如 CAS。

偏向锁: 指一段同步代码一直被一个线程所访问,那么该线程会自动获取锁,降低获取锁的代价。

  • 在线程进入和退出同步块时不再通过CAS操作来加锁和解锁,而是检测Mark Word里是否存储着指向当前线程的偏向锁。
  • 引入偏向锁是为了在无多线程竞争的情况下尽量减少不必要的轻量级锁执行路径,因为轻量级锁的获取及释放依赖多次CAS原子指令,而偏向锁只需要在置换ThreadID的时候依赖一次CAS原子指令即可。
  • 偏向锁通过对比Mark Word解决加锁问题,避免执行CAS操作。
  • 偏向锁在JDK 6及以后的JVM里是默认启用的。可以通过JVM参数关闭偏向锁:-XX:-UseBiasedLocking=false,关闭之后程序默认会进入轻量级锁状态.

轻量级锁: 指当锁是偏向锁的时候,被另外的线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,从而提高性能。

  • 轻量级锁是通过用CAS操作和自旋来解决加锁问题,避免线程阻塞和唤醒而影响性能。

重量级锁: 等待锁的线程都会进入阻塞状态.

并发 CAS

Concurrent包中通过CAS 实现了乐观锁(通过无锁编程)。

  • AtomicInteger的自增函数incrementAndGet()的源码时,发现自增函数底层调用的是unsafe.getAndAddInt(),然后通过getIntVolatile() 获取v值。
  • CompareAndSwapInt(var1, var2, var5, var5 + var4)其实换成compareAndSwapInt(obj, offset, expect, update)比较清楚,意思就是如果obj内的value和expect相等,就证明没有其他线程改变过这个变量,那么就更新它为update,如果这一步的CAS没有成功,那就采用自旋的方式继续进行CAS操作,取出乍一看这也是两个步骤了啊,其实在JNI里是借助于一个CPU指令完成的。所以还是原子操作.
  • 这个自增操作的源码中的do-while循环就是一个自旋操作,如果修改数值失败则通过循环来执行自旋,直至修改成功。

CAS 原理剖析

并发编程之 CAS 的原理

cyclicbarrier和countdownlatch

java.util.concurrent 包下的两个线程同步组件CountDownLatch和CyclicBarrier。

CountDownLatch 允许一个或一组线程等待其他线程完成后再恢复运行。线程可通过调用await方法进入等待状态,在其他线程调用countDown方法将计数器减为0后,处于等待状态的线程即可恢复运行。

CyclicBarrier (可循环使用的屏障)则与此不同,CyclicBarrier 允许一组线程到达屏障后阻塞住,直到最后一个线程进入到达屏障,所有线程才恢复运行。

主要的区别在于唤醒等待线程的时机。CountDownLatch 是在计数器减为0后,唤醒等待线程。CyclicBarrier 是在计数器(等待线程数)增长到指定数量后,再唤醒等待线程。

volatile 与 synchronized

执行控制的目的是控制代码执行(顺序)及是否可以并发执行。

内存可见控制的是线程执行结果在内存中对其它线程的可见性。根据Java内存模型的实现,线程在具体执行时,会先拷贝主存数据到线程本地(CPU缓存),操作完成后再把结果从线程本地刷到主存。

区别:

  • volatile本质是在告诉jvm当前变量在寄存器(工作内存)中的值是不确定的,需要从主存中读取; synchronized则是锁定当前变量,只有当前线程可以访问该变量,其他线程被阻塞住。
  • volatile仅能使用在变量级别;synchronized则可以使用在变量、方法、和类级别的
  • volatile仅能实现变量的修改可见性,不能保证原子性;而synchronized则可以保证变量的修改可见性和原子性
  • volatile不会造成线程的阻塞;synchronized可能会造成线程的阻塞。
  • volatile标记的变量不会被编译器优化;synchronized标记的变量可以被编译器优化。

volatile关键字解析

Blocking Queue

java.util.concurrent 包中的Java BlockingQueue 接口表示一个线程安全的队列。

操作方法:

  Throws Exception 特殊值 阻塞 超时
Insert add(o) offer(o) put(o) offer(o, timeout, timeunit)
Remove remove(o) poll() take() poll(timeout, timeunit)
Examine element() peek()    
  1. Throws Exception: 如果尝试的操作不可能立即发生,则抛出一个异常。
  2. 特殊值:如果尝试的操作不能立即执行,则会返回一个特殊值(通常为true / false)。
  3. 阻塞:如果尝试的操作不可能立即执行,那么该方法将阻塞。
  4. 超时:如果尝试的操作不可能立即执行,则该方法调用将阻塞,但不会超过给定的超时。返回一个特殊值,告诉操作是否成功(通常为true / false)。

无法将null插入到BlockingQueue中。

BlockingQueue 接口的实现类 建议阅读JDK 源码,lock 用的 ReentrantLock.

  • ArrayBlockingQueue:是一个有界的阻塞队列,其内部实现是将对象放到一个数组里。
  • DelayQueue:对元素进行持有直到一个特定的延迟到期。
  • LinkedBlockingQueue:内部以一个链式结构(链接节点)对其元素进行存储。
  • PriorityBlockingQueue:类似于LinkedBlockingQueue,但其所含对象的排序不是FIFO,而是依据对象的自然排序顺序或者是构造函数所带的Comparator决定的顺序。
  • SynchronousQueue:同步队列。同步队列没有任何容量,每个插入必须等待另一个线程移除。

Double Check locking

Double-checked Locking (DCL)用来在lazy initialisation 的单例模式中避免同步开销的一个方法。

//多线程中是不安全的,判断instance是否为空以及新建一个实例都不是原子操作
public static Instance getInstance() {
    if(instance == null) {
        instance = new Instance();
    }
    return instance;
}

//解决:
//1. 用synchronize 给临界区加锁做同步处理(有比较大的性能损耗的)
public synchronized static Instance getInstance() {}


//2. 双重检查锁定(double-checked locking):
//可以减少加锁和对象初始化的过程,大大减少了synchronized带来的性能开销。
//但因为JVM的“无序写入”,实际中有问题,不能保证会在单/多处理器上顺利运行
private static Instance instance;
public static Instance getInstance() {
    if (instance == null) {
        synchronized (DoubleCheckLock.class) {
            if (instance == null)
                instance = new Instance();
        }
    }
    return instance;
}

//3. 基于volatile的双重检查锁定的解决方案:
private volatile static Instance instance;
public static Instance getInstance() {
    if (instance == null) {
        synchronized (DoubleCheckLock.class) {
            if (instance == null)
                instance = new Instance();
        }
    }
    return instance;
}

//4. 基于类初始化的解决方案
//JVM在类的初始化阶段(即在Class被加载后,且被线程使用之前),会执行类的初始化。
//在执行类的初始化期间,JVM会去获取一个锁,这个锁可以同步多个线程对同一个类的初始化。
public class InstanceFactory {
    private static class InstanceHolder {
        public static Instance instance = new Instance();
    }

    public static Instance getInstance() {
        return InstanceHolder.instance ;  //这里将导致InstanceHolder类被初始化
    }
}

Error与异常

Throwable: 有两个重要的子类:Exception(异常)和 Error(错误),二者都是 Java 异常处理的重要子类,各自都包含大量子类。异常和错误的区别是:异常能被程序本身可以处理,错误是无法处理。

Error(错误):是程序无法处理的错误,表示运行应用程序中较严重问题。大多数错误与代码编写者执行的操作无关,而表示代码运行时 JVM(Java 虚拟机)出现的问题。比如:OutOfMemoryError, StackOverFlowError.

Exception(异常):是程序本身可以处理的异常。包括运行时异常和非运行时异常(编译异常)。

反射

通过一个对象获得完整的包名和类名

1
2
3
4
testReflect.getClass().getName()
Class<?> clazz = Class.forName("net.xsoftlab.baike.TestReflect");
Field[] field = clazz.getDeclaredFields();
Method method[] = clazz.getMethods();