Java IO：同步、非堵塞式IO（NIO）-白红宇

转载请注明出处：

引言

JDK1.4中引入了NIO，即New IO，目的在于提高IO速度。特别注意JavaNIO不全然是非堵塞式IO(No-Blocking IO)，由于当中部分通道(如FileChannel)仅仅能运行在堵塞模式下，而其它的通道能够在堵塞式和非堵塞式之间进行选择。

虽然这样。我们还是习惯将Java NIO看作是非堵塞式IO，而前面介绍的面向流(字节/字符)的IO类库则是堵塞的，它们在数据从介质->OS内核这个阶段须要应用程序堵塞等待完毕，具体来看，面向流的IO和非堵塞式IO的差别例如以下：

IO	NIO
面向流(Stream oriented)	面向缓冲区(Buffer oriented)
堵塞式(Blocking IO)	非堵塞式(Non blocking IO)
无	选择器(Selectors)

可是千万记住，两者没有孰优孰劣。NIO是java io的拓展，依据不同的场景。两者各实用处。

面向流与面向缓冲

Java NIO和IO之间第一个最大的差别是，IO是面向流的，NIO是面向缓冲区的。 JavaIO面向流意味着每次从流中读一个或多个字节，直至读取全部字节，它们没有被缓存在不论什么地方。此外，它不能前后移动流中的数据。假设须要前后移动从流中读取的数据，须要先将它缓存到一个缓冲区。

Java NIO的缓冲导向方法略有不同。

数据读取到一个它稍后处理的缓冲区，须要时可在缓冲区中前后移动。这就添加了处理过程中的灵活性。可是，还须要检查是否该缓冲区中包括全部您须要处理的数据。并且。需确保当很多其它的数据读入缓冲区时，不要覆盖缓冲区里尚未处理的数据。

堵塞与非堵塞IO

Java IO的各种流是堵塞的。这意味着，当一个线程调用read() 或 write()时，该线程被堵塞，直到有一些数据被读取。或数据全然写入。该线程在此期间不能再干不论什么事情了。

Java NIO的非堵塞模式。使一个线程从某通道发送请求读取数据，可是它仅能得到眼下可用的数据，假设眼下没有数据可用时，就什么都不会获取。而不是保持线程堵塞。所以直至数据变的能够读取之前。该线程能够继续做其它的事情。非堵塞写也是如此。

一个线程请求写入一些数据到某通道，但不须要等待它全然写入，这个线程同一时候能够去做别的事情。线程通常将非堵塞IO的空暇时间用于在其它通道上运行IO操作，所以一个单独的线程如今能够管理多个输入和输出通道（channel）。

介质 <----> OS内核空间 <----> 应用程序空间无论是非堵塞式读还是写，介质到OS内核这一段都不会堵塞调用程序，只是由于是同步(非异步)读取和写入，所以OS到应用程序这段还是须要同步堵塞的。

选择器（Selectors）

Java NIO的选择器同意一个单独的线程来监视多个输入通道。你能够注冊多个通道使用一个选择器。然后使用一个单独的线程来“选择”通道：这些通道里已经有能够处理的输入，或者选择已准备写入的通道。

这样的选择机制，使得一个单独的线程非常easy来管理多个通道。

Java NIO最关键的三个概念各自是通道。缓冲区和选择器：

一、通道（Channel）

Java NIO的通道相似流。但又有些不同：

n 通道是双向的，可读也可写，而流的读写是单向的。

n 通道能够异步地读写。

n 无论读写，通道仅仅能和Buffer交互。

JavaNIO中最重要的几个Channel的实现：

u FileChannel：从文件里读写数据（仅仅有堵塞模式）。

u DatagramChannel：通过UDP读写网络中的数据（堵塞和非堵塞可选）。

u SocketChannel：通过TCP读写网络中的数据（堵塞和非堵塞可选）。

u ServerSocketChannel：能够监听新进来的TCP连接，像Webserver那样。对每个新进来的连接都会创建一个SocketChannel。

以下是一个通过FileChannel来向文件里写入数据的样例：

public class Test {   public static void main(String[] args) throws IOException  {       File file = new File("test.txt");       FileOutputStream os = new FileOutputStream(file);       FileChannel channel = os.getChannel();       ByteBuffer buffer = ByteBuffer.allocate(1024);       String str = "hello,jiyiqin";       buffer.put(str.getBytes());       buffer.flip();       channel.write(buffer);       channel.close();       os.close();   } }

备注：上面演示样例有两个关键的地方：

（1）一个是通过FileOutputStream文件输出流获取通道。旧的IO类库(或者说面向流的IO类库)中FileInputStream/FileOutputStream和RandomAccessFile三个类被改动以能够产生FileChannel通道。可是面向字符的流Reader/Writer不能产生通道。

（2）另外在将缓冲区数据写入通道之前必须要调用缓冲区的flip方法转换为读模式，让通道可从缓冲区读取数据。

二、缓冲区（Buffer）

Java NIO中的Buffer用于和NIO通道进行交互。数据是从通道读入缓冲区或从缓冲区写入到通道中。

当向buffer写入数据时，buffer会记录下写了多少数据。

一旦要读取数据。须要通过flip()方法将Buffer从写模式切换到读模式。

在读模式下，能够读取之前写入到buffer的全部数据。一旦读完了全部的数据，就须要清空缓冲区，让它能够再次被写入。有两种方式能清空缓冲区：调用clear()或compact()方法。clear()方法会清空整个缓冲区。

compact()方法仅仅会清除已经读过的数据。不论什么未读的数据都被移到缓冲区的起始处，新写入的数据将放到缓冲区未读数据的后面。

缓冲区本质上是一块能够写入数据。然后能够从中读取数据的内存。这块内存被包装成NIO Buffer对象，并提供了一组方法，用来方便的訪问该块内存。

以下是一个从文件通道FileChannel读取数据的样例：

RandomAccessFile aFile = newRandomAccessFile("data/nio-data.txt", "rw"); FileChannel inChannel =aFile.getChannel(); ByteBuffer buf = ByteBuffer.allocate(48); int bytesRead = inChannel.read(buf);while (bytesRead != -1) {  buf.flip();  //使缓冲区可读 while(buf.hasRemaining()){     System.out.print((char)buf.get()); //一次读取一字节  } buf.clear();  bytesRead= inChannel.read(buf);}aFile.close();

三、选择器（Selector）

Selector同意单线程处理多个Channel。

假设你的应用打开了多个连接（通道）。但每个连接的流量都非常低，使用Selector就会非常方便。比如。在一个聊天server中。

仅用单个线程来处理多个Channels的优点是，仅仅须要更少的线程来处理通道。其实，能够仅仅用一个线程处理全部的通道。对于操作系统来说，线程之间上下文切换的开销非常大，并且每个线程都要占用系统的一些资源（如内存）。

因此，使用的线程越少越好。

可是。须要记住，现代的操作系统和CPU在多任务方面表现的越来越好，所以多线程的开销随着时间的推移，变得越来越小了。

实际上。假设一个CPU有多个内核。不使用多任务可能是在浪费CPU能力。无论怎么说，关于那种设计的讨论应该放在还有一篇不同的文章中。在这里。仅仅要知道使用Selector能够处理多个通道就足够了。

下图用一张转载的图展示在一个单线程中使用一个Selector处理3个Channel：

步骤1：Selector的创建

通过调用Selector.open()方法创建一个Selector，例如以下：

Selectorselector = Selector.open();

步骤2：向Selector注冊通道

为了将Channel和Selector配合使用，实现单个线程处理多个通道的梦想，必须将channel注冊到selector上。

能够通过SelectableChannel.register()方法来实现，例如以下：

channel.configureBlocking(false); SelectionKey key= channel.register(selector, Selectionkey.OP_READ);

当中第一句代码设置通道为非堵塞模式。然后第二句向selector注冊该通道。register()方法的第二个參数。这是一个“interest集合”，意思是在通过Selector监听Channel时对什么事件感兴趣。能够监听四种不同类型的事件：

SelectionKey.OP_CONNECT

SelectionKey.OP_ACCEPT

SelectionKey.OP_READ

SelectionKey.OP_WRITE

特别注意：与Selector一起使用时，Channel必须处于非堵塞模式下。

这意味着不能将FileChannel与Selector一起使用，由于FileChannel不能切换到非堵塞模式(由于其本身特性。要注意这里指的文件和Linux中的文件不同，Linux中的文件能够是代表磁盘文件、打印机设备、网卡等，而这里说的文件就仅仅是磁盘文件)。

而套接字通道都能够。

步骤3：堵塞监视通道

一旦向Selector注冊了一或多个通道，就能够调用几个重载的select()方法。这些方法返回你所感兴趣的事件（如连接、接受、读或写）已经准备就绪的那些通道。换句话说。假设你对“读就绪”的通道感兴趣，select()方法会返回读事件已经就绪的那些通道。

以下是select()方法：

int select()int select(long timeout)int selectNow()

select()堵塞到至少有一个通道在你注冊的事件上就绪了。

select(long timeout)和select()一样，除了最长会堵塞timeout毫秒(參数)。

selectNow()不会堵塞。无论什么通道就绪都立马返回（译者注：此方法运行非堵塞的选择操作。

假设自从前一次选择操作后，没有通道变成可选择的，则此方法直接返回零。）。

步骤4：遍历selectedKeys()訪问就绪通道

一旦调用了select()方法。并且返回值表明有一个或很多其它个通道就绪了，然后能够通过调用selector的selectedKeys()方法，訪问“已选择键集（selected key set）”中的就绪通道。例如以下所看到的：

Set selectedKeys =selector.selectedKeys();

能够遍历这个已选择的键集合来訪问就绪的通道。

以下给出一个完整的Channel和Selector结合的样例：

Selector selector = Selector.open(); channel.configureBlocking(false);  //配置Channel为非堵塞SelectionKey key =channel.register(selector, SelectionKey.OP_READ);   //用selector注冊该通道上的读事件while(true) {   intreadyChannels = selector.select(); //開始监听通道 if(readyChannels == 0) continue;   SetselectedKeys = selector.selectedKeys();  Iterator keyIterator = selectedKeys.iterator();  while(keyIterator.hasNext()) { //轮训通道事件类型，进行相应处理   SelectionKey key = keyIterator.next();    if(key.isAcceptable()) {        // a connection was accepted by a ServerSocketChannel.     }else if (key.isConnectable()) {        // a connection was established with a remote server.     }else if (key.isReadable()) {        // a channel is ready for reading     }else if (key.isWritable()) {        // a channel is ready for writing    }  } }

NIO = 选择器 + 非堵塞模式的套接字通道

套接字通道包括：SocketChannel、ServerSocketChannel和DatagramChannel。

SocketChannel是一个连接到TCP网络套接字的通道。能够通过2种方式创建：

1) 打开一个SocketChannel并连接到互联网上的某台server。

2) 一个新连接到达ServerSocketChannel时创建一个SocketChannel。

ServerSocketChannel通过ServerSocketChannel.accept() 方法监听新进来的连接。当 accept()方法返回的时候，它返回一个包括新进来的连接的 SocketChannel。因此。accept()方法会一直堵塞到有新连接到达。DatagramChannel是一个能收发UDP包的通道。由于UDP是无连接的网络协议。所以不能像其它通道那样读取和写入。它发送和接收的是数据包。

将套接字通道和Selector结合，由于选择器的多路复用特性(事件驱动)和套接字通道的非堵塞特性。可有效地解决高并发环境下对于client请求处理会耗费大量线程资源的情况。

（1）传统的同步堵塞式IO(网络套接字编程Socket)：针对client的每个请求的连接，都须要分配一个单独的线程进行处理。由于要随时监视其是否有数据读写，并且在数据读写操作时，由于是堵塞式的。所以即使没有数据到来，也会一直堵塞等待。这显然会浪费大量CPU和线程资源。

（2）而多路复用的选择器和非堵塞式的套接字通道的结合：不但能够用一个线程来监视多个与client建立的网络连接，还能够在读写数据时。一旦数据没有准备好。就立马返回而不会堵塞(虽然实际上一旦运行读写是一般数据都已经准备好)。所以在并发较高的场景下，这样的方式大大节约了CPU和线程(内存)资源。

具体能够參考我文章。

本文转自mfrbuaa博客园博客，原文链接：http://www.cnblogs.com/mfrbuaa/p/5415482.html，如需转载请自行联系原作者