什么是 Stream?
Stream(流)是一个来自数据源的元素队列并支持聚合操作
- 元素是特定类型的对象,形成一个队列。 Java中的Stream并不会存储元素,而是按需计算。
- 数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator 等。
- 聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find, match, sorted等。
和以前的Collection操作不同, Stream操作还有两个基础的特征:
- Pipelining: 中间操作都会返回流对象本身。 这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。 这样做可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)。
- 内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式, 通过访问者模式(Visitor)实现。
filter():对元素进行过滤
map():将流的元素映射成另一个类型
distinct():去除流中重复的元素
sorted():对元素进行排序
forEach :对流中的每个元素执行某个操作
peek():与forEach()方法效果类似,不同的是,该方法会返回一个新的流,而forEach()无返回
limit():截取流中前面几个元素
skip():跳过流中前面几个元素
toArray():将流转换为数组
reduce():对流中的元素归约操作,将每个元素合起来形成一个新的值
collect():对流的汇总操作,比如输出成List集合
anyMatch():匹配流中的元素,类似的操作还有allMatch()和noneMatch()方法
findFirst():查找第一个元素,类似的还有findAny()方法
max():求最大值
min():求最小值
count():求总数
流的操作类型
流的操作类型主要分为两种
- 中间操作 一个流可以后面跟随零个或多个中间操作。其目的主要是打开流,做出某种程度的数据映射/过滤,然后返回一个新的流,交给下一个操作使用。这类操作都是惰性化的,仅仅调用到这类方法,并没有真正开始流的遍历,真正的遍历需等到终端操作时,常见的中间操作有下面即将介绍的
filter
、map
等 - 终端操作 一个流有且只能有一个终端操作,当这个操作执行后,流就被关闭了,无法再被操作,因此一个流只能被遍历一次,若想在遍历需要通过源数据在生成流。终端操作的执行,才会真正开始流的遍历。如下面即将介绍的
count
、collect
等
在 Java 8 中, 集合接口有两个方法来生成流:
- stream() − 为集合创建串行流。
- parallelStream() − 为集合创建并行流。
串行(stream)程序
并行(parallel)程序
parallelStream 是流并行处理程序的代替方法。以下实例我们使用 parallelStream 来输出空字符串的数量:
####
中间操作
forEach
Stream 提供了新的方法 ‘forEach’ 来迭代流中的每个数据。以下代码片段使用 forEach 输出了10个随机数:
Collectors
Collectors 类实现了很多归约操作,例如将流转换成集合和聚合元素。Collectors 可用于返回列表或字符串:
map
所谓流映射就是将接受的元素映射成另外一个元素
map 方法用于映射每个元素到对应的结果,以下代码片段使用 map 输出了元素对应的平方数:
filter筛选
filter 方法用于通过设置的条件过滤出元素。以下代码片段使用 filter 方法过滤出空字符串:
通过使用filter
方法进行条件筛选,filter
的方法参数为一个条件:
通过map
方法可以完成映射,该例子完成中String -> Integer
的映射,之前上面的例子通过map
方法完成了Dish->String
的映射
flatMap流转换
将一个流中的每个值都转换为另一个流
distinct去除重复元素
通过distinct
方法快速去除重复的元素
limit返回指定流个数
过limit
方法指定返回流的个数,limit
的参数值必须>=0
,否则将会抛出异常
limit 方法用于获取指定数量的流。 以下代码片段使用 limit 方法打印出 10 条数据:
skip跳过流中的元素
通过skip
方法跳过流中的元素,上述例子跳过前两个元素,所以打印结果为2,3,4,5
,skip
的参数值必须>=0
,否则将会抛出异常
sorted
sorted 方法用于对流进行排序。以下代码片段使用 sorted 方法对输出的 10 个随机数进行排序:
元素匹配
提供了三种匹配方式
- allMatch匹配所有
通过allMatch
方法实现
- anyMatch匹配其中一个
等价于
存在大于3的值则打印,java8
中通过anyMatch
方法实现这个功能
- noneMatch全部不匹配
通过noneMatch
方法实现
终端操作
统计流中元素个数
- 通过count
通过使用count
方法统计出流中元素个数
等价于通过counting
查找
提供了两种查找方式
- findFirst查找第一个
通过findFirst
方法查找到第一个大于三的元素并打印
- findAny随机查找一个
通过findAny
方法查找到其中一个大于三的元素并打印,因为内部进行优化的原因,当找到第一个满足大于三的元素时就结束,该方法结果和findFirst
方法结果一样。提供findAny
方法是为了更好的利用并行流,findFirst
方法在并行上限制更多
reduce将流中的元素组合起来
假设我们对一个集合中的值进行求和
- jdk8之前
- jdk8之后通过reduce进行处理
一行就可以完成,还可以使用方法引用简写成:
reduce
接受两个参数,一个初始值这里是0
,一个BinaryOperator<T> accumulator
来将两个元素结合起来产生一个新值, 另外reduce
方法还有一个没有初始化值的重载方法
获取流中最小最大值
- 通过min/max获取最小最大值
同理max是: