Java 8 Stream – 记忆角落

本文最后更新于 1358 天前，其中的信息可能已经有所发展或是发生改变。

什么是 Stream？

Stream（流）是一个来自数据源的元素队列并支持聚合操作

元素是特定类型的对象，形成一个队列。 Java中的Stream并不会存储元素，而是按需计算。
数据源 流的来源。可以是集合，数组，I/O channel，产生器generator 等。
聚合操作 类似SQL语句一样的操作，比如filter, map, reduce, find, match, sorted等。

和以前的Collection操作不同， Stream操作还有两个基础的特征：

Pipelining: 中间操作都会返回流对象本身。这样多个操作可以串联成一个管道，如同流式风格（fluent style）。这样做可以对操作进行优化，比如延迟执行(laziness)和短路( short-circuiting)。
内部迭代：以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代，这叫做外部迭代。 Stream提供了内部迭代的方式，通过访问者模式(Visitor)实现。

filter()：对元素进行过滤
map()：将流的元素映射成另一个类型
distinct()：去除流中重复的元素
sorted()：对元素进行排序
forEach ：对流中的每个元素执行某个操作
peek()：与forEach()方法效果类似，不同的是，该方法会返回一个新的流，而forEach()无返回
limit()：截取流中前面几个元素
skip()：跳过流中前面几个元素
toArray()：将流转换为数组
reduce()：对流中的元素归约操作，将每个元素合起来形成一个新的值
collect()：对流的汇总操作，比如输出成List集合
anyMatch()：匹配流中的元素，类似的操作还有allMatch()和noneMatch()方法
findFirst()：查找第一个元素，类似的还有findAny()方法
max()：求最大值
min()：求最小值
count()：求总数

流的操作类型

流的操作类型主要分为两种

中间操作一个流可以后面跟随零个或多个中间操作。其目的主要是打开流，做出某种程度的数据映射/过滤，然后返回一个新的流，交给下一个操作使用。这类操作都是惰性化的，仅仅调用到这类方法，并没有真正开始流的遍历，真正的遍历需等到终端操作时，常见的中间操作有下面即将介绍的filter、map等
终端操作一个流有且只能有一个终端操作，当这个操作执行后，流就被关闭了，无法再被操作，因此一个流只能被遍历一次，若想在遍历需要通过源数据在生成流。终端操作的执行，才会真正开始流的遍历。如下面即将介绍的count、collect等

在 Java 8 中, 集合接口有两个方法来生成流：

stream() − 为集合创建串行流。
parallelStream() − 为集合创建并行流。

串行（stream）程序

List<String> lists = Arrays.asList("1", "2", "3", "");
lists.stream()
	.filter(list -> !list.isEmpty())
	.collect(Collectors.toList())
	.forEach(s -> System.out.println("s:"+s));

并行（parallel）程序

parallelStream 是流并行处理程序的代替方法。以下实例我们使用 parallelStream 来输出空字符串的数量：

List<String> strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
// 获取空字符串的数量
long count = strings.parallelStream().filter(s -> s.isEmpty()).count();
System.out.println("count:"+count);

####

中间操作

forEach

Stream 提供了新的方法 ‘forEach’ 来迭代流中的每个数据。以下代码片段使用 forEach 输出了10个随机数：

Random random = new Random();
// random.ints().limit(10).forEach(num -> System.out.println("num:"+num));
random.ints().limit(10).forEach(System.out::println);

Collectors

Collectors 类实现了很多归约操作，例如将流转换成集合和聚合元素。Collectors 可用于返回列表或字符串：

List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
List<String> filtered = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.toList());

System.out.println("筛选列表: " + filtered);
String mergedString = strings.stream().filter(string -> !string.isEmpty()).collect(Collectors.joining(", "));
System.out.println("合并字符串: " + mergedString);

map

所谓流映射就是将接受的元素映射成另外一个元素

map 方法用于映射每个元素到对应的结果，以下代码片段使用 map 输出了元素对应的平方数：

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
numbers.stream()
	.map(i -> i*i)
	.distinct()
	.collect(Collectors.toList())
	.forEach(System.out::println);

filter筛选

filter 方法用于通过设置的条件过滤出元素。以下代码片段使用 filter 方法过滤出空字符串：

List<String> strings = Arrays.asList("1", "", "2", "aa");
long count = strings.stream().filter(s -> s.isEmpty()).count();

通过使用filter方法进行条件筛选，filter的方法参数为一个条件:

List<Integer> integers = Arrays.asList(1, 1, 2, 3, 4, 5);
integers.stream()
    .filter(i -> i>3)
    .collect(Collectors.toList())
    .forEach(System.out::println);

List<String> stringList = Arrays.asList("Java 8", "Lambdas",  "In", "Action");
stringList.stream()
        .map(String::length)
        .collect(Collectors.toList())
        .forEach(System.out::println);

通过map方法可以完成映射，该例子完成中String -> Integer的映射，之前上面的例子通过map方法完成了Dish->String的映射

flatMap流转换

将一个流中的每个值都转换为另一个流

List<String> wordList = Arrays.asList("Hello", "World");
wordList.stream()
    .map(w -> w.split(" "))
    .flatMap(Arrays::stream)
    .distinct()
    .collect(Collectors.toList()).forEach(System.out::println);

distinct去除重复元素

通过distinct方法快速去除重复的元素

List<Integer> integers = Arrays.asList(1, 1, 2, 3, 4, 5);
integers.stream()
    .distinct()
    .collect(Collectors.toList())
    .forEach(System.out::println);

limit返回指定流个数

过limit方法指定返回流的个数，limit的参数值必须>=0，否则将会抛出异常

limit 方法用于获取指定数量的流。以下代码片段使用 limit 方法打印出 10 条数据：

Random random = new Random();
// random.ints().limit(10).forEach(num -> System.out.println("num:"+num));
random.ints().limit(10).forEach(System.out::println);

List<Integer> integers = Arrays.asList(1, 1, 2, 3, 4, 5);
integers.stream()
    .limit(3)
    .collect(Collectors.toList())
    .forEach(System.out::println);

skip跳过流中的元素

List<Integer> integers = Arrays.asList(1, 1, 2, 3, 4, 5);
integers.stream()
    .skip(2)
    .collect(Collectors.toList())
    .forEach(System.out::println);

通过skip方法跳过流中的元素，上述例子跳过前两个元素，所以打印结果为2,3,4,5，skip的参数值必须>=0，否则将会抛出异常

sorted

sorted 方法用于对流进行排序。以下代码片段使用 sorted 方法对输出的 10 个随机数进行排序：

Random random = new Random();
random.ints().limit(10).sorted().forEach(System.out::println);

元素匹配

提供了三种匹配方式

allMatch匹配所有

通过allMatch方法实现

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().allMatch(i -> i > 3)) {
    System.out.println("值都大于3");
}

anyMatch匹配其中一个

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().anyMatch(i -> i > 3)) {
    System.out.println("存在大于3的值");
}

等价于

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
for (Integer integer : integerList) {
    if (integer>3){
        System.out.println("存在大于3的值");
        break;
    }
}

存在大于3的值则打印，java8中通过anyMatch方法实现这个功能

noneMatch全部不匹配

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
if (integerList.stream().noneMatch(i -> i>6)) {
    System.out.println("值都小于6");
}

通过noneMatch方法实现

终端操作

统计流中元素个数

通过count

通过使用count方法统计出流中元素个数

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
long count = integerList.stream().count();
System.out.println("count:"+count);

等价于通过counting

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Long counting = integerList.stream().collect(Collectors.counting());
System.out.println("counting:"+counting);

查找

提供了两种查找方式

findFirst查找第一个

通过findFirst方法查找到第一个大于三的元素并打印

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> first = integerList.stream().filter(i -> i > 3).findFirst();
System.out.println("first:"+first.get());

findAny随机查找一个

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
Optional<Integer> any = integerList.stream().filter(i -> i > 3).findAny();
System.out.println("any:"+any.get());

通过findAny方法查找到其中一个大于三的元素并打印，因为内部进行优化的原因，当找到第一个满足大于三的元素时就结束，该方法结果和findFirst方法结果一样。提供findAny方法是为了更好的利用并行流，findFirst方法在并行上限制更多

reduce将流中的元素组合起来

假设我们对一个集合中的值进行求和

jdk8之前

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
int sum = 0;
for (Integer integer : integerList) {
    sum += integer;
}
System.out.println("sum:"+sum);

jdk8之后通过reduce进行处理

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5);
int sum = integerList.stream().reduce(0,(a,b) -> a+b);
System.out.println("sum:"+sum);

一行就可以完成，还可以使用方法引用简写成:

int sum = integerList.stream().reduce(0, Integer::sum);

reduce接受两个参数，一个初始值这里是0，一个BinaryOperator<T> accumulator 来将两个元素结合起来产生一个新值，另外reduce方法还有一个没有初始化值的重载方法

获取流中最小最大值

通过min/max获取最小最大值

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5,-1,-100);
integerList.stream().min((e1,e2) -> e1.compareTo(e2)).ifPresent(i -> System.out.println("i:"+i));

同理max是：

List<Integer> integerList = Arrays.asList(1, 2, 3, 4, 5,-1,-100);
integerList.stream().max((e1,e2) -> e1.compareTo(e2)).ifPresent(i -> System.out.println("i:"+i));