# 18. Stream API对ArrayList和LinkedList的遍历性能有何影响？

# 标准答案

在 Stream API 中，ArrayList 和 LinkedList 的遍历性能差异主要来源于底层数据结构：

ArrayList 采用连续内存数组存储，支持 随机访问（O(1)），Stream 遍历时可以使用 高效的索引迭代，性能优异。
LinkedList 采用双向链表，访问元素时需要 顺序遍历（O(n)），Stream 遍历时会触发 Iterator 逐个节点访问，导致性能下降。

在 并行流（parallelStream()） 场景下：

ArrayList 适合并行流，因为数据可以分段处理，使用 ForkJoinPool 进行并行计算。
LinkedList 不适合并行流，因其无法高效切分，分区成本高，性能较差。

# 答案解析

# 1. 为什么 ArrayList 在 Stream API 中遍历更快？

ArrayList 采用 数组（Object[] elementData） 存储元素，遍历时支持基于索引的连续访问：

List<Integer> list = new ArrayList<>();
for (int i = 0; i < 1000000; i++) {
    list.add(i);
}
long start = System.nanoTime();
list.stream().forEach(x -> {});
System.out.println("ArrayList Stream 遍历时间：" + (System.nanoTime() - start) + "ns");

1
2
3
4
5
6
7

核心优化点：

基于索引访问（array[i]）比 Iterator 遍历更快。
CPU 预取优化：数组在内存中是连续存储，CPU 可以预取数据，减少缓存 miss。
并行流优化：ArrayList 通过 Spliterator.SIZED 直接等分数据，分片计算更高效。

# 2. 为什么 LinkedList 在 Stream API 中遍历更慢？

LinkedList 采用 双向链表存储，无索引，需遍历指针找到每个元素：

List<Integer> list = new LinkedList<>();
for (int i = 0; i < 1000000; i++) {
    list.add(i);
}
long start = System.nanoTime();
list.stream().forEach(x -> {});
System.out.println("LinkedList Stream 遍历时间：" + (System.nanoTime() - start) + "ns");

1
2
3
4
5
6
7

性能瓶颈：

无法随机访问：每次 get(i) 都是 O(n) 复杂度，访问耗时大。
遍历方式劣化：Stream API 需要 Iterator 逐个节点遍历，CPU 预取失效，性能较低。
并行流不适合：LinkedList 无法高效分割，分片代价大，反而可能降低性能。

# 3. Stream API 在 ArrayList 和 LinkedList 的性能对比

List 实现	顺序流 (`stream()`)	并行流 (`parallelStream()`)
ArrayList	O(n)，快，支持索引	O(n/log p)，最优
LinkedList	O(n)，慢，逐个节点遍历	O(n)，不推荐

示例：并行流对比

List<Integer> arrayList = new ArrayList<>(Collections.nCopies(1_000_000, 1));
List<Integer> linkedList = new LinkedList<>(Collections.nCopies(1_000_000, 1));

long start1 = System.nanoTime();
arrayList.parallelStream().forEach(x -> {});
System.out.println("ArrayList 并行流：" + (System.nanoTime() - start1) + "ns");

long start2 = System.nanoTime();
linkedList.parallelStream().forEach(x -> {});
System.out.println("LinkedList 并行流：" + (System.nanoTime() - start2) + "ns");

1
2
3
4
5
6
7
8
9
10

实验结果：

ArrayList.parallelStream() 比 LinkedList.parallelStream() 快 10~50 倍，因为 LinkedList 不能高效切分，并行计算反而拖慢速度。

# 4. Stream API 如何优化遍历性能？

优先使用 ArrayList，避免 LinkedList：
- 适合流式操作的数据结构应支持 随机访问，否则遍历性能会很差。
并行流适用于 ArrayList，避免 LinkedList.parallelStream()
- ArrayList.parallelStream() 通过 ForkJoinPool 高效分片，加速计算。
- LinkedList.parallelStream() 无法分片，执行效率甚至比单线程更低。

避免 stream().forEach()，使用普通 for 循环

在简单遍历场景下，传统 for 比 Stream API 更快：

for (Integer x : arrayList) { process(x); } // 快
arrayList.stream().forEach(x -> process(x)); // 慢

1
2

对于大数据量，考虑 Spliterator 手动优化
```
Spliterator<Integer> spliterator = arrayList.spliterator();
spliterator.forEachRemaining(System.out::println);
```
1
2
- Spliterator.SIZED + Spliterator.SUBSIZED 支持更快的分片计算。

# 深入追问

为什么 LinkedList 的 parallelStream() 比 stream() 还慢？
Stream API 遍历 TreeMap 和 HashMap 时有什么不同？
为什么 forEach() 在 LinkedList 上比 Iterator 更快？

# 相关面试题

Stream API 在 Java 中是如何优化遍历性能的？
parallelStream() 在什么情况下会降低性能？
LinkedList 在 Stream 处理中为什么不适合并行操作？

← 17. 如何优化ArrayList在高并发场景下的安全性？ 19. 如何使用subList方法高效拆分List？有哪些注意事项？ →