迭代器和生成器 | 迭代器(含手写迭代器)
理解迭代
迭代:按照顺序返回多次执行一段程序,通常会有明确的终止条件
迭代会在一个有序集合上进行,“有序”是指集合中所有的项都可以按照既定的顺序被遍历到,特别是开始项和结束项有明确的定义
循环迭代的弊端:
- 迭代之前需要事先知道如何使用数据结构:数组中的每一项都只能先通过引用取得数组对象,然后再通过[]操作符取得特定索引位置上的项。这种情况并不适用于所有数据结构
- **遍历顺序并不是数据结构固有的:**通过递增索引来访问数据是特定于数组类型的方式,并不适用于其他具有隐式顺序的数据结构
ES5新增了Array.prototyoe.forEach
方法,但是仍然有弊端:这个方法解决了单独记录索引和通过数组对象取得值的问题,不过,没有办法标识迭代何时终止,因此这个方法只适用于数组,而且回调结构也比较笨拙
因此迭代器模式诞生
迭代器模式
迭代器模式描述了一个方案,即可以把有些结构称为“可迭代对象”(
iterable
)(比如:数组或者集合这样的集合类型对象,它们包含的元素都是有限的,并且具有无歧义的遍历顺序),因为它们实现了正式的Iterable
接口,而且可以通过迭代器Iterator
消费
可迭代对象不一定是集合对象,也可以是仅仅具有类似数组行为的其他数据结构,比如计数循环,该循环中生成的值是暂时性的,但循环本身是在执行迭代,计数循环和数组都具有可迭代对象的行为
任何实现
Iterable
接口的数据结构都可以被实现Iterator
接口的结构“消费”(consume)
,迭代器(iterator)
是按需创建的一次性对象,每个迭代器都会关联一个可迭代对象,而迭代器会暴露迭代其关联可迭代对象的API
,迭代器无须了解与其关联的可迭代对象的结构,只需要知道如何取得连续的值,这种概念上的分离正是Iterable
和Iterator
的强大之处
可迭代协议
实现Iterable
接口(可迭代协议)要求同时具备两种能力:
- 支持迭代的自我识别能力
- 创建实现
Iterator
接口的对象的能力
在ECMAScript
中,这意味着必须暴露一个属性作为“默认迭代器”,而且这个属性必须使用特殊的**Symbol.iterator
** 作为键,这个默认迭代器属性必须引用一个迭代器工厂函数,调用这个工厂函数必须返回一个新迭代器
- 很多内置类型都实现了Iterable 接口
- String
- Array
- Map
- arguments对象
- NodeList等DOM集合类型
- 检查是否存在默认迭代器可以暴露这个工厂函数
1 | let num = 1; |
实际写代码过程中,不需要显式调用这个工厂函数来生成迭代器,实现可迭代协议的所有类型都会自动兼容接收可迭代对象的任何语言特性
- 接收可迭代对象的原生语言特性包括:
- for of 循环
- 数组解构
- 扩展运算符
Array.from()
- 创建Set
- 创建Map
Promise.all()
接收由Promise组成的可迭代对象Promise.race()
接收由Promise组成的可迭代对象yield*
操作符,在生成器中的使用
这些原生语言结构会在后台调用提供的可迭代对象的这个工厂函数,从而创建一个迭代器:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31let arr = ['foo', 'bar', 'baz'];
// for-of 循环
for (let el of arr) {
console.log(el);
}
// foo
// bar
// baz
// 数组解构
let [a, b, c] = arr;
console.log(a, b, c); // foo, bar, baz
// 扩展操作符
let arr2 = [...arr];
console.log(arr2); // ['foo', 'bar', 'baz']
// Array.from()
let arr3 = Array.from(arr);
console.log(arr3); // ['foo', 'bar', 'baz']
// Set 构造函数
let set = new Set(arr);
console.log(set); // Set(3) {'foo', 'bar', 'baz'}
// Map 构造函数
let pairs = arr.map((x, i) => [x, i]);
console.log(pairs); // [['foo', 0], ['bar', 1], ['baz', 2]]
let map = new Map(pairs);
console.log(map); // Map(3) { 'foo'=>0, 'bar'=>1, 'baz'=>2 }- 接收可迭代对象的原生语言特性包括:
如果对象原型链上的父类实现了
Iterable
接口,那这个对象也就实现了这个接口1
2
3
4
5
6
7
8
9class FooArray extends Array {}
let fooArr = new FooArray('foo', 'bar', 'baz');
for (let el of fooArr) {
console.log(el);
}
// foo
// bar
// baz
迭代器协议
迭代器API
使用next()
方法在可迭代对象中遍历数据,每次调用next()都会返回一个`IteratorResult1对象,这个对象包含两个属性:
done
:布尔值,表示是否还可以调用next()
取得下一个值,注意:done:true
表示耗尽value
:包含可迭代对象的下一个值(done:false
)或者是undefined
(done:true
)
1 | // 可迭代对象 |
- 每个迭代器都表示对可迭代对象的一次性有序遍历,不同迭代器的实例相互之间没有联系,只会独立地遍历可迭代对象
1 | let arr = ['foo', 'bar']; |
- 迭代器并不与可迭代对象某个时刻的快照绑定,而仅仅是使用游标来记录遍历可迭代对象的历程,如果可迭代对象在迭代期间被修改了,那么迭代器也会反映相应的变化
1 | let arr = ['foo', 'baz']; |
注意:迭代器维护着一个指向可迭代对象的引用,因此迭代器会阻止垃圾回收程序回收可迭代对象
- 显示迭代器和原生迭代器有差别
1 | // 这个类实现了可迭代接口(Iterable) |
自定义迭代器(手写)
任何实现Iterator接口的对象都可以作为迭代器使用
- 初步实现Iterator接口
1 | // 初步实现Iterator接口 |
- 通过闭包改进:实现一个可迭代对象能够创建多个迭代器,必须每创建一个迭代器就对应一个新计数器
1 | class Counter { |
提前终止迭代器
可选的return()
方法用于指定在迭代器提前关闭时执行的逻辑,执行迭代的结构在想让迭代器知道它不想遍历到可迭代对象耗尽时,就可以“关闭”迭代器
可能的情况有:
for-of
循环通过break
、continue
、return
或throw
提前退出- 解构操作并未消费所有值
return()
方法必须返回一个有效的IteratorResult
对象,简单的情况下,可以只返回{done:true}
- 在内置结构中,还有值可以迭代,但是不会消费这些值的时候,会自动调用
return()
方法
1 | class Counter { |
- 如果迭代器没有关闭,则还可以继续从上次离开的地方继续迭代(比如数组的迭代器就是不能关闭的)
1 | let a = [1, 2, 3, 4, 5]; |
- 因为return()方法是可选的,所以并非所有的迭代器都是可关闭的,要检测某个迭代器是否可关闭,可以测试这个迭代器实例的return属性是不是函数对象,但是,仅仅给一个不可关闭的迭代器增加这个方法并不能让它变可关闭的,这是因为调用return()方法不会强制迭代器进入关闭状态,即便如此,return()方法还是会被调用
1 | let a = [1, 2, 3, 4, 5]; |