Rust 闭包
概述
我们常常需要回调函数的功能, 需要函数并不是在创建时执行, 而是以回调的方式, 在需要的时候延迟执行. 并且, 常常需要在函数中获取环境中的一些信息, 又不需要将其作为函数参数传入. 这种应用场景就需要闭包这一工具了.
闭包是持有外部环境变量的函数. 所谓外部环境, 就是指创建闭包时所在的词法作用域.
闭包的语法: |params| {expr}
其中params表示向闭包中传递的参数, 类似于函数参数. 可以显式指定类型, 也可由编译器自动推导.
expr表示闭包中的各种表达式, 其返回值类型作为为闭包的返回值类型.
let a = "hello"; let print = || {println!("{:?}", a);}; print();
上面的代码段创建了一个闭包, 打印环境变量a的值, 没有传入参数, 返回值类型为().
分类
使用环境变量的方式
Rust中的闭包, 按照对捕获变量的使用方式, 将闭包分为三个类型: Fn, FnMut, FnOnce. 其中Fn类型的闭包, 在闭包内部以共享借用的方式使用环境变量; FnMut类型的闭包, 在闭包内部以独占借用的方式使用环境变量; 而FnOnce类型的闭包, 在闭包内部以所有者的身份使用环境变量. 由此可见, 根据闭包内使用环境变量的方式, 即可判断创建出来的闭包的类型.
注意, 对于Copy类型的环境变量, 如果以传值的方式使用, 其默认的闭包类型是Fn, 而非FnOnce, 而对非Copy的环境变量, 其闭包类型只能是FnOnce.
闭包中环境变量最终的捕获方式 (即, 是借用, 是复制, 还是转移所有权), 还与环境变量本身的语义, 以及闭包是否强制获取环境变量的所有权有关.
举例说明:
#![feature(fn_traits)] fn main() { let mut a = 1; let mut print = || { &a; }; print.call_once(()); // OK print.call_mut(()); // OK print.call(()); // OK }
#![feature(fn_traits)] fn main() { let mut a = 1; let mut print = || { &mut a; }; print.call_once(()); // OK print.call_mut(()); // OK print.call(()); // error, the requirement to implement `Fn` derives from here }
#![feature(fn_traits)] fn main() { let mut a = 1; let mut print = || { a; }; print.call_once(()); // OK print.call_mut(()); // OK print.call(()); // OK }
最后这个比较神奇, 印象中以为Copy和非Copy的环境变量, 而实际上创建的闭包由于环境变量都是Copy的, 默认实现了Fn. 如果是非Copy的环境变量, 则只能实现FnOnce.
#![feature(fn_traits)] fn main() { let mut a = "str".to_string(); let mut print = || { a; }; print.call_once(()); // OK print.call_mut(()); // error, the requirement to implement `FnMut` derives from here print.call(()); // error, the requirement to implement `Fn` derives from here }
是否强制move
在闭包的管道符前面加上move关键字, 会强制以传值的方式捕获变量. 至于是复制还是移动, 则与环境变量类型的语义有关. 我们知道, 一个类型实现Copy, 即为复制语义. 在作为右值使用时会将值按位复制. 而未实现Copy的类型即为移动语义, 作右值使用时会转移所有权.
举个例子:
// 没有强制move, 不强制按值捕获变量 fn main() { let mut a = 1; let print = || { &a; }; let aa = &mut a; // 这里编译报错, mutable borrow occurs here print(); }
之所以声明可变借用aa编译报错, 是因为创建闭包时, 由于是使用可变借用, 因此默认按可变借用捕获环境变量a. 我们知道, 可变借用和不可变借用不能同时使用.
// 强制move, 按值捕获变量 fn main() { let mut a = 1; let print = move || { // 这里添加move, 强制按值捕获变量 &a; }; let aa = &mut a; // 这里不报错, 因为闭包中复制了a的值 print(); }
环境变量的语义
虽然环境变量的类型的语义不影响捕获方式, 但却会影响创建出来的闭包的性质. 如果所有捕获的环境变量均为Copy, 则闭包为Copy, 否则闭包为非Copy, 需要移动.
举个例子:
// 环境变量是Copy, 则闭包是Copy fn main() { let mut a = 1; let print = move || { a; }; let print2 = print; // 因为闭包只捕获了a, 而a是i32是Copy的, 所以print是Copy的 print(); // 这里没有发生所有权转移, 是按位复制, print仍然可用 print2(); }
// 环境变量非Copy, 则闭包非Copy fn main() { let mut a = 1; let mut s = "str".to_string(); let print = move || { a; s; }; let print2 = print; print(); // 这里就要报错了, value used here after move print2(); }
用法
闭包的用法在<<Rust编程之道>>这本书中有比较详细的说明, 主要有两种用法, 作为函数参数, 作为函数返回值. 其中, 作为函数返回值时, 需要注意FnOnce需要特殊处理, Rust会将其封装成FnBox, 从而解决闭包trait对象在解引用时的拆箱问题.
其他
闭包的逃逸性
根据一个闭包是否会逃逸到创建该闭包的词法作用域之外, 可以将闭包分为非逃逸闭包和逃逸闭包.
这二者最根本的区别在于, 逃逸闭包必须复制或移动环境变量. 这是很显然的, 如果闭包在词法作用域之外使用, 而其如果以引用的方式获取环境变量, 有可能引起悬垂指针问题.
逃逸闭包的类型声明中, 需要加一个静态生命周期参数'static.
// 非逃逸闭包, 不按值捕获环境变量也可以编译通过 fn main() { let a = 1; let c: Box<Fn()> = Box::new(|| { &a; }); }
// 显式声明类型为逃逸闭包, 不按值捕获环境变量会编译失败 fn main() { let a = 1; let c: Box<Fn()+'static> = Box::new(|| { &a; // error, borrowed value does not live long enough }); }
// 显式声明类型为逃逸闭包, 按值捕获环境变量, 编译通过 fn main() { let a = 1; let c: Box<Fn()+'static> = Box::new(move || { &a; }); }
高阶生命周期
主要解决闭包参数中含有引用时的生命周期标注的问题. Rust通过高阶trait限定的for<>语法, 解决这一问题.
总结
闭包的几个关键点:
- 闭包如何捕获环境变量: 与环境变量是否Copy, 是否强制move有关.
- 闭包类型: 与环境变量是否Copy, 环境变量在闭包中的使用方式有关.
- 闭包在何时使用环境变量: 涉及闭包的逃逸性, 逃逸闭包必须传值.
参考资料
- <<Rust编程之道>>, 张汉东著
- https://github.com/ZhangHanDo...
下一章:Rust写时复制Cow<T>
写时复制(Copy on Write)技术是一种程序中的优化策略,多应用于读多写少的场景。主要思想是创建对象的时候不立即进行复制,而是先引用(借用)原有对象进行大量的读操作,只有进行到少量的写操作的 ...