你的Future有多大？

Rust Future

鱼雪

在本文中，我们将探讨Rust中的std::future::Future，深入了解其大小对性能和资源管理的影响，并分享一些优化Future大小的实用技巧。

引言

Rust的异步编程模型依赖于Future，它代表一个可能尚未完成的计算。理解Future的大小对于编写高效的异步代码至关重要，尤其是在资源有限的环境中，如嵌入式系统或高并发服务器。

本文将带你了解如何测量Future的大小、为什么这很重要，以及如何通过一些策略来优化Future的大小。

什么是Future？

在Rust中，有两种创建Future的方法：

手动实现：定义一个结构体或枚举，然后为其实现Future trait。
使用async关键字：通过async块或async函数创建Future。任何async块（async { .. }）或async函数（async fn foo() { .. }）都会返回一个Future。

例如：

async fn example_async_function() {
    // 异步操作
}

这个example_async_function函数返回一个Future，该Future在被poll时会执行其中的异步操作。

Future的大小有多大？

在Rust中，Future的大小取决于它所包含的状态和数据。编译器在编译时会确定每个Future的确切大小，这对于内存分配和性能优化非常重要。

如何测量Future的大小？

可以使用std::mem::size_of函数来测量任何类型在内存中的大小。

对于Future，你可以创建一个通用的函数来获取其大小：

use std::future::Future;
use std::mem;

fn how_big_is_that_future<F: Future>(_fut: F) -> usize {
    mem::size_of::<F>()
}

#[tokio::main]
async fn main() {
    let fut = async {
        // 一些异步操作
    };
    println!("Future size: {} bytes", how_big_is_that_future(fut));
}

这个泛型函数会在编译时被具体化（monomorphised），即Rust编译器会为每种不同的F生成一个独立的函数版本，从而知道每个Future的具体大小。

为什么我们关心Future的大小？

了解Future的大小对于以下几个方面至关重要：

栈空间限制：Future通常在栈上分配，而每个线程的栈空间是有限的（例如，标准库中每个线程默认有2 MiB的栈空间）。
性能优化：较大的Future会占用更多的内存，可能导致缓存未命中，影响性能。
避免栈溢出：过大的Future可能导致栈空间耗尽，导致程序崩溃。

示例：大型Future

以下是一个创建大型Future的示例：

async fn nothing() {}

async fn huge() {
    let mut a = [0_u8; 20_000];
    nothing().await;
    for (idx, item) in a.iter_mut().enumerate() {
        *item = (idx % 256) as u8;
    }
}

在这个示例中，huge函数创建了一个包含20,000个u8元素的数组，并在await点之后填充数组。即使在发布模式下，这个Future也占用了20,002字节（20,000字节用于数组，2字节用于nothing函数的Future）。

如何优化Future的大小？

1. 使用Box将Future放到堆上

如果Future非常大，可以将其包装在Box中，将其存储在堆上，而不是栈上。

这样可以减少栈空间的占用。

async fn not_so_innocent() {
    Box::pin(huge()).await;
}

使用Box::pin而不是Box::new，因为Future需要被固定（pinned）以供轮询。

2. Tokio中的自动Boxing

Tokio在编译为调试模式时，会检查用户提供的Future的大小，并在超过一定阈值时自动将其Box。最新版本的Tokio还扩展了这一行为到发布模式，设置了16 KiB的限制。

tokio::spawn(huge());

通过这种方式，Tokio会自动将超过16 KiB的Future放到堆上，避免栈溢出。

3. 使用Tracing进行任务大小监控

Tokio Console现在支持在任务生成时记录Future的大小，并提供警告以提示开发者可能存在的问题。

此外，Clippy已经引入了large_futures lint，可以在编译时检测过大的Future，帮助开发者在问题发生前进行优化。

完整示例

以下是一个完整的示例，展示了如何测量和优化Future的大小：

use std::future::Future;
use std::mem;

fn how_big_is_that_future<F: Future>(_fut: F) -> usize {
    mem::size_of::<F>()
}

async fn nothing() {}

async fn huge() {
    let mut a = [0_u8; 20_000];
    nothing().await;
    for (idx, item) in a.iter_mut().enumerate() {
        *item = (idx % 256) as u8;
    }
}

#[tokio::main]
async fn main() {
    let fut = huge();
    println!("Future size: {} bytes", how_big_is_that_future(fut));

    tokio::spawn(fut);
}

运行上述代码，你将看到huge函数的Future大小，并且Tokio会根据配置自动将其Box到堆上。

总结

了解和优化Future的大小对于编写高效、可靠的Rust异步代码至关重要。

通过以下几种方法，可以有效管理和减少Future的内存占用：

测量Future的大小：使用std::mem::size_of函数。
Boxing大型Future：将其存储在堆上，减小栈空间占用。
利用Tokio的自动Boxing：让Tokio自动处理大型Future。
使用Clippy进行静态检查：提前发现并优化过大的Future。

通过这些策略，你可以确保Rust异步代码在各种环境下高效运行，避免内存和性能问题。

引言​

什么是Future？​

Future的大小有多大？​

如何测量Future的大小？​

为什么我们关心Future的大小？​

示例：大型Future​

如何优化Future的大小？​

1. 使用Box将Future放到堆上​

2. Tokio中的自动Boxing​

3. 使用Tracing进行任务大小监控​

完整示例​

总结​

参考资料​

引言