74 posts tagged with "Rust"

引言

上下文回顾

在上一篇文章中，我们深入探讨了 Rust 中 Future 的概念和实现原理。我们了解到 Future 是异步编程的基础抽象，它代表了一个可能在未来完成的值。

任务基础

关键概念速览

在深入细节之前，让我们先快速了解本文将要讨论的核心概念：

概念	描述	主要作用
`Future`	代表未来可能的值	定义异步操作
`Task`	`Future` 的运行时实例	管理异步操作的执行
`Spawn`	任务创建机制	提交任务到执行器
`JoinHandle`	任务控制句柄	等待和管理任务结果
`Waker`	任务唤醒机制	通知执行器任务可继续执行

快速上手示例

use tokio;
use std::time::Duration;

#[tokio::main]
async fn main() {
    // 1. 创建一个简单的异步任务
    let handle = tokio::spawn(async {
        println!("Task started");
        tokio::time::sleep(Duration::from_secs(1)).await;
        println!("Task completed");
        "Task result"
    });

    // 2. 等待任务完成
    let result = handle.await.unwrap();
    println!("Got result: {}", result);
}

任务的定义与作用

任务（Task）是异步运行时中的最小执行单位，它封装了一个 Future 实例及其执行上下文。

每个任务代表一个独立的异步操作流程。

Future 的定义

// 当你定义一个异步函数或块时，实际上是定义了一个 Future
async fn my_async_function() -> Result<String, Error> {
    // 这个函数会返回一个实现了 Future trait 的类型
    // 而不是直接返回 Result<String, Error>
}

// 或者使用 async 块
let future = async {
    // 这里的代码定义了 Future 的行为
};

Task 的创建

// 当你使用 spawn 或类似的方法来执行 Future 时，运行时会将 Future 封装为 Task
tokio::spawn(my_async_function());  // Future 被转换为 Task 并提交给执行器

让我用一个类比来说明：

Future 就像是一个"食谱"：
- 描述了"要做什么"
- 包含了所有必要的步骤
- 但还没有真正开始执行
Task 就像是"正在烹饪的过程"：
- 是 Future 的运行时实例
- 包含了实际执行的状态
- 有自己的资源和上下文
任务与 Future 的关系任务是 Future 的运行时表示：

Future 定义了异步操作的逻辑
Task 负责管理 Future 的执行状态
Task 处理与执行器的交互

让我画个简单的图来说明这个关系：

Rust Future与Task的关系

关键区别：

Future（特征/定义）
- 是一个特征（trait）
- 定义了异步计算的逻辑
- 是静态的定义
- 可以被多次执行
- 不包含执行状态
Task（运行时实例）
- 是 Future 的运行时表示
- 包含执行状态和上下文
- 是动态的实例
- 有自己的生命周期
- 包含调度信息

实际使用示例：

// 1. 定义 Future
async fn fetch_data(url: String) -> Result<String, Error> {
    // 异步操作的定义
    let response = reqwest::get(&url).await?;
    let text = response.text().await?;
    Ok(text)
}

// 2. 创建多个 Task
async fn main() {
    // 同一个 Future 定义可以创建多个不同的 Task
    let task1 = tokio::spawn(fetch_data("url1".to_string()));
    let task2 = tokio::spawn(fetch_data("url2".to_string()));
    
    // 等待所有 Task 完成
    let (result1, result2) = join!(task1, task2);
}

这种设计的优点：

灵活性：同一个 Future 可以被多次执行
资源管理：Task 可以独立管理资源
并发控制：执行器可以有效调度多个 Task
状态隔离：每个 Task 有自己的执行状态

理解这个关系对于编写高效的异步代码很重要，因为它帮助我们：

更好地组织异步代码结构
理解执行流程
处理并发和资源管理
优化性能

任务的生命周期

任务从创建到完成经历以下阶段：

Rust 异步

创建阶段：任务被构造并初始化
调度阶段：任务被提交到执行器
执行阶段：任务被轮询（poll）执行
等待阶段：任务等待资源或事件
完成阶段：任务执行完成或失败

任务的核心组件

动态分发（`Dyn`）

为什么需要动态分发

在异步运行时中，我们需要管理不同类型的 Future。

动态分发允许我们用统一的方式处理这些 Future。

// 动态 Future 类型定义
type DynFuture = Pin<Box<dyn Future<Output = ()> + Send>>;

// 使用示例
fn store_future<F>(future: F) 
where 
    F: Future<Output = ()> + Send + 'static 
{
    let boxed: DynFuture = Box::pin(future);
    // 存储或处理 boxed future
}

性能考虑

动态分发虽然提供了灵活性，但也带来了一些开销：

额外的内存分配（Box）
虚表查找的开销
潜在的缓存未命中

Spawn 机制

基本概念

spawn 是向执行器提交任务的标准方式：

pub fn spawn<F>(future: F) -> JoinHandle<F::Output>
where
    F: Future + Send + 'static,
    F::Output: Send + 'static,
{
    // 创建任务并返回句柄
    let (handle, task) = create_task(future);
    
    // 提交任务到执行器
    EXECUTOR.submit(task);
    
    handle
}

实现细节

高效的任务生成机制需要考虑：

任务状态管理
资源分配策略
错误处理机制

`JoinHandle`

设计思想

JoinHandle 提供了等待任务完成的机制：

pub struct JoinHandle<T> {
    state: Arc<Mutex<JoinState<T>>>,
}

enum JoinState<T> {
    Running(Waker),
    Completed(T),
    Failed(Error),
}

impl<T> Future for JoinHandle<T> {
    type Output = Result<T, Error>;

    fn poll(self: Pin<&mut Self>, cx: &mut Context<'_>) -> Poll<Self::Output> {
        let mut state = self.state.lock().unwrap();
        match &*state {
            JoinState::Completed(value) => Poll::Ready(Ok(value.clone())),
            JoinState::Failed(error) => Poll::Ready(Err(error.clone())),
            JoinState::Running(_) => {
                *state = JoinState::Running(cx.waker().clone());
                Poll::Pending
            }
        }
    }
}

唤醒机制

`Waker` 的作用

Waker 负责在任务可继续执行时通知执行器：

pub struct CustomWaker {
    task_id: TaskId,
    task_queue: Arc<Mutex<TaskQueue>>,
}

impl Wake for CustomWaker {
    fn wake(self: Arc<Self>) {
        let mut queue = self.task_queue.lock().unwrap();
        queue.push(self.task_id);
    }
}

实践示例

基础使用模式

#[tokio::main]
async fn main() {
    // 创建多个任务
    let mut handles = Vec::new();
    
    for i in 0..5 {
        let handle = tokio::spawn(async move {
            println!("Task {} started", i);
            tokio::time::sleep(Duration::from_secs(1)).await;
            println!("Task {} completed", i);
            i
        });
        handles.push(handle);
    }
    
    // 等待所有任务完成
    for handle in handles {
        let result = handle.await.unwrap();
        println!("Got result: {}", result);
    }
}

高级应用场景

任务取消

async fn cancellable_task(cancel: CancellationToken) -> Result<(), Error> {
    loop {
        tokio::select! {
            _ = cancel.cancelled() => {
                println!("Task cancelled");
                return Ok(());
            }
            _ = async_operation() => {
                println!("Operation completed");
            }
        }
    }
}

最佳实践与性能优化

任务粒度

避免过细的任务粒度
合理批处理小任务
控制任务数量

批处理优化示例

use futures::stream::{self, StreamExt};
use tokio::task;

async fn process_items_batched(items: Vec<i32>) -> Result<(), Error> {
    // 将items分批处理
    let batch_size = 100;
    let mut batches = stream::iter(items)
        .chunks(batch_size)
        .map(|chunk| {
            task::spawn(async move {
                for item in chunk {
                    process_single_item(item).await?;
                }
                Ok::<_, Error>(())
            })
        })
        .buffer_unwind(10); // 控制并发数量

    while let Some(result) = batches.next().await {
        result??; // 处理错误
    }

    Ok(())
}

// 对比：细粒度任务版本
async fn process_items_fine_grained(items: Vec<i32>) -> Result<(), Error> {
    let handles: Vec<_> = items
        .into_iter()
        .map(|item| {
            task::spawn(async move {
                process_single_item(item).await
            })
        })
        .collect();

    for handle in handles {
        handle.await??;
    }

    Ok(())
}

资源管理

使用资源池
实现超时机制
处理任务泄漏

资源限制

use tokio::sync::Semaphore;

async fn with_limit<F, T>(
    sem: Arc<Semaphore>,
    task: F
) -> Result<T, Error>
where
    F: Future<Output = Result<T, Error>>,
{
    let _permit = sem.acquire().await?;
    task.await
}

连接池管理

use bb8::Pool;

async fn create_pool() -> Pool<MyConnectionManager> {
    let manager = MyConnectionManager::new("connection_string");
    Pool::builder()
        .max_size(15)
        .min_idle(Some(5))
        .build(manager)
        .await
        .unwrap()
}

超时控制

async fn with_timeout<F, T>(future: F, duration: Duration) -> Result<T, TimeoutError>
where
    F: Future<Output = T>,
{
    timeout(duration, future).await
}

错误处理

实现优雅降级
添加重试机制
日志记录

健壮的错误处理模式

use tokio::time::timeout;
use backoff::{ExponentialBackoff, backoff::Backoff};

async fn robust_task() -> Result<(), Error> {
    // 1. 超时处理
    let operation_result = timeout(
        Duration::from_secs(5),
        async {
            // 你的异步操作
            Ok::<_, Error>(())
        }
    ).await??;

    // 2. 重试机制
    let mut backoff = ExponentialBackoff::default();
    let retry_result = async {
        loop {
            match async_operation().await {
                Ok(value) => break Ok(value),
                Err(e) => {
                    if let Some(duration) = backoff.next_backoff() {
                        tokio::time::sleep(duration).await;
                        continue;
                    }
                    break Err(e);
                }
            }
        }
    }.await?;

    // 3. 资源清理
    struct CleanupGuard<T>(T);
    impl<T> Drop for CleanupGuard<T> {
        fn drop(&mut self) {
            // 清理资源
        }
    }
    
    let _guard = CleanupGuard(resource);

    Ok(())
}

任务粒度优化

以下是不同任务粒度的性能对比：

策略	优点	缺点	适用场景
细粒度	更好的响应性	更高的调度开销	IO密集型，需要快速响应
批处理	更低的开销	延迟可能增加	CPU密集型，吞吐量优先
混合模式	平衡的性能	实现复杂	复杂业务场景

参考资料

Rust中派生宏(Derive Macro)使用方法

Rust

引言

派生宏（Derive Macros）是Rust中的一种强大的元编程工具，它允许我们通过注解的方式自动为类型实现特定的trait。

通过使用#[derive(...)]属性，我们可以避免编写大量的样板代码，提高开发效率。

为什么需要派生宏？

// 不使用派生宏
struct Point {
    x: i32,
    y: i32,
}

impl std::fmt::Debug for Point {
    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
        f.debug_struct("Point")
         .field("x", &self.x)
         .field("y", &self.y)
         .finish()
    }
}

// 使用派生宏
#[derive(Debug)]
struct Point {
    x: i32,
    y: i32,
}

派生宏的优势：

减少重复代码
提高代码可维护性
降低出错可能性
提升开发效率

派生宏基础

工作原理

派生宏在编译时展开，生成实现特定trait的代码。

它们是过程宏的一种，可以访问和操作Rust的抽象语法树（AST）。

常见的标准库派生宏

基础trait

#[derive(Debug, Clone, Copy)]
struct Vector2D {
    x: f64,
    y: f64,
}

比较相关

#[derive(PartialEq, Eq, PartialOrd, Ord)]
struct Version(u32, u32, u32);

数据处理

#[derive(Serialize, Deserialize)]
struct Config {
    #[serde(default = "default_port")]
    port: u16,
    #[serde(rename = "host_name")]
    host: String,
}

语法规则

基本语法

#[derive(TraitName1, TraitName2)]
struct MyStruct {
    // fields...
}

带属性参数

#[derive(Builder)]
#[builder(setter(into))]
struct Command {
    #[builder(default = "\"localhost\".to_string()")]
    host: String,
    #[builder(default = "8080")]
    port: u16,
}

创建自定义派生宏

基本步骤

创建过程宏项目

[lib]
proc-macro = true

[dependencies]
syn = "1.0"
quote = "1.0"
proc-macro2 = "1.0"

实现派生宏

use proc_macro::TokenStream;
use quote::quote;
use syn::{parse_macro_input, DeriveInput};

#[proc_macro_derive(HelloWorld)]
pub fn hello_world_derive(input: TokenStream) -> TokenStream {
    let input = parse_macro_input!(input as DeriveInput);
    let name = input.ident;

    let expanded = quote! {
        impl #name {
            fn hello_world() {
                println!("Hello, World! I'm {}", stringify!(#name));
            }
        }
    };

    TokenStream::from(expanded)
}

这个宏实现了给结构体添加一个hello_world方法。

工具链介绍

syn: 解析Rust代码为语法树
quote: 将语法树转换回Rust代码
proc-macro2: 提供底层Token处理功能

生产环境中的派生宏应用

常见使用场景

序列化/反序列化

#[derive(Serialize, Deserialize)]
struct User {
    id: u64,
    name: String,
    #[serde(skip_serializing_if = "Option::is_none")]
    email: Option<String>,
}

错误处理

#[derive(Error, Debug)]
pub enum ApiError {
    #[error("请求失败: {0}")]
    RequestFailed(#[from] reqwest::Error),
    
    #[error("数据库错误: {0}")]
    DatabaseError(#[from] sqlx::Error),
}

命令行参数解析

#[derive(Parser)]
#[clap(version = "1.0", author = "Your Name")]
struct Opts {
    #[clap(short, long)]
    config: PathBuf,
    
    #[clap(short, long, default_value = "info")]
    log_level: String,
}

流行的派生宏库

serde: 序列化框架
thiserror: 错误处理
clap: 命令行参数解析
async-trait: 异步trait支持
derive_more: 通用派生宏集合

最佳实践

性能考虑

// 避免不必要的Clone实现
#[derive(Debug, Copy)] // 优先使用Copy而不是Clone
struct SmallType {
    x: i32,
    y: i32,
}

属性组织

#[derive(Debug, Clone, Serialize)]
#[serde(rename_all = "camelCase")]
#[serde(deny_unknown_fields)]
struct ApiResponse {
    status_code: u16,
    message: String,
}

高级主题

条件派生

#[cfg_attr(feature = "serde", derive(Serialize, Deserialize))]
#[derive(Debug, Clone)]
struct Configuration {
    name: String,
    value: i32,
}

如果feature为serde，则生成Serialize和Deserialize的实现。

自定义错误处理

#[derive(Error, Debug)]
pub enum CustomError {
    #[error("验证失败: {field} - {message}")]
    ValidationError {
        field: String,
        message: String,
    },
    
    #[error(transparent)]
    Other(#[from] anyhow::Error),
}

实现了Errortrait，并添加了anyhow::Error的转换。

性能优化

编译时优化

// 使用 Box 减少编译时内存使用
#[derive(Debug)]
struct LargeStruct {
    #[debug(skip)]
    large_data: Box<[u8]>,
    metadata: String,
}

测试与调试

单元测试

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn test_derive_debug() {
        #[derive(Debug)]
        struct Test {
            field: i32,
        }
        
        let instance = Test { field: 42 };
        assert_eq!(format!("{:?}", instance), "Test { field: 42 }");
    }
}

调试技巧

使用cargo expand查看宏展开
使用println!在编译时打印信息
使用cargo-expand查看完整的展开代码

总结与展望

派生宏是Rust中强大的代码生成工具，能够：

减少重复代码
提高开发效率
保证实现的正确性
提供良好的抽象

未来发展方向：

更强大的编译时类型检查
更好的错误提示
更多的标准库支持
更完善的IDE支持

参考资料

Rust中异步编程的最佳实践01：Futures

Rust

Rust 异步Future

引言

use futures::future;
use std::time::Duration;

async fn foo(n: u64) {
    println!("start {n}");
    tokio::time::sleep(Duration::from_secs(1)).await;
    println!("end {n}");
}

#[tokio::main]
async fn main() {
    let mut futures = Vec::new();
    for n in 1..=10 {
        futures.push(foo(n));
    }
    let joined_future = future::join_all(futures);
    joined_future.await;
}

在引言部分，我们展示了一个异步Rust的示例代码，但并未解释其内部工作原理。

这留下了几个疑问：什么是异步函数及其返回的“futures”？ join_all函数的作用是什么？ tokio::time::sleep与std::thread::sleep有何不同？

为了回答这些问题，我们将把这些异步组件转换为普通的、非异步的Rust代码。

我们会发现，复制foo和join_all并不困难，但编写自定义的sleep函数则更为复杂。

让我们开始吧。

Futures概述

什么是Futures

在Rust的异步编程中，Future是一个核心概念。

一个Future代表了一个可能尚未完成的计算，类似于一个占位符，未来某个时刻会产生一个结果。

通过async和await语法，Rust允许我们以同步的方式编写异步代码，极大地简化了异步编程的复杂性。

Futures的基本组成

一个Future主要由以下几个部分组成：

Pin：一种指针包装器，用于确保内存中某个位置的数据不会被移动。对于某些需要**自引用的Future**来说，Pin是必需的。
Context：上下文信息，包含一个Waker
Waker：用于在Future需要被重新调度时唤醒它。
Poll：Future的poll方法返回一个Poll枚举，指示Future是已完成（Ready）还是尚未完成（Pending）。

下面我们通过具体的代码示例来深入理解这些概念。

代码示例解析

`foo`函数的异步实现

首先，我们来看一个异步函数foo的示例：

async fn foo(n: u64) {
    println!("start {n}");
    tokio::time::sleep(Duration::from_secs(1)).await;
    println!("end {n}");
}

这个函数做了以下几件事：

打印开始信息。
异步等待1秒钟。
打印结束信息。

通过async关键字，这个函数返回一个Future，而不是立即执行。

调用者可以选择等待这个`Future`完成。

`foo`函数的同步实现

为了更好地理解异步函数的工作原理，我们将foo函数转换为一个同步的、非异步的版本：

use std::pin::Pin;
use std::future::Future;
use std::task::{Context, Poll};
use std::time::Duration;

fn foo(n: u64) -> Foo {
    let started = false;
    let duration = Duration::from_secs(1);
    let sleep = Box::pin(tokio::time::sleep(duration));
    Foo { n, started, sleep }
}

struct Foo {
    n: u64,
    started: bool,
    sleep: Pin<Box<tokio::time::Sleep>>,
}

impl Future for Foo {
    type Output = ();

    fn poll(mut self: Pin<&mut Self>, context: &mut Context) -> Poll<()> {
        if !self.started {
            println!("start {}", self.n);
            self.started = true;
        }
        if self.sleep.as_mut().poll(context).is_pending() {
            return Poll::Pending;
        }
        println!("end {}", self.n);
        Poll::Ready(())
    }
}

解析：

函数定义：

foo函数现在返回一个Foo结构体，而不是一个Future。
Foo结构体包含：
- 一个计数器n。
- 一个标志started，用于跟踪是否已经开始执行。
- 一个被Pin包装的sleep future。

Future实现：

Foo实现了Future trait。
在poll方法中：
- 如果尚未开始，打印开始信息并设置started为true。
- 调用sleep的poll方法。
  - 如果sleep还未完成，返回Poll::Pending。
  - 如果sleep完成，打印结束信息并返回Poll::Ready(())。

通过这种方式，我们手动实现了一个简单的Future，它模拟了异步函数的行为。

JoinAll的实现

接下来，我们来看join_all函数的实现。join_all用于等待一组Future全部完成。

异步实现

在异步代码中，使用join_all如下：

async fn main() {
    let futures = vec![foo(1), foo(2), foo(3)];
    futures::future::join_all(futures).await;
}

同步实现

我们将join_all转换为同步的、非异步的版本：

fn join_all<F: Future>(futures: Vec<F>) -> JoinAll<F> {
    JoinAll {
        futures: futures.into_iter().map(Box::pin).collect(),
    }
}

struct JoinAll<F> {
    futures: Vec<Pin<Box<F>>>,
}

impl<F: Future> Future for JoinAll<F> {
    type Output = ();

    fn poll(mut self: Pin<&mut Self>, context: &mut Context) -> Poll<()> {
        let is_pending = |future: &mut Pin<Box<F>>| {
            future.as_mut().poll(context).is_pending()
        };
        self.futures.retain_mut(is_pending);
        if self.futures.is_empty() {
            Poll::Ready(())
        } else {
            Poll::Pending
        }
    }
}

解析：

函数定义：
- join_all函数接收一个Future的向量，并返回一个JoinAll结构体。
结构体定义：
- JoinAll结构体包含一个Future的Vec，每个Future被Box::pin包装，以确保它们在内存中的位置固定。
Future实现：
- 在poll方法中：
  - 使用retain_mut方法保留所有尚未完成的Future。
  - 如果所有Future都完成了，返回Poll::Ready(())。
  - 否则，返回Poll::Pending。

通过这种方式，我们手动实现了一个能够等待多个Future完成的Future。

自定义Sleep实现

现在，让我们尝试实现自己的sleep函数。我们希望它能够异步地等待指定的时间。

异步实现

在异步代码中，使用sleep如下：

async fn foo(n: u64) {
    println!("start {n}");
    tokio::time::sleep(Duration::from_secs(1)).await;
    println!("end {n}");
}

同步实现

我们将sleep函数转换为同步的、非异步的版本：

fn sleep(duration: Duration) -> Sleep {
    let wake_time = Instant::now() + duration;
    Sleep { wake_time }
}

struct Sleep {
    wake_time: Instant,
}

impl Future for Sleep {
    type Output = ();

    fn poll(self: Pin<&mut Self>, _: &mut Context) -> Poll<()> {
        if Instant::now() >= self.wake_time {
            Poll::Ready(())
        } else {
            Poll::Pending
        }
    }
}

问题：

尽管代码逻辑看起来正确，运行时发现sleep函数无法正确唤醒，导致程序挂起。

这是因为Future::poll方法在返回Poll::Pending时需要安排一次唤醒，而当前的实现并未完成这一点。

唤醒机制（Wake）

为了让sleep函数能够在指定时间后正确唤醒，我们需要实现唤醒机制。这涉及到Context和Waker的使用。

理解`Context`和`Waker`

Context：包含一个Waker，用于在Future需要被重新调度时唤醒它。
Waker：用于通知执行器，Future已经准备好被再次poll。

修改Sleep实现

我们需要在sleep函数的poll方法中安排唤醒：

use std::sync::{Mutex, Arc};
use std::collections::BTreeMap;
use std::task::Waker;

static WAKE_TIMES: Mutex<BTreeMap<Instant, Vec<Waker>>> =
    Mutex::new(BTreeMap::new());

impl Future for Sleep {
    type Output = ();

    fn poll(self: Pin<&mut Self>, context: &mut Context) -> Poll<()> {
        if Instant::now() >= self.wake_time {
            Poll::Ready(())
        } else {
            let mut wake_times = WAKE_TIMES.lock().unwrap();
            let wakers_vec = wake_times.entry(self.wake_time).or_default();
            wakers_vec.push(context.waker().clone());
            Poll::Pending
        }
    }
}

解析：

全局唤醒时间表：
- 使用BTreeMap按时间排序存储唤醒时间和对应的Waker。
在poll中注册Waker：
- 如果当前时间未到唤醒时间，将Waker添加到WAKE_TIMES中对应的时间点。
主循环的实现：
- 主函数会监视WAKE_TIMES，并在到达唤醒时间时调用相应的Waker，从而重新poll相关的Future。

主函数的实现

接下来，我们实现一个主函数，负责调度和执行所有的Future：

fn main() {
    let mut futures = Vec::new();
    for n in 1..=10 {
        futures.push(foo(n));
    }
    let mut joined_future = Box::pin(join_all(futures));
    let waker = futures::task::noop_waker();
    let mut context = Context::from_waker(&waker);
    while joined_future.as_mut().poll(&mut context).is_pending() {
        // 获取下一个唤醒时间
        let mut wake_times = WAKE_TIMES.lock().unwrap();
        let next_wake = wake_times.keys().next().expect("sleep forever?");
        thread::sleep(next_wake.saturating_duration_since(Instant::now()));
        // 唤醒所有到期的Waker
        while let Some(entry) = wake_times.first_entry() {
            if *entry.key() <= Instant::now() {
                entry.remove().into_iter().for_each(Waker::wake);
            } else {
                break;
            }
        }
    }
}

解析：

初始化Future：
- 创建多个foo函数的Future实例，并将它们传递给join_all函数，得到一个聚合的Future。
创建Context：

使用noop_waker创建一个空的Waker，并构建Context。

轮询Future：

在循环中不断poll聚合的Future。
获取下一个唤醒时间，并让主线程休眠到该时间。
唤醒所有到期的Waker，以重新调度相应的Future。

结果：

这样，我们实现了一个简单的异步运行时，能够正确地调度和执行多个Future，并解决了之前的“忙循环”问题。

`Pin`、`Cancellation`与`Recursion`

`Pin`

Pin是Rust中的一个关键类型，用于确保某个数据在内存中的位置固定，防止其被移动。

对于**自引用的Future**来说，Pin是必需的。

示例：

struct Foo {
    n: u64,
    n_ref: &u64,
    started: bool,
    sleep: Pin<Box<tokio::time::Sleep>>,
}

在这种情况下，Pin确保Foo结构体在内存中的位置固定，避免n_ref被移动。

取消（Cancellation）

异步函数具有取消的能力。当我们不再需要某个Future时，可以通过不再poll它来取消它。
tokio提供了tokio::time::timeout等工具来实现超时取消。

示例：

struct Timeout<F> {
    sleep: Pin<Box<tokio::time::Sleep>>,
    inner: Pin<Box<F>>,
}

impl<F: Future> Future for Timeout<F> {
    type Output = Option<F::Output>;

    fn poll(
        mut self: Pin<&mut Self>,
        context: &mut Context,
    ) -> Poll<Self::Output> {
        if let Poll::Ready(output) = self.inner.as_mut().poll(context) {
            return Poll::Ready(Some(output));
        }
        if self.sleep.as_mut().poll(context).is_ready() {
            return Poll::Ready(None);
        }
        Poll::Pending
    }
}

fn timeout<F: Future>(duration: Duration, inner: F) -> Timeout<F> {
    Timeout {
        sleep: Box::pin(tokio::time::sleep(duration)),
        inner: Box::pin(inner),
    }
}

递归（Recursion）

异步函数不支持直接递归调用，因为这会导致无限大小的Future
解决方法是通过Box::pin进行堆分配：

async fn factorial(n: u64) -> u64 {
    if n == 0 {
        1
    } else {
        let recurse = Box::pin(factorial(n - 1));
        n * recurse.await
    }
}

这样可以避免无限大小的问题，但需要堆分配，可能带来性能开销。

Rust中Future的生命周期流程分析

以下是对Rust中Future生命周期的流程中每个阶段的详细分析(如顶部图片所示)：

Future 创建阶段

步骤：

创建异步函数
编译器将异步函数转换为状态机
生成 Future 实例

Rust中的异步函数（async fn）在编译时会被转换为一个状态机。这种转换使得异步函数能够在执行过程中保存其状态，以便在未来的某个时间点继续执行。编译器生成的状态机实现了Future trait，从而生成一个Future实例。

执行器处理阶段

步骤：

Future 提交到执行器
分配执行上下文
创建 Waker 对象

Future实例一旦创建，就需要被执行器（如tokio或async-std）管理。执行器负责调度和驱动Future的执行。 执行器会为每个Future分配一个执行上下文（Context），并创建一个Waker对象，用于在Future需要被重新调度时唤醒它。

Future 状态轮询阶段

步骤：

调用 poll 方法
检查完成状态
未完成则注册 Waker
返回 Pending 状态

执行器通过调用Future的poll方法来推进其执行。poll方法会检查Future是否已经完成：

如果Future已经完成，返回Poll::Ready。
如果Future尚未完成，返回Poll::Pending，并注册Waker，以便在未来某个时间点唤醒执行器重新调度该Future。

唤醒机制阶段

步骤：

等待外部事件
事件就绪时触发
调用 wake() 方法
Future 重新入队等待执行

当Future处于Poll::Pending状态时，它通常会等待某个外部事件（如I/O操作完成或定时器到期）。

一旦事件就绪，相关的Waker会被调用，通知执行器重新调度该Future进行下一步的poll操作。

完成阶段

步骤：

返回 Ready 状态
获取执行结果
清理相关资源

当Future完成其任务后，poll方法会返回Poll::Ready，执行器随后可以获取Future的执行结果，并进行必要的资源清理工作。

以下是对整个流程的总结：

创建阶段：
- 定义异步函数，编译器将其转换为状态机，生成Future实例。
执行器处理阶段：
- 将Future提交给执行器，分配执行上下文，创建Waker对象。
状态轮询阶段：
- 执行器调用poll方法，检查Future是否完成，未完成则注册Waker并返回Pending。
唤醒机制阶段：
- 外部事件就绪时，Waker被调用，Future重新入队等待执行。
完成阶段：
- Future返回Ready状态，执行器获取结果并清理资源。

但为了更全面地理解Future的生命周期，以下几点也值得注意：

执行器的具体实现：
- 不同的执行器（如tokio、async-std）在具体的调度和任务管理上可能有所不同，但总体流程相似。
多任务调度：
- 执行器通常会同时管理多个Future，通过异步事件驱动机制高效地调度它们。
错误处理：
- 在实际应用中，Future可能会因为各种原因失败，执行器需要能够处理这些错误。
资源管理：
- Future的生命周期结束后，相关的资源（如内存、文件句柄）需要被正确释放，以防止资源泄漏。

通过理解和掌握这些流程和细节，开发者可以更高效地编写和优化Rust中的异步代码，充分利用Rust在并发和异步编程中的强大优势。

总结

在Rust中，Future是异步编程的核心。

通过理解Future的工作原理、如何手动实现它们，以及如何构建一个简单的异步运行时，我们可以更深入地掌握Rust的异步机制。

虽然Rust的async/await语法极大地简化了异步编程，但了解底层机制对于编写高效、可靠的异步代码至关重要。

关键要点

Future的基本概念：Future代表一个可能尚未完成的计算，通过poll方法驱动其完成。
手动实现Future：通过实现Future trait，可以深入理解异步编程的内部机制。
唤醒机制：Waker用于通知执行器，Future已经准备好被重新poll。
构建异步运行时：了解如何手动驱动Future的执行，有助于理解像tokio这样的异步运行时的工作原理。
额外概念：Pin、Cancellation与Recursion等高级概念，进一步增强对异步编程的掌握。

通过本文的学习，相信您对Rust的异步编程有了更深入的理解。

在接下来的篇章中，我们将继续探讨异步任务（Tasks）和异步IO（IO）的相关内容，进一步完善您的异步编程知识体系。

参考资料

为什么不应该在Rust中使用 `Arc<Mutex<HashMap<K, V>>>`

Rust

Rust作为一门注重内存安全和并发性能的现代编程语言，广泛应用于系统编程、网络服务、嵌入式开发等领域。

在多线程环境中，如何安全高效地共享数据结构是开发者常面临的挑战之一。

Arc<Mutex<HashMap<K, V>>> 是一种常见的并发数据结构组合，但它并非在所有场景下都是最佳选择。

本文将深入探讨什么是 Arc<Mutex<HashMap<K, V>>>，为什么会使用它，使用过程中存在的问题，以及在什么情况下适合或不适合使用它，并介绍一些更优的替代方案。

什么是 Arc<Mutex<HashMap<K, V>>>
为什么会使用 Arc<Mutex<HashMap<K, V>>>
使用 Arc<Mutex<HashMap<K, V>>> 存在的问题
- 粗粒度锁导致的争用
- 死锁风险
- 锁污染
- Mutex 锁定与解锁的开销
- 缺乏细粒度控制
什么时候使用或不使用 Arc<Mutex<HashMap<K, V>>>
替代解决方案
- DashMap
- RwLock<HashMap<K, V>>
- tokio::sync::Mutex
总结
参考

什么是 `Arc<Mutex<HashMap<K, V>>>`

在Rust中，多线程环境下共享数据通常需要通过智能指针和同步原语来实现。

Arc<Mutex<HashMap<K, V>>> 是一种常见的组合，用于在多个线程之间共享和安全地访问一个 HashMap。

Arc (std::sync::Arc)：原子引用计数，用于在多个线程间共享所有权。
Mutex (std::sync::Mutex)：互斥锁，确保在任意时刻只有一个线程可以访问被保护的数据。
HashMap<K, V>：键值对存储的数据结构。

组合起来，Arc<Mutex<HashMap<K, V>>> 允许多个线程通过 Arc 共享对 HashMap 的所有权，并通过 Mutex 确保对 HashMap 的访问是线程安全的。

示例代码

use std::sync::{Arc, Mutex};
use std::collections::HashMap;
use std::thread;

fn main() {
    // 创建一个被Arc<Mutex>包装的共享HashMap
    let map = Arc::new(Mutex::new(HashMap::new()));

    // 创建多个线程，每个线程向HashMap插入一个键值对
    let handles: Vec<_> = (0..5).map(|i| {
        let map = Arc::clone(&map);
        thread::spawn(move || {
            let mut guard = map.lock().unwrap();
            guard.insert(i, i * 10);
            println!("Thread {} inserted {} -> {}", i, i, i * 10);
        })
    }).collect();

    // 等待所有线程完成
    for handle in handles {
        handle.join().unwrap();
    }

    // 打印HashMap的最终状态
    let final_map = map.lock().unwrap();
    println!("Final map: {:?}", *final_map);
}

输出示例：

Thread 0 inserted 0 -> 0
Thread 1 inserted 1 -> 10
Thread 2 inserted 2 -> 20
Thread 3 inserted 3 -> 30
Thread 4 inserted 4 -> 40
Final map: {0: 0, 1: 10, 2: 20, 3: 30, 4: 40}

为什么会使用 `Arc<Mutex<HashMap<K, V>>>`

使用 Arc<Mutex<HashMap<K, V>>> 主要出于以下几个原因：

共享所有权：Arc 允许多个线程拥有对同一个 HashMap 的所有权，确保数据在多线程环境下的共享。
线程安全：Mutex 提供了互斥锁，确保同一时间只有一个线程可以访问或修改 HashMap，防止数据竞争和不一致性。
简单易用：这种组合方式在Rust中非常直观，适用于简单的并发场景，开发者容易理解和实现。

然而，随着应用规模的扩大和并发需求的增加，Arc<Mutex<HashMap<K, V>>> 的局限性也逐渐显现。

使用 `Arc<Mutex<HashMap<K, V>>>` 存在的问题

尽管 Arc<Mutex<HashMap<K, V>>> 在简单的多线程场景下效果良好，但在高并发和复杂应用中，可能会带来以下问题：

粗粒度锁导致的争用

问题描述：

当整个 HashMap 被一个 Mutex 锁定时，任何对 HashMap 的访问或修改操作都需要先获得锁。这种锁定方式被称为粗粒度锁定。粗粒度锁定会导致多个线程在访问不同键时相互阻塞，降低并发性能。

示例代码：

use std::sync::{Arc, Mutex};
use std::collections::HashMap;
use std::thread;

fn main() {
    let map = Arc::new(Mutex::new(HashMap::new()));

    let handles: Vec<_> = (0..5).map(|i| {
        let map = Arc::clone(&map);
        thread::spawn(move || {
            let mut guard = map.lock().unwrap();
            guard.insert(i, i * 10);
            println!("Thread {} inserted {} -> {}", i, i, i * 10);
        })
    }).collect();

    for handle in handles {
        handle.join().unwrap();
    }

    let final_map = map.lock().unwrap();
    println!("Final map: {:?}", *final_map);
}

问题展示：

即使多个线程访问不同的键，它们仍然需要等待锁释放，导致并发性能下降。

解决方案：

使用细粒度锁或无锁数据结构，如 DashMap，可以显著提高并发性能。

死锁风险

问题描述：

Mutex 可能导致死锁，尤其是在多个线程尝试以不同顺序获取多个锁时。虽然Rust的 Mutex 在恐慌或析构时会释放锁，但程序逻辑中的锁获取顺序不一致仍可能引发死锁。

示例代码：死锁

use std::sync::{Arc, Mutex};
use std::thread;
use std::time::Duration;

fn main() {
    let resource_a = Arc::new(Mutex::new(0));
    let resource_b = Arc::new(Mutex::new(0));

    let r1 = Arc::clone(&resource_a);
    let r2 = Arc::clone(&resource_b);
    let handle1 = thread::spawn(move || {
        let _lock_a = r1.lock().unwrap();
        println!("Thread 1: Locked resource A");
        thread::sleep(Duration::from_millis(50));
        let _lock_b = r2.lock().unwrap();
        println!("Thread 1: Locked resource B");
    });

    let r1 = Arc::clone(&resource_a);
    let r2 = Arc::clone(&resource_b);
    let handle2 = thread::spawn(move || {
        let _lock_b = r2.lock().unwrap();
        println!("Thread 2: Locked resource B");
        thread::sleep(Duration::from_millis(50));
        let _lock_a = r1.lock().unwrap();
        println!("Thread 2: Locked resource A");
    });

    handle1.join().unwrap();
    handle2.join().unwrap();
}

问题展示：

线程1锁定 resource_a 后尝试锁定 resource_b，而线程2先锁定 resource_b 后尝试锁定 resource_a，导致两者相互等待，形成死锁。

解决方案：

一致的锁定顺序：所有线程按照相同的顺序获取锁，避免循环等待。
使用 try_lock：尝试获取锁，若失败则退避或重试，避免无限期等待。

锁污染

问题描述：

如果一个线程在持有锁时发生恐慌（panic），Rust的 Mutex 会将其标记为“污染”（poisoned），后续尝试获取锁时会返回错误，增加了错误处理的复杂性。

示例代码：锁污染

use std::sync::{Arc, Mutex};
use std::thread;

fn main() {
    let data = Arc::new(Mutex::new(vec![]));

    let data_clone = Arc::clone(&data);
    let handle = thread::spawn(move || {
        let mut lock = data_clone.lock().unwrap();
        lock.push(42);
        println!("Thread 1: Pushed 42");
        panic!("Thread 1 panicked!");
    });

    let _ = handle.join();

    match data.lock() {
        Ok(lock) => {
            println!("Successfully acquired lock: {:?}", lock);
        }
        Err(poisoned) => {
            println!("Mutex is poisoned! Recovering...");
            let mut lock = poisoned.into_inner();
            lock.push(99);
            println!("Recovered data: {:?}", lock);
        }
    }
}

问题展示：

线程1在持有锁时发生恐慌，导致锁被污染。主线程在尝试获取锁时需要处理错误。

解决方案：

恢复数据：使用 into_inner() 方法安全地检索数据。
忽略污染：如果确定数据安全，可以忽略错误。
重启或中止操作：在关键系统中，可能需要重启或停止程序以防止进一步问题。

Mutex 锁定与解锁的开销

问题描述：

Mutex 在高并发场景下频繁的锁定与解锁操作会带来显著的性能开销，尤其是当操作需要频繁访问共享数据时。

示例代码：测量 Mutex 开销

use std::sync::{Arc, Mutex};
use std::sync::atomic::{AtomicUsize, Ordering};
use std::thread;
use std::time::Instant;

const NUM_THREADS: usize = 100;
const NUM_INCREMENTS: usize = 100_000;

fn main() {
    // Mutex保护的计数器
    let mutex_counter = Arc::new(Mutex::new(0));
    let mutex_start = Instant::now();

    // 创建线程，递增Mutex保护的计数器
    let mut handles = vec![];
    for _ in 0..NUM_THREADS {
        let counter = Arc::clone(&mutex_counter);
        handles.push(thread::spawn(move || {
            for _ in 0..NUM_INCREMENTS {
                let mut lock = counter.lock().unwrap();
                *lock += 1;
            }
        }));
    }

    // 等待所有线程完成
    for handle in handles {
        handle.join().unwrap();
    }

    let mutex_duration = mutex_start.elapsed();
    println!("Mutex counter: {}", *mutex_counter.lock().unwrap());
    println!("Time taken with Mutex: {:?}", mutex_duration);

    // 原子计数器
    let atomic_counter = Arc::new(AtomicUsize::new(0));
    let atomic_start = Instant::now();

    // 创建线程，递增原子计数器
    let mut handles = vec![];
    for _ in 0..NUM_THREADS {
        let counter = Arc::clone(&atomic_counter);
        handles.push(thread::spawn(move || {
            for _ in 0..NUM_INCREMENTS {
                counter.fetch_add(1, Ordering::SeqCst);
            }
        }));
    }

    // 等待所有线程完成
    for handle in handles {
        handle.join().unwrap();
    }

    let atomic_duration = atomic_start.elapsed();
    println!("Atomic counter: {}", atomic_counter.load(Ordering::SeqCst));
    println!("Time taken with AtomicUsize: {:?}", atomic_duration);
}

问题展示：

在高并发环境下，使用 Mutex 保护的计数器耗时明显多于使用原子操作的计数器。

输出示例：

Mutex counter: 10000000
Time taken with Mutex: 2.345678123s
Atomic counter: 10000000
Time taken with AtomicUsize: 0.123456789s

解决方案：

在仅需执行简单操作（如递增计数器）时，使用原子操作（AtomicUsize）可以避免锁的开销，提升性能。

缺乏细粒度控制

问题描述：

Mutex<HashMap<K, V>> 锁定整个 HashMap，无法对单个键值对进行独立控制。即便操作的是不同的键，仍需序列化，限制了并发性。

示例代码：缺乏细粒度控制

use std::sync::{Arc, Mutex};
use std::collections::HashMap;
use std::thread;
use std::time::Duration;

fn main() {
    let map = Arc::new(Mutex::new(HashMap::new()));

    // 插入一些初始值
    {
        let mut guard = map.lock().unwrap();
        guard.insert("key1", 10);
        guard.insert("key2", 20);
    }

    // 线程1：读取"key1"
    let map_reader = Arc::clone(&map);
    let reader_handle = thread::spawn(move || {
        let lock = map_reader.lock().unwrap();
        let value = lock.get("key1").copied().unwrap_or(0);
        println!("Reader thread: Read key1 -> {}", value);
    });

    // 线程2：更新"key2"
    let map_writer = Arc::clone(&map);
    let writer_handle = thread::spawn(move || {
        thread::sleep(Duration::from_millis(50)); // 确保读取线程先开始
        let mut lock = map_writer.lock().unwrap();
        lock.insert("key2", 30);
        println!("Writer thread: Updated key2 -> 30");
    });

    // 等待两个线程完成
    reader_handle.join().unwrap();
    writer_handle.join().unwrap();

    // 打印map的最终状态
    let final_map = map.lock().unwrap();
    println!("Final map: {:?}", *final_map);
}

问题展示：

尽管读取 key1 和写入 key2 是独立操作，但由于整个 HashMap 被锁定，导致操作必须序列化，限制了并发性。

解决方案：

使用细粒度锁或并发数据结构，如 DashMap，允许对不同键进行独立控制，提升并发性能。

什么时候使用或不使用 `Arc<Mutex<HashMap<K, V>>>`

适用场景

小规模数据结构：当 HashMap 较小，锁争用不严重时，使用 Arc<Mutex<HashMap<K, V>>> 简化了代码设计。
操作频率低：当对 HashMap 的操作较少或本身是串行化的，锁的开销影响较小。
性能要求不高：在性能不是关键因素的应用中，Arc<Mutex> 的简洁性优于其性能缺陷。

不适用场景

高并发访问：在高并发环境下，Arc<Mutex<HashMap<K, V>>> 的锁争用会显著降低性能。
复杂并发操作：需要对不同键进行独立控制或进行复杂的并发操作时，Arc<Mutex<HashMap<K, V>>> 无法满足需求。
性能敏感应用：在对性能有严格要求的应用中，应选择更高效的并发数据结构或同步机制。

替代解决方案

1. DashMap

介绍：

DashMap 是一个线程安全的并发哈希映射，支持细粒度锁定。它允许多个线程同时读取或写入不同的键，而不会相互阻塞。

优势：

细粒度锁定：仅锁定特定键的桶，允许更高的并发性。
易用性：与 HashMap 类似的API，易于上手。
高性能：显著减少锁争用，提高并发性能。

示例代码：

use dashmap::DashMap;
use std::thread;

fn main() {
    let map = DashMap::new();

    let handles: Vec<_> = (0..5).map(|i| {
        let map = map.clone();
        thread::spawn(move || {
            map.insert(i, i * 10);
            println!("Thread {} inserted {} -> {}", i, i, i * 10);
        })
    }).collect();

    for handle in handles {
        handle.join().unwrap();
    }

    println!("Final map: {:?}", map);
}

输出示例：

Thread 0 inserted 0 -> 0
Thread 1 inserted 1 -> 10
Thread 2 inserted 2 -> 20
Thread 3 inserted 3 -> 30
Thread 4 inserted 4 -> 40
Final map: {0: 0, 1: 10, 2: 20, 3: 30, 4: 40}

2. `RwLock<HashMap<K, V>>`

介绍：

RwLock（读写锁）允许多个线程同时读取数据，但在写入时需要独占锁。适用于读多写少的场景。

优势：

高并发读操作：多个读者可以并行访问数据，不会互相阻塞。
灵活性：在需要写入时仍然提供独占访问。

示例代码：

use std::sync::{Arc, RwLock};
use std::collections::HashMap;
use std::thread;

fn main() {
    let map = Arc::new(RwLock::new(HashMap::new()));

    // 写入操作
    {
        let mut write_guard = map.write().unwrap();
        write_guard.insert("key1", 10);
        write_guard.insert("key2", 20);
    }

    // 读取操作
    let map_reader = Arc::clone(&map);
    let reader_handle = thread::spawn(move || {
        let read_guard = map_reader.read().unwrap();
        if let Some(value) = read_guard.get("key1") {
            println!("Found: {}", value);
        }
    });

    // 写入操作
    let map_writer = Arc::clone(&map);
    let writer_handle = thread::spawn(move || {
        let mut write_guard = map_writer.write().unwrap();
        write_guard.insert("key2", 30);
        println!("Updated key2 -> 30");
    });

    reader_handle.join().unwrap();
    writer_handle.join().unwrap();

    // 打印最终状态
    let final_map = map.read().unwrap();
    println!("Final map: {:?}", *final_map);
}

输出示例：

Found: 10
Updated key2 -> 30
Final map: {"key1": 10, "key2": 30}

3. `tokio::sync::Mutex`（适用于异步代码）

介绍：

在异步应用中，应使用 tokio::sync::Mutex 而不是标准库的 std::sync::Mutex。

它允许线程在等待锁时让出，避免阻塞整个线程，适合异步运行时高效管理任务。

优势：

异步兼容：不会阻塞异步任务，允许其他任务在等待锁时运行。
提高异步运行时效率：任务可以在等待锁时让出，提升整体并发性能。

示例代码：

use std::sync::Arc;
use tokio::sync::Mutex;
use tokio::task;
use std::time::Duration;

#[tokio::main]
async fn main() {
    let counter = Arc::new(Mutex::new(0));

    let mut handles = vec![];

    for _ in 0..5 {
        let counter = Arc::clone(&counter);
        let handle = task::spawn(async move {
            tokio::time::sleep(Duration::from_millis(100)).await;
            let mut lock = counter.lock().await;
            *lock += 1;
            println!("Counter incremented to: {}", *lock);
        });
        handles.push(handle);
    }

    for handle in handles {
        handle.await.unwrap();
    }

    let final_value = *counter.lock().await;
    println!("Final counter value: {}", final_value);
}

输出示例：

Counter incremented to: 1
Counter incremented to: 2
Counter incremented to: 3
Counter incremented to: 4
Counter incremented to: 5
Final counter value: 5

为何使用 tokio::sync::Mutex：

在异步应用中，使用 std::sync::Mutex 会阻塞整个线程，阻碍其他异步任务的运行。
而 tokio::sync::Mutex 允许任务在等待锁时让出，确保异步运行时的高效调度和执行。

总结

在Rust中，Arc<Mutex<HashMap<K, V>>> 是一种常见的并发数据结构组合，适用于简单和低并发的场景。

然而，在高并发和复杂应用中，它的锁争用、死锁风险、锁污染以及性能开销等问题使其不再是最佳选择。

幸运的是，Rust生态系统提供了多种替代方案，如 DashMap、RwLock 和 tokio::sync::Mutex，这些工具能够更高效地处理并发访问，提升应用性能和可靠性。

选择合适的并发数据结构和同步机制，是编写高效、安全Rust程序的关键。根据具体应用场景，权衡性能与复杂性，做出最适合的设计选择，才能充分发挥Rust语言在并发编程中的优势。

希望这篇博客能够帮助您更好地理解在Rust中使用 Arc<Mutex<HashMap<K, V>>> 的潜在问题及其替代方案，从而在实际项目中做出更明智的选择。

参考

Rustls 的性能超越 OpenSSL 和 BoringSSL

Rust

ISRG 近年来一直在大力投资 Rustls TLS 库。我们的目标是创建一个既能保证内存安全又在性能上领先的库。

今年一月，我们发布了一篇关于我们性能之旅起点的文章。从那时起，我们取得了长足的进步，今天我们很高兴分享 Rustls 性能的最新进展。

什么是 Rustls？

Rustls 是一个内存安全的 TLS 实现，专注于性能。它已经可以用于生产环境，并在广泛的应用中使用。您可以在维基百科上了解更多关于其历史的信息。

Rustls 提供 C API 和 FIPS 支持，使我们能够将内存安全和性能带给广泛的现有程序。

这一点很重要，因为 OpenSSL 及其衍生产品在互联网上被广泛使用，长期以来存在内存安全漏洞，今年又发现了更多漏洞。

是时候让互联网摆脱基于 C 的 TLS 了。

握手性能

我们首先来看一下在相同硬件和相同资源限制下每秒可以完成的握手次数。

这些测试连接一个客户端到一个服务器，通过内存缓冲区进行，并测量客户端和服务器处理时的时间，因此在没有网络延迟或系统调用开销的情况下，它们提供了性能的上限。

BoringSSL vs OpenSSL vs Rustls resumption performance

resumed handshakes per second

Rustls 在每个测试场景中都领先。

吞吐量性能

接下来，我们看一下在相同硬件和相同资源限制下的吞吐量，以每秒兆字节为单位：

BoringSSL vs OpenSSL vs Rustls transfer performance

Rustls 在所有测试中也同样表现出色。

测试方法

测试是在 Debian Linux 上进行的，使用的是裸机 Intel Xeon E-2386G CPU，禁用了超线程和动态频率缩放，并将 CPU 缩放调节器设置为所有核心的性能模式。更多细节可以在这里找到。

尝试 Rustls！

Rustls 已经可以用于生产环境，我们鼓励大家试用它。除了内存安全和出色的性能，它还提供：

C 和 Rust API
FIPS 支持
后量子密钥交换（即将更新算法）
加密客户端 Hello（客户端侧）
操作系统信任验证器支持

链接

原文链接

Rust 1.82 新特性介绍

Rust

2024年10月17日，Rust 发布团队宣布发布 Rust 1.82.0。 Rust 是一门编程语言，旨在帮助每个人构建可靠且高效的软件。

如果您已经通过 rustup 安装了之前版本的 Rust，可以通过以下命令更新到 1.82.0：

$ rustup update stable

如果您还没有安装 rustup，可以从我们网站的相关页面获取，并查看 1.82.0 的详细发行说明。

Rust 1.82.0 中的新特性

Cargo 信息命令

Cargo 现在有一个新的 info 子命令，用于显示注册表中某个包的信息。

这一功能满足了一个接近十年历史的请求！例如，您可以通过 cargo info cc 查看以下信息：

cc #build-dependencies
A build-time dependency for Cargo build scripts to assist in invoking the native
C compiler to compile native C code into a static archive to be linked into Rust
code.
version: 1.1.23 (latest 1.1.30)
license: MIT OR Apache-2.0
rust-version: 1.63
documentation: https://docs.rs/cc
homepage: https://github.com/rust-lang/cc-rs
repository: https://github.com/rust-lang/cc-rs
crates.io: https://crates.io/crates/cc/1.1.23
features:
  jobserver = []
  parallel  = [dep:libc, dep:jobserver]
note: to see how you depend on cc, run `cargo tree --invert --package cc@1.1.23`

Apple 目标提升

macOS 在 64 位 ARM 上成为 Tier 1：Rust 目标 aarch64-apple-darwin 现在是 Tier 1 目标，表示我们对其正常工作的最高保证。
Mac Catalyst 目标成为 Tier 2：Mac Catalyst 是 Apple 的一项技术，允许在 Mac 上本地运行 iOS 应用程序。现在这些目标是 Tier 2，可以通过 rustup target add aarch64-apple-ios-macabi x86_64-apple-ios-macabi 下载。

精确捕获的 `use<..>` 语法

Rust 现在支持在某些 impl Trait 边界中使用 use<..> 语法来控制捕获哪些泛型生命周期参数。这使得在返回位置 impl Trait 类型中捕获泛型参数更加精确。

原生语法创建原始指针

Rust 现在提供了原生语法来创建原始指针：

addr_of!(expr) 变为 &raw const expr
addr_of_mut!(expr) 变为 &raw mut expr

安全项与不安全 extern

Rust 代码可以使用来自外部代码的函数和静态变量。

现在允许在 extern 块中使用 unsafe extern，并在其中标记某些项为安全使用。

不安全属性

某些 Rust 属性，如 no_mangle，可以在没有任何不安全块的情况下导致未定义行为。

现在这些属性被视为“不安全”，应该写为：

#[unsafe(no_mangle)]
pub fn my_global_function() { }

模式匹配中省略空类型

可以省略匹配空类型的模式：

use std::convert::Infallible;
pub fn unwrap_without_panic<T>(x: Result<T, Infallible>) -> T {
    let Ok(x) = x;
    x
}

浮点 NaN 语义和 const

Rust 现在标准化了 NaN 值的行为规则，并允许在 const fn 中使用浮点运算。

Trait-gen：Trait 实现生成宏

Rust

概述

trait-gen 是一个提供 trait 实现生成的属性宏的库。

它允许为多种类型生成 trait 实现，而无需自定义声明宏、代码重复或通用实现，从而使代码更易于阅读和维护。

使用示例

以下是一个简单的示例：

use trait_gen::trait_gen;

#[trait_gen(T -> u8, u16, u32, u64, u128)]
impl MyLog for T {
    fn my_log2(self) -> u32 {
        T::BITS - 1 - self.leading_zeros()
    }
}

trait_gen 属性将 T 替换为给定的类型，生成如下代码：

impl MyLog for u8 {
    fn my_log2(self) -> u32 {
        u8::BITS - 1 - self.leading_zeros()
    }
}
impl MyLog for u16 {
    fn my_log2(self) -> u32 {
        u16::BITS - 1 - self.leading_zeros()
    }
}
// 其他类型依此类推

使用方法

该属性放置在伪泛型实现代码之前。 泛型参数首先给出，后跟右箭头（->）和类型参数列表。

#[trait_gen(T -> Type1, Type2, Type3)]
impl Trait for T {
    // ...
}

属性宏会依次将代码中的泛型参数 T 替换为后续类型（Type1、Type2、Type3），生成所有实现。

所有以 T 开头的类型路径都会被替换。

例如，T::default() 会生成 Type1::default()、Type2::default() 等，但 super::T 保持不变，因为它属于另一个作用域。

代码必须与所有类型兼容，否则编译器将触发相关错误。例如，#[trait_gen(T -> u64, f64)] 不能应用于 let x: T = 0;，因为 0 不是有效的浮点字面量。

实际类型还会替换文档注释、宏和字符串字面量中的任何 ${T} 出现。

注意事项

使用字母 "T" 不是强制性的，任何类型路径都可以。例如，gen::Type 也是可以的。但为了提高可读性，建议使用简短的大写标识符。
可以链式使用两个或多个属性以生成所有组合。
trait_gen 也可以用于类型实现。

动机

生成多个实现的方法有几种：

手动复制
使用声明宏
使用通用实现

上面的实现示例可以通过声明宏实现：

macro_rules! impl_my_log {
    ($($t:ty)*) => (
        $(impl MyLog for $t {
            fn my_log2(self) -> u32 {
                $t::BITS - 1 - self.leading_zeros()
            }
        })*
    )
}

impl_my_log! { u8 u16 u32 u64 u128 }

但这种方法冗长且比原生代码难以阅读。

我们必须每次编写自定义宏，包括其声明、模式和一些元素的转换（如参数 $t）。

此外，IDE 通常无法提供上下文帮助或在宏代码中应用重构。

使用通用实现还有其他缺点：

除了同一 crate 中未被通用实现覆盖的类型外，禁止任何其他实现。
找到对应的 trait 并不总是可能。虽然 num crate 对原始类型提供了很多帮助，但并不是所有情况都涵盖。
即使操作和常量被 trait 覆盖，也很快需要一长串 trait 约束。

示例

以下是支持的替换示例，库的集成测试中还有更多示例。

第一个示例更多是说明什么被替换，什么不被替换，而不是实际实现：

#[trait_gen(U -> u32, i32, u64, i64)]
impl AddMod for U {
    fn add_mod(self, other: U, m: U) -> U {
        const U: U = 0;
        let zero = U::default();
        let offset: super::U = super::U(0);
        (self + other + U + zero + offset.0 as U) % m
    }
}

扩展为（我们只展示第一个类型，u32）：

impl AddMod for u32 {
    fn add_mod(self, other: u32, m: u32) -> u32 {
        const U: u32 = 0;
        let zero = u32::default();
        let offset: super::U = super::U(0);
        (self + other + U + zero + offset.0 as u32) % m
    }
}

复杂示例

以下示例展示了如何使用类型参数：

struct Meter<U>(U);
struct Foot<U>(U);

trait GetLength<T> {
    fn length(&self) -> T;
}

#[trait_gen(U -> f32, f64)]
impl GetLength<U> for Meter<U> {
    fn length(&self) -> U {
        self.0 as U
    }
}

该属性可以与另一个属性组合，以创建泛型组合，实现 Meter<f32>、Meter<f64>、Foot<f32>、Foot<f64> 的 trait：

#[trait_gen(T -> Meter, Foot)]
#[trait_gen(U -> f32, f64)]
impl GetLength<U> for T<U> {
    fn length(&self) -> U {
        self.0 as U
    }
}

这将扩展为：

impl GetLength<f32> for Meter<f32> {
    fn length(&self) -> f32 { self.0 as f32 }
}
impl GetLength<f64> for Meter<f64> {
    fn length(&self) -> f64 { self.0 as f64 }
}
impl GetLength<f32> for Foot<f32> {
    fn length(&self) -> f32 { self.0 as f32 }
}
impl GetLength<f64> for Foot<f64> {
    fn length(&self) -> f64 { self.0 as f64 }
}

多段路径（带有 :: 的路径）和路径参数（如 <f32>）也可以用于参数中。

例如，使用 gen::U 可以避免与已经定义的单字母类型混淆。

遗留格式

早期版本中使用了较短的格式，尽管仍然支持，但可能更难阅读：

#[trait_gen(Type1, Type2, Type3)]
impl Trait for Type1 {
    // ...
}

在这里，Type1 的代码将按原样生成，然后 Type2 和 Type3 将替换 Type1 以生成它们的实现。这是等效属性的快捷方式。

替代格式

当启用 in_format 特性时，还支持替代格式：

trait-gen = { version="0.3", features=["in_format"] }

在这里，使用 in 替代箭头 ->，且参数类型必须放在方括号中：

#[trait_gen(T in [u8, u16, u32, u64, u128])]
impl MyLog for T {
    fn my_log2(self) -> u32 {
        T::BITS - 1 - self.leading_zeros()
    }
}

使用此格式会发出“已弃用”的警告，可以通过在文件顶部添加 #![allow(deprecated)] 指令或在生成的代码中添加 #[allow(deprecated)] 来关闭。

限制

trait_gen 属性的过程宏无法处理作用域，因此不支持任何与泛型参数相同字面量的类型声明。

例如，以下代码因泛型函数冲突而无法编译：

#[trait_gen(T -> u64, i64, u32, i32)]
impl AddMod for T {
    type Output = T;

    fn add_mod(self, rhs: Self, modulo: Self) -> Self::Output {
        fn int_mod<T: Num> (a: T, m: T) -> T { // <== 错误，冲突的 'T'
            a % m
        }
        int_mod(self + rhs, modulo)
    }
}

泛型参数必须是类型路径；不能是更复杂的类型，如引用或切片。

兼容性

trait-gen crate 在 Windows 64 位和 Linux 64/32 位平台上测试了 rustc 1.58.0 及更高版本。

链接

trait-gen

三种 Unwrap 的类型

Rust

在 Rust 中，我编写了很多应用程序，因此发现自己经常使用 .unwrap()，这比我编写整洁的库时要多得多。

我经常遇到的问题是，过了一天或一周后，我总是记不清当初为什么要使用 .unwrap()。我真的希望在这种情况下让应用程序崩溃吗？还是我只是匆忙证明我的其他代码有效，想要稍后再实现错误处理？

我认为有三种不同的 unwrap，每种都有不同的语义，程序员应该以不同的方式对待它们。

作为 panic!() 的 Unwrap

第一种 unwrap 是显而易见的；我之所以 unwrap，是因为如果发生这种情况，我们就应该崩溃。

一个很好的例子是在某些 Web 服务器代码中：

let app = Router::new().route("/", get(get_info));
let address_str = format!("{address}:{port}");

// 如果我们给出的地址或端口无效，我们无法做任何事情。就崩溃吧！
let addr: SocketAddr = address_str.parse().unwrap();

// 如果无法打开 tcp 套接字，我们无法做任何事情。就崩溃吧！
let listener = TcpListener::bind(&addr).await.unwrap();

// 如果我们的 Web 服务器意外崩溃，我们也应该崩溃！
axum::serve(listener, app.into_make_service()).await.unwrap();

所有这些 .unwrap() 的目的是相同的。如果我们无法做到这一点，就崩溃。

这些 unwrap 也是故意存在的。它们是为了处理真实的错误情况，而不是错误处理的占位符。此外，所有这些错误情况都是可能发生的，我们只是不想去考虑它们。

作为 unreachable!() 的 Unwrap

第二种 panic 不太明显，但尤其在编写大量静态变量时会出现。

一个很好的例子是声明正则表达式：

// 我们在这里 unwrap 不是因为不关心错误情况，而是因为
// 我们的错误情况是绝对无法到达的！
static HEXADECIMAL_REGEX: LazyLock<Regex> = LazyLock::new(|| Regex::new("^[0-9a-f]*$").unwrap());

这个 unwrap 的目的与我们 Web 服务器示例中的不同。我们 unwrap 是因为这个错误情况根本不可能发生。尽管如此，这个 .unwrap() 是故意的，并不是错误处理的占位符。

作为 todo!() 的 Unwrap

每个在 Rust 中编写过应用程序的人都犯过使用 .unwrap() 的错误，心想“我稍后会处理错误，我只是想看看我的代码在正常路径上是否有效。”

实际上，任何在 Rust 中处理大型应用程序的人可能都花了大量时间追踪这些被遗忘的“临时”unwrap！

一个不错的例子是在快速而肮脏的 Rust 代码中：

// 啊，我稍后会更好地处理这个
let age: i32 = user_input.parse().unwrap();

// 或者...啊，这个文件存在，但我稍后会更好地处理。
let file: Vec<u8> = fs::read("data.txt").unwrap();

这段代码很肮脏，但在你只是想证明某些东西有效时，这种写法很常见。

这个 unwrap 的目的与其他的截然不同。我们 unwrap 是因为我们尚未实现错误处理。

那么，这有什么意义？

我所要指出的是，.unwrap() 在代码中可以有三种不同的原因：

如果我们无法做到这一点，我们就应该崩溃（类似 panic!()）
这种情况是不可能的（类似 unreachable!()）
我需要稍后处理错误（类似 todo!()）

但这里绝对关键的问题是，这些信息并没有存储在代码中，而是存储在你的脑海中。

有些人会在周围写评论，比如 // TODO 或 // cannot happen。

有些人使用 .expect("todo") 或 .expect("must be valid regex")。我认为这些都是肮脏的黑客行为，仍然无法准确保留我们为什么要 unwrap 的语义。

我们已经有了类似的“语义崩溃”的先例，使用 todo!() 和 unreachable!() 宏。为什么不在这里也使用它们呢？

你有什么建议？

我写了一份 RFC，提出了两个新的方法用于 Result 和 Option，旨在明确这些语义，并防止对 unwrap 的混淆。

你可以在这里阅读提案，简单来说就是：

// unwrap 仍然用于类似 panic!() 的情况
TcpListener::bind(&addr).unwrap();

// 我们崩溃是因为错误处理尚未实现。
// 这种用例在原型应用程序中很常见。
let int: i32 = input.parse().todo();
let arg2 = std::env::args().nth(2).todo();
let data: Vec<u8> = fs::read("data.txt").todo();

// 这些错误状态是无法到达的。
// 这种用例在静态声明中很常见。
NonZeroU32::new(10).unreachable();
Regex::new("^[a-f]{5}$").unreachable();

它提议了 Option::todo、Option::unreachable、Result::todo 和 Result::unreachable 函数。

这些函数分别与 todo!() 和 unreachable!() 宏具有类似的目的。

如果在标准库中实现了这些功能，#[clippy::todo] 和其他特性可以指出不应进入生产环境的临时 unwrap。

如果这对你有用，或者这是你之前遇到过的问题，我很想在 RFC 中听听你的想法！对我个人来说，这些函数将带来很大的价值。

命名的附注

RFC 提到我们也可以将这些函数命名为 unwrap_todo 和 unwrap_unreachable。我对此有些怀疑，因为 unwrap_todo 输入字符较多，我不确定在懒惰的上下文中，函数是否会被忽略。

我认为单独使用 .todo() 作为一个函数并不是特别令人困惑；它肯定没有比 .expect() 更令人困惑。

链接

原文链接

目录​

引言​

上下文回顾​

任务基础​

关键概念速览​

快速上手示例​

任务的定义与作用​

关键区别：​

实际使用示例：​

任务的生命周期​

任务的核心组件​

动态分发（Dyn）​

为什么需要动态分发​

性能考虑​

Spawn 机制​

基本概念​

实现细节​

JoinHandle​

设计思想​

唤醒机制​

Waker 的作用​

实践示例​

基础使用模式​

高级应用场景​

任务取消​

最佳实践与性能优化​

任务粒度​

批处理优化示例​

资源管理​

资源限制​

连接池管理​

超时控制​

错误处理​

健壮的错误处理模式​

任务粒度优化​

参考资料​

目录​

引言​

为什么需要派生宏？​

派生宏基础​

工作原理​

常见的标准库派生宏​

语法规则​

创建自定义派生宏​

基本步骤​

工具链介绍​

生产环境中的派生宏应用​

常见使用场景​

流行的派生宏库​

最佳实践​

高级主题​

条件派生​

自定义错误处理​

性能优化​

测试与调试​

单元测试​

调试技巧​

总结与展望​

参考资料​

目录​

引言​

Futures概述​

什么是Futures​

Futures的基本组成​

代码示例解析​

foo函数的异步实现​

foo函数的同步实现​

JoinAll的实现​

异步实现​

同步实现​

自定义Sleep实现​

异步实现​

同步实现​

唤醒机制（Wake）​

理解Context和Waker​

修改Sleep实现​

主函数的实现​

Pin、Cancellation与Recursion​

Pin​

示例：​

目录

引言

上下文回顾

任务基础

关键概念速览

快速上手示例

任务的定义与作用

关键区别：

实际使用示例：

任务的生命周期

任务的核心组件

动态分发（`Dyn`）

为什么需要动态分发

性能考虑

Spawn 机制

基本概念

实现细节

`JoinHandle`

设计思想

唤醒机制

`Waker` 的作用

实践示例

基础使用模式

高级应用场景

任务取消

最佳实践与性能优化

任务粒度

批处理优化示例

资源管理

资源限制

连接池管理

超时控制

错误处理

健壮的错误处理模式

任务粒度优化

参考资料

目录

引言

为什么需要派生宏？

派生宏基础

工作原理

常见的标准库派生宏

语法规则

创建自定义派生宏

基本步骤

工具链介绍

生产环境中的派生宏应用

常见使用场景

流行的派生宏库

最佳实践

高级主题

条件派生

自定义错误处理

性能优化

测试与调试

单元测试

调试技巧

总结与展望

参考资料

目录

引言

Futures概述

什么是Futures

Futures的基本组成

代码示例解析

`foo`函数的异步实现

`foo`函数的同步实现

JoinAll的实现

异步实现

同步实现

自定义Sleep实现

异步实现

同步实现

唤醒机制（Wake）

理解`Context`和`Waker`

修改Sleep实现

主函数的实现

`Pin`、`Cancellation`与`Recursion`

`Pin`

示例：