2024年07月30日玄貓（BlackCat）

Rust 管道設計與多執行緒效能最佳化

本文探討 Rust 管道設計與多執行緒效能最佳化，涵蓋管道處理程式設計、通道特性與效能分析、同步通道的應用、Send 和 Sync 特性在執行緒安全中的作用，以及 Mutex 在多執行緒環境下分享可變狀態的管理，並以多人遊戲伺服器中玩家等待列表的管理為例說明 Mutex 的應用。

程式語言系統設計

Rust 多執行緒管道通道 Mutex 效能最佳化

Rust 的多執行緒模型提供強大的平行處理能力，管道設計模式能有效地將複雜任務分解成多個階段，利用多執行緒提升處理效率。然而，實際應用中管道的效能瓶頸往往受限於最慢的階段。本文以檔案索引建立的五階段管道為例，分析了檔案索引階段的效能瓶頸，並探討如何透過程式碼最佳化、任務拆分和多執行緒策略來改善效能。此外，文章探討了 Rust 通道的特性，包括多生產者單消費者模型、通道效能最佳化策略以及同步通道的使用。更進一步地，文章闡述了 Send 和 Sync 特性在確保執行緒安全中的重要性，並以實際程式碼片段說明其應用場景。最後，文章以多人遊戲伺服器中的玩家等待列表管理為例，詳細介紹瞭如何使用 Mutex 保護分享可變狀態，確保多執行緒環境下的資料一致性和程式穩定性。

管道處理程式的設計與實作

在現代的軟體開發中，多執行緒的處理能力對於提升程式的效能至關重要。管道（Pipeline）是一種常見的設計模式，用於將任務分解成多個階段，並利用多執行緒或多程式平行處理，以提高整體的處理效率。本文將探討如何設計和實作一個管道處理程式，特別是在處理大量檔案時的索引建立。

管道處理的基本概念

管道處理的核心思想是將一個複雜的任務分解成多個簡單的子任務，每個子任務由一個獨立的執行緒或程式負責。這種方式可以充分利用多核處理器的能力，提高程式的平行處理能力。

在本文的例子中，我們將建立一個五階段的管道，用於處理大量檔案的索引建立。第一階段負責讀取檔案內容，第二階段對檔案內容建立索引，第三階段合併多個索引，第四階段將合併後的索引寫入磁碟，第五階段則是對磁碟上的索引檔案進行最終的合併。

第一階段：檔案讀取

第一階段的主要任務是讀取檔案內容，並將其傳送到通道（Channel）中，供後續階段使用。以下是相關程式碼：

let mut text = String::new();
f.read_to_string(&mut text)?;
if sender.send(text).is_err() {
    break;
}

內容解密：

let mut text = String::new();：建立一個新的空字串 text 用於儲存檔案內容。
f.read_to_string(&mut text)?;：將檔案內容讀取到 text 中，若發生錯誤則提前傳回。
if sender.send(text).is_err() { break; }：將 text 傳送到通道中，若傳送失敗（通常是因為接收端已經被丟棄），則離開迴圈。

第二階段：索引建立

第二階段負責接收第一階段傳送的檔案內容，並為每個檔案建立索引。以下是相關程式碼：

for (doc_id, text) in texts.into_iter().enumerate() {
    let index = InMemoryIndex::from_single_document(doc_id, text);
    if sender.send(index).is_err() {
        break;
    }
}

內容解密：

for (doc_id, text) in texts.into_iter().enumerate() {：遍歷接收到的檔案內容，並為每個檔案分配一個 doc_id。
let index = InMemoryIndex::from_single_document(doc_id, text);：為每個檔案建立一個記憶體索引。
if sender.send(index).is_err() { break; }：將建立好的索引傳送到下一個階段，若傳送失敗則離開迴圈。

管道的執行

整個管道的執行涉及多個階段的協同工作，每個階段都負責特定的任務，並透過通道進行資料傳遞。最後，透過檢查各個階段的執行結果來確保整個管道的正確執行。

fn run_pipeline(documents: Vec<PathBuf>, output_dir: PathBuf) -> io::Result<()> {
    // 省略具體實作
}

內容解密：

fn run_pipeline(documents: Vec<PathBuf>, output_dir: PathBuf) -> io::Result<()> {：定義了一個函式 run_pipeline，用於啟動整個管道的執行。
該函式負責協調各個階段的執行，並最終傳回執行結果。

Rust 通道（Channel）效能與執行緒安全

管道效能瓶頸分析

在前述範例中，我們成功地將檔案處理流程以多執行緒方式實作，達到 40% 的效能提升。然而，這樣的效能增幅相較於 Mandelbrot 程式的 675% 提升顯得有些遜色。主要原因在於管道效能受限於最慢的階段，即檔案索引階段（第二階段）成為了整個流程的瓶頸。

瓶頸成因分析

檔案索引階段大量使用了 .to_lowercase() 和 .is_alphanumeric() 方法，這些操作涉及 Unicode 表格的查詢，耗費了大量運算資源。下游階段大多處於等待輸入的狀態，因此整個管道的處理速度受限於此階段。

改善瓶頸的方法

最佳化索引程式碼：針對第二階段的程式碼進行手動最佳化，以提升執行效率。
將工作分割成多個階段：將檔案索引階段進一步拆分為多個子階段，以提高平行度。
執行多個檔案索引執行緒：同時執行多個檔案索引執行緒，以充分利用多核心 CPU 的運算能力。

通道（Channel）特性與效能

Rust 的通道實作支援多生產者、單一消費者（mpsc）的通訊模式。雖然範例程式中使用的是單一傳送者對應單一接收者的模式，但 Rust 的通道也支援多個傳送者共用同一個接收者的場景。

多傳送者實作

透過 Sender<T> 的 clone 方法，可以建立多個傳送者並將其移動到不同的執行緒中。

use std::sync::mpsc::channel;
let (sender, receiver) = channel();
// Clone sender and move it to another thread
let sender_clone = sender.clone();

接收者的限制

Receiver<T> 無法被複製，因此若需要在多個執行緒中接收相同通道的值，需要使用 Mutex 進行同步控制。

通道效能最佳化

Rust 的通道實作經過精心最佳化：

初始「一次性」佇列實作：對於只傳送一次值的通道，開銷極小。
動態切換佇列實作：當傳送第二個值時，切換到更適合大量資料傳輸的佇列實作。
支援多傳送者的實作：當 Sender 被複製時，通道會切換到支援多執行緒傳送的實作。

儘管如此，應用程式仍可能犯下傳送速度超過接收速度的錯誤，導致通道中累積大量待處理資料，造成記憶體浪費和快取命中率下降。為此，Rust 提供了同步通道（synchronous channel）來解決此問題。

同步通道（Synchronous Channel）

同步通道允許指定通道可容納的最大值數量，當通道已滿時，sender.send(value) 操作將被阻塞，直到通道中有空間可用。

use std::sync::mpsc::sync_channel;
let (sender, receiver) = sync_channel(1000); // 指定通道容量為 1000

在範例程式中，將 start_file_reader_thread 中的通道改為容量為 32 的同步通道後，記憶體使用量減少了三分之二，而處理量並未下降。

執行緒安全：Send 和 Sync 特性

Rust 的執行緒安全依賴於 std::marker::Send 和 std::marker::Sync 兩個內建特性：

實作 Send 的型別可以安全地按值傳遞到其他執行緒。
實作 Sync 的型別可以安全地透過非變異參照在執行緒間共用。

這些特性確保了資料在執行緒間傳遞的安全性，避免了資料競爭和其他未定義行為。

範例分析

在 process_files_in_parallel 範例中，將 Vec<String> 從父執行緒傳遞到子執行緒，這意味著向量及其字串是在父執行緒中組態的記憶體，並被移動到子執行緒中。這種操作的安全性依賴於 Vec<String> 實作了 Send 特性。

內容解密：

let (sender, receiver) = sync_channel(1000);：建立一個容量為 1000 的同步通道，用於控制資料傳輸的速度，避免因傳送速度過快而導致記憶體使用量過高。
同步通道的阻塞機制：在通道已滿時，sender.send(value) 操作將被阻塞，直到通道中有空間可用，這種機制有效地避免了因傳送速度過快而導致的記憶體浪費。
Send 和 Sync 特性：這兩個特性是 Rust 執行緒安全的基礎，確保了資料在執行緒間的安全傳遞。實作 Send 的型別可以安全地按值傳遞到其他執行緒，而實作 Sync 的型別可以安全地透過非變異參照在執行緒間共用。

@startuml
skinparam backgroundColor #FEFEFE
skinparam defaultTextAlignment center
skinparam rectangleBackgroundColor #F5F5F5
skinparam rectangleBorderColor #333333
skinparam arrowColor #333333

title 範例分析

rectangle "資料" as node1
rectangle "索引資料" as node2
rectangle "合併資料" as node3
rectangle "寫入結果" as node4
rectangle "阻塞" as node5
rectangle "等待" as node6

node1 --> node2
node2 --> node3
node3 --> node4
node4 --> node5
node5 --> node6

@enduml

此圖示說明瞭檔案處理流程中的各個階段以及同步通道的阻塞控制機制。

內容解密：

圖表中展示了檔案處理流程的五個主要階段：檔案讀取、檔案索引、記憶體合併、索引寫入和最終合併。
同步通道的阻塞機制有效地控制了資料傳輸的速度，避免了因傳送速度過快而導致的記憶體使用量過高。
圖表清晰地呈現了各個階段之間的資料流動關係以及同步通道在控制傳送速度方面的作用。

多執行緒程式設計中的 Send 與 Sync 特性

在 Rust 中，Send 和 Sync 是兩個非常重要的特性（trait），它們與多執行緒程式設計中的資料安全分享息息相關。瞭解這兩個特性對於編寫高效且安全的平行程式碼至關重要。

Send 特性

Send 特性表示一個型別可以安全地在執行緒之間傳遞。當一個型別實作了 Send 特性時，意味著它的值可以被移動到另一個執行緒中。這對於需要在不同執行緒中處理資料的情況非常重要。

大多數 Rust 標準函式庫中的型別都實作了 Send 特性，例如 Vec 和 String。這是因為它們內部使用了執行緒安全的分配器。

let vec = vec![1, 2, 3];
std::thread::spawn(move || {
    println!("{:?}", vec);
});

在上面的例子中，vec 被移動到新的執行緒中，這是安全的，因為 Vec 實作了 Send。

Sync 特性

Sync 特性表示一個型別可以被多個執行緒安全地分享。當一個型別實作了 Sync 特性時，意味著它的參照可以被多個執行緒分享而不會導致資料競爭。

use std::sync::{Arc, Mutex};
use std::thread;

let counter = Arc::new(Mutex::new(0));
let mut handles = vec![];

for _ in 0..10 {
    let counter_clone = Arc::clone(&counter);
    let handle = thread::spawn(move || {
        let mut num = counter_clone.lock().unwrap();
        *num += 1;
    });
    handles.push(handle);
}

for handle in handles {
    handle.join().unwrap();
}

println!("Result: {}", *counter.lock().unwrap());

在這個例子中，Arc（原子參照計數）和 Mutex（互斥鎖）一起使用來分享和修改一個計數器。Arc 實作了 Sync 和 Send，使得它可以被多個執行緒安全地分享。

為什麼某些型別不是 Send 或 Sync

某些型別，如 Rc（參照計數），不是 Send 或 Sync，因為它們內部使用了非執行緒安全的機制。例如，Rc 使用非原子操作來管理參照計數，這在多執行緒環境中是不安全的。

use std::rc::Rc;
use std::thread;

let rc = Rc::new(5);
let rc_clone = rc.clone();

// 這段程式碼無法編譯，因為 Rc 不是 Send
thread::spawn(move || {
    println!("{:?}", rc_clone);
});

嘗試編譯上述程式碼將導致錯誤，因為 Rc 沒有實作 Send 特性。

使用通道（Channel）進行執行緒間通訊

通道是一種常見的執行緒間通訊方式。Rust 的標準函式庫提供了 std::sync::mpsc 模組來支援通道操作。

use std::sync::mpsc;
use std::thread;

let (tx, rx) = mpsc::channel();

thread::spawn(move || {
    tx.send(5).unwrap();
});

println!("Received: {}", rx.recv().unwrap());

在這個例子中，一個新的執行緒被建立並傳送一個值到通道。主執行緒接收這個值並列印出來。

將迭代器轉換為離線迭代器

我們可以為迭代器新增一個 off_thread 方法，使其在另一個執行緒中執行。這需要使用通道來傳輸資料。

use std::sync::mpsc;

pub trait OffThreadExt: Iterator {
    fn off_thread(self) -> mpsc::IntoIter<Self::Item>;
}

impl<T> OffThreadExt for T
where
    T: Iterator + Send + 'static,
    T::Item: Send + 'static,
{
    fn off_thread(self) -> mpsc::IntoIter<Self::Item> {
        let (tx, rx) = mpsc::sync_channel(1024);
        thread::spawn(move || {
            for item in self {
                if tx.send(item).is_err() {
                    break;
                }
            }
        });
        rx.into_iter()
    }
}

使用通道實作非同步服務

通道可以用於實作各種非同步服務，例如日誌記錄服務。其他執行緒可以將日誌訊息傳送到日誌執行緒，日誌執行緒負責寫入日誌檔案。

use std::sync::mpsc;
use std::thread;

let (tx, rx) = mpsc::channel();

thread::spawn(move || {
    loop {
        match rx.recv() {
            Ok(msg) => println!("Logging: {}", msg),
            Err(_) => break,
        }
    }
});

tx.send("Hello, world!".to_string()).unwrap();

在這個例子中，一個日誌執行緒被建立並等待接收日誌訊息。主執行緒傳送一條日誌訊息到通道。

多執行緒環境下的分享可變狀態管理

在開發多人即時戰略遊戲的伺服器時，如何協調多個執行緒以在八名玩家都準備就緒時啟動遊戲是一個重要的挑戰。這裡的關鍵問題是多個執行緒需要存取一個分享的玩家等待列表，而這個列表既是可變的，又需要在所有執行緒之間分享。

互斥鎖（Mutex）的基本概念

互斥鎖是一種用於強制多個執行緒輪流存取某些資料的同步機制。互斥鎖保護的資料在同一時間內只能被一個執行緒存取。當一個執行緒正在存取被互斥鎖保護的資料時，其他試圖存取該資料的執行緒將被阻塞，直到第一個執行緒釋放互斥鎖。

為什麼使用互斥鎖？

防止資料競爭：資料競爭是指多個執行緒同時讀取和寫入相同記憶體的情況，這在許多程式語言中是未定義行為。互斥鎖可以防止這種情況的發生。
避免執行緒操作的任意交錯：即使沒有資料競爭，沒有互斥鎖的保護，執行緒的操作仍然可能以任意方式交錯進行，使得程式的行為難以預測和除錯。
支援不變數程式設計：互斥鎖可以幫助維護被保護資料的不變數，即在每個臨界區內，資料都滿足某些特定的條件。

Rust 中的 Mutex

在 Rust 中，Mutex 是一種用於保護分享可變狀態的同步原語。與 C++ 不同，Rust 的 Mutex 將被保護的資料儲存在其內部。

use std::sync::{Arc, Mutex};

type PlayerId = u32;
const GAME_SIZE: usize = 8;
type WaitingList = Vec<PlayerId>;

struct FernEmpireApp {
    waiting_list: Mutex<WaitingList>,
    // 其他欄位...
}

let app = Arc::new(FernEmpireApp {
    waiting_list: Mutex::new(vec![]),
    // 初始化其他欄位...
});

使用 Mutex 管理等待列表

當一個玩家加入等待列表時，執行緒需要取得 waiting_list 的互斥鎖，進行必要的操作，然後釋放鎖。

impl FernEmpireApp {
    fn join_waiting_list(&self, player: PlayerId) {
        self.waiting_list.lock().unwrap().push(player);
        // 檢查是否足夠玩家開始遊戲
        if self.waiting_list.lock().unwrap().len() >= GAME_SIZE {
            // 開始遊戲
            let mut waiting_list = self.waiting_list.lock().unwrap();
            let players: Vec<PlayerId> = waiting_list.drain(..).collect();
            self.start_game(players);
        }
    }

    fn start_game(&self, players: Vec<PlayerId>) {
        // 實作開始遊戲的邏輯
    }
}

Mutex 的優點

將資料和鎖繫結在一起，降低了錯誤使用的可能性。
Rust 的編譯器強制要求在使用被 Mutex 保護的資料前必須先取得鎖。