2024年07月28日玄貓（BlackCat）

Rust開發高效能分散式網頁應用

本文探討使用 Rust 語言建構高效能分散式網頁應用程式的優勢，包含 Rust 的安全性、資源效率、低延遲特性，以及平行處理機制。文章以 EzyTutors 電子教學平台為例，闡述如何運用 Rust 的特性，結合非同步 I/O

網頁開發系統設計

Rust 分散式系統網頁應用程式非同步I/O 多執行緒效能

Rust 語言以其獨特的所有權和借用系統，提供記憶體安全和執行緒安全，無需垃圾回收機制，兼具高效能和安全性。其在建構分散式系統時，能有效減少常見的程式錯誤，提升系統可靠性。本文將以建構一個名為 EzyTutors 的電子教學平台為例，說明如何利用 Rust 的語言特性，包含非同步 I/O、多執行緒處理等，開發一個兼具效能和安全性的分散式網頁應用程式。我們將探討如何利用 Rust 的模組化特性，組織程式碼結構，並說明程式碼範例中設計選擇的邏輯，包含單一職責原則、可維護性、資安考量以及應用組態管理等。

分散式系統概述

現代的網際網路應用程式通常建立在分散式系統的基礎上。分散式系統是指將多個計算處理器分散在不同的地理位置，透過網路進行通訊，並同時執行工作負載。從技術上講，現代的家用電腦也可以視為一個網路化的分散式系統，因為它們具備多CPU和多核心處理器。

分散式系統的型別

分散式網路：如電信網路和網際網路。
分散式客戶端-伺服器應用程式：大多數根據網頁的應用程式屬於這一類別。
分散式P2P應用程式：如BitTorrent和Tor。
即時控制系統：如航空交通管制和工業控制系統。
分散式伺服器基礎設施：如雲端運算、格線運算和其他形式的科學計算。

分散式系統的組成部分

分散式系統大致由三個部分組成：分散式應用程式、網路堆積疊和硬體及作業系統基礎設施。

分散式應用程式：可以使用多種網路協定進行內部元件之間的通訊。目前，HTTP因其簡單性和普遍性，已成為與外界通訊的主要選擇。
網路堆積疊：由四層網際網路協定套件組成，形成分散式系統元件之間的通訊骨幹。這四層（從最低到最高抽象級別）分別是：
- 網路鏈路/存取層
- 網際網路層
- 傳輸層
- 應用層
前三層通常在硬體或作業系統級別實作。對於大多數分散式網頁應用程式，HTTP是主要使用的應用層協定。流行的API協定如REST、gRPC和GraphQL都使用HTTP。
硬體和作業系統基礎設施：包括實體伺服器、作業系統、虛擬化或容器執行時等元件。

分散式網頁應用程式

當網頁應用程式不是單體架構，而是由數十或數百個分散式應用程式元件組成，並透過網路進行合作和通訊時，它們被稱為分散式網頁應用程式。大型分散式網頁應用程式的例子包括社交媒體應用程式（如Facebook和Twitter）、電子商務網站（如Amazon和eBay）、分享經濟應用程式（如Uber和Airbnb）、娛樂網站（如Netflix）等。

圖1.1 社交媒體應用的簡化分散式系統堆積疊

圖1.1展示了一個現代網頁應用程式的分散式系統堆積疊的邏輯檢視。在現實世界中，這樣的系統可以分佈在數千台伺服器上。在圖中，可以看到三台透過網路堆積疊連線的伺服器。這些伺服器可能都位於單一資料中心內，也可能在雲端地理分佈。在每個伺服器內，展示了硬體和軟體元件的分層檢視。

為什麼選擇Rust來構建網頁應用程式？

Rust可以用於構建分散式應用程式的所有三層：前端、後端服務和軟體基礎設施元件。然而，每一層都關注不同的問題和特性。在討論Rust的優點時，瞭解這些差異非常重要。

前端關注點

客戶端前端關注使用者介面設計、使用者經驗、追蹤應用程式狀態的變化、在螢幕上渲染更新的檢視，以及構建和更新檔案物件模型（DOM）。

後端服務關注點

後端服務需要設計良好的API以減少往返次數、高吞吐量（以每秒請求數衡量）、在不同負載下的短回應時間、低且可預測的延遲（如視訊串流和線上遊戲）、低記憶體和CPU佔用、服務發現和可用性。

軟體基礎設施層關注點

軟體基礎設施層主要關注極低的延遲、對網路和其他資源的底層控制。

Rust在分散式系統中的優勢

Rust因其安全性、效能和平行性而成為構建分散式系統的有吸引力的選擇。它的所有權模型和借用檢查器有助於防止常見的程式錯誤，如空指標解參照和資料競爭。這些特性使得Rust非常適合構建高效、可靠的分散式系統。#### 內容解密：

圖1.1 是一個現代網頁應用程式的分散式系統堆積疊的邏輯檢視，主要展示了三台伺服器透過網路堆積疊連線，每台伺服器內部包含硬體和軟體元件的分層結構。
分散式系統的三個主要組成部分為分散式應用程式、網路堆積疊以及硬體和作業系統基礎設施，這些部分共同合作以實作高效的通訊與運作。
網路堆積疊由四層結構組成，包括網路鏈路/存取層、網際網路層、傳輸層和應用層，其中HTTP是目前最廣泛使用的應用層協定。
分散式網頁應用程式通常由多個元件組成，這些元件透過網路進行合作與通訊，能夠提供更強大的功能與服務。
Rust 語言在構建分散式系統時具有明顯優勢，主要體現在安全性、效能以及平行處理能力上，能有效減少常見的程式錯誤並提升整體可靠性。

網路應用程式的特性與 Rust 的優勢

現代網路應用程式包含多個層面，包括前端、後端和基礎設施服務。這些元件對安全性、效能和可靠性有不同的需求。本章節將重點介紹 Rust 在後端和基礎設施服務中的優勢。

網路應用程式的特性

網路應用程式可以分為多種型別，包括：

高度關鍵任務的應用程式，如自動駕駛車輛控制、智慧電網、工業自動化和高速交易應用程式
高容量交易和訊息基礎設施，如電子商務平台、社交網路和零售支付系統
近乎即時的應用程式，如線上遊戲伺服器、視訊或音訊處理、視訊會議和即時協作工具

這些應用程式都有一些共同的需求：

應該是安全、可靠的
應該是資源高效的
必須最小化延遲
應該支援高並發

此外，以下是一些令人愉快的需求：

應該具有快速的啟動和關閉時間
應該易於維護和重構
必須提供開發者生產力

Rust 在網路應用程式中的優勢

Rust 滿足了上述所有關鍵需求。讓我們來看看如何實作。

RUST 是安全的

在討論程式安全性時，有三個不同的方面需要考慮：型別安全、記憶體安全和執行緒安全。

Rust 是一種靜態型別語言，型別檢查在編譯時進行。這有助於消除一整類別執行時錯誤。

記憶體安全是 Rust 最獨特的方面之一。主流程式語言可以根據記憶體管理方式分為兩類別：一類別是手動記憶體管理，如 C 和 C++；另一類別是具有垃圾回收機制，如 Java、C#、Python、Ruby 和 Go。

Rust 是第一個提出替代方案的流行語言——自動記憶體管理和記憶體安全無需垃圾回收。Rust 透過一個獨特的所有權模型實作了這一點。

在這個模型中，每個在 Rust 程式中宣告的值都被賦予一個所有者。當一個值被交給另一個所有者後，它就不能再被原始所有者使用。當值的所有者超出範圍時，該值會被自動銷毀（記憶體被釋放）。

Rust 還可以授予對值的臨時存取許可權，稱為借用。Rust 編譯器確保對值的參照不會超過被借用的值。

Rust 編譯時保證可以防止以下類別的記憶體安全錯誤：

空指標解參照
分段錯誤
懸掛指標

程式碼範例：Rust 的所有權模型

fn main() {
    let s = String::from("Hello");  // s 是字串 "Hello" 的所有者
    let len = calculate_length(&s);  // 將 s 的參照傳遞給 calculate_length
    println!("The length of '{}' is {}.", s, len);  // s 仍然有效，因為我們傳遞的是參照
}

fn calculate_length(s: &String) -> usize {  // s 是 String 的參照
    s.len()
}  // s 超出範圍，但因為它是參照，所以不會被丟棄

內容解密：

let s = String::from("Hello");：建立一個新的 String 例項 “Hello”，並將其所有權賦予 s。
let len = calculate_length(&s);：將 s 的參照傳遞給 calculate_length 函式。這裡使用 & 運算子建立了一個對 s 的參照。
s.len()：在 calculate_length 函式內部，透過參照 s 取得字串的長度。
Rust 的借用檢查器確保了在 calculate_length 函式內部對 s 的參照不會超過 s 的有效範圍。

這個範例展示了 Rust 如何透過所有權模型和借用機制來確保記憶體安全。

Rust 程式語言的安全性、資源效率與低延遲特性

Rust 程式語言以其獨特的設計理念和技術特點，在安全性、資源效率和低延遲方面表現出色，為開發高效、安全和可靠的應用程式提供了強大的支援。

安全性

Rust 透過其所有權（Ownership）模型和借用（Borrowing）機制，有效地防止了記憶體安全問題，如緩衝區溢位等。同時，Rust 的型別系統和編譯器檢查確保了資料的執行緒安全，避免了資料競爭（Data Races）的發生。Rust 的 Send 和 Sync 特性使得開發者能夠明確地控制資料在執行緒間的分享，從而進一步提高了程式的安全性。

內容增強

Rust 的安全性還體現在以下幾個方面：

不可變性預設：Rust 中的變數預設為不可變，需要明確宣告才能進行修改，這迫使開發者仔細考慮資料的修改邏輯和物件的生命週期。
所有權模型：不僅管理記憶體，還管理其他資源，如網路通訊端、資料函式庫和檔案控制程式碼等。
無垃圾收集器：避免了非確定性的行為，提高了程式的可預測性。
詳盡的模式匹配：Rust 的 match 陳述式要求處理所有可能的變體，防止了因遺漏某些程式碼路徑而導致的意外執行時行為。
代數資料型別：使得資料模型的表示更加簡潔和可驗證。

資源效率

現代軟體開發中，資源（如 CPU、記憶體和磁碟空間）的消耗往往被視為次要問題，因為硬體成本相對較低。然而，Rust 透過其獨特的設計，能夠提供資源高效的服務：

所有權模型：有效地防止了記憶體洩漏和其他資源洩漏。
精細的記憶體控制：允許開發者緊密控制程式的記憶體佈局。
無垃圾收集器：減少了額外的 CPU 和記憶體資源消耗。
無龐大的執行時環境：使得 Rust 程式能夠在資源受限的嵌入式系統和微控制器上執行。
智慧指標：最佳化了程式的記憶體佔用。

程式碼範例

// 使用智慧指標 Rc 管理記憶體
use std::rc::Rc;

fn main() {
    let rc = Rc::new(5);
    println!("Reference count: {}", Rc::strong_count(&rc));
    let rc_clone = Rc::clone(&rc);
    println!("Reference count after clone: {}", Rc::strong_count(&rc));
}

內容解密：

智慧指標的使用：範例中使用了 Rc（Reference Counted）智慧指標來管理一個整數值 5 的記憶體。
Rc::clone 方法：透過 Rc::clone 方法建立了 rc 的一個新的參照 rc_clone，這增加了 rc 所指向值的參照計數。
Rc::strong_count 函式：用於取得當前 Rc 例項的參照計數，展示了智慧指標如何動態管理記憶體。

低延遲

Rust 的設計使其成為開發低延遲應用的理想選擇。作為一種系統程式語言，Rust 提供了對硬體的低階控制，沒有垃圾收集器，且原生支援非阻塞 I/O 操作。此外，Rust 的零成本抽象原則確保了高效的效能。

圖表翻譯： 此圖示展示了一個請求從到達到完成的流程。首先，請求到達伺服器（A），然後伺服器處理請求（B），處理完成後傳回回應（C），最後請求完成（D）。這個流程清晰地展示了請求處理的各個階段。

無畏並發

Rust 不僅在安全性方面表現出色，其並發特性也使得開發者能夠充分利用多核處理器的能力，提高應用程式的吞吐量和效能。Rust 支援經典的多執行緒和非同步 I/O 兩種並發模型。

Rust 程式語言的特性與應用

Rust 是一種系統程式語言，提供高效、安全、平行處理的軟體開發體驗。本章節將探討 Rust 的核心特性、優勢與限制，並介紹本文的範例應用。

Rust 的平行處理機制

Rust 提供兩種主要的平行處理模式：分享記憶體與訊息傳遞。透過型別系統保證資料分享的安全性，開發者可以輕鬆建立高效的平行程式。

多執行緒處理

Rust 的多執行緒支援允許執行緒借用、擁有或轉移值的範圍。Rust 還提供資料競爭安全，確保執行緒不會被阻塞，從而提升效能。

use std::thread;
use std::sync::{Arc, Mutex};

fn main() {
    let counter = Arc::new(Mutex::new(0));
    let mut handles = vec![];

    for _ in 0..10 {
        let counter_clone = Arc::clone(&counter);
        let handle = thread::spawn(move || {
            let mut num = counter_clone.lock().unwrap();
            *num += 1;
        });
        handles.push(handle);
    }

    for handle in handles {
        handle.join().unwrap();
    }

    println!("Result: {}", *counter.lock().unwrap());
}

內容解密：

上述程式碼展示了 Rust 如何使用 Arc 和 Mutex 來實作多執行緒的計數器。Arc 提供執行緒安全的參照計數，而 Mutex 保證資料同步。程式碼中建立了 10 個執行緒，每個執行緒對計數器進行加一操作，最後輸出結果。

非同步 I/O

Rust 的非同步事件迴圈根據非阻塞 I/O，提供零成本的 futures 和 async-await 機制。這使得開發者能夠編寫高效的非同步程式碼。

use tokio::time;

#[tokio::main]
async fn main() {
    println!("Hello, tokio!");

    let start = time::Instant::now();
    time::sleep(time::Duration::from_millis(100)).await;
    println!("Slept for {:?}", start.elapsed());
}

內容解密：

此範例展示了使用 Tokio 函式庫進行非同步程式設計。tokio::main 宏將 main 函式標記為非同步，time::sleep 函式用於非阻塞地暫停執行一段時間。

Rust 的生產力特性

Rust 結合了系統程式語言的低階控制和高效能，以及高階語言的生產力特性。這使得 Rust 成為開發高效、安全軟體的理想選擇。

高階抽象

Rust 提供多種高階抽象，如閉包、迭代器、泛型和巨集等，簡化了開發流程。

fn main() {
    let numbers = vec![1, 2, 3, 4, 5];
    let doubled: Vec<i32> = numbers.into_iter().map(|x| x * 2).collect();
    println!("{:?}", doubled);
}

內容解密：

此範例展示了 Rust 的迭代器和閉包。into_iter 方法將向量轉換為迭代器，map 方法對每個元素套用閉包，最後 collect 方法將結果收集到新的向量中。

Rust 的限制

儘管 Rust 具有許多優勢，但仍有一些限制。例如，Rust 的學習曲線較陡峭，對新手或來自動態語言的開發者來說可能較為困難。

範例應用：EzyTutors

本文將透過建立一個名為 EzyTutors 的數位店面來示範 Rust 在網頁開發中的應用。EzyTutors 將允許家教發布課程目錄，並提供一個銷售工具。

開發根據Rust的電子教學平台：EzyTutors系統設計與實作

1.3.2 實作範例的技術指引

本文並非探討系統架構或軟體工程理論的專著，但我們將在此列舉一些基礎的技術指標，幫助讀者理解程式碼範例中的設計選擇背後的邏輯。

1. 專案結構

我們將大量使用Rust的模組系統來區隔不同的功能模組，保持程式碼的組織性。使用Cargo工作空間來將相關的專案組織在一起，包括二進位執行檔和函式庫。

// Cargo.toml 範例
[workspace]
members = [
    "ezytutors_web",
    "ezytutors_db",
    "ezytutors_core"
]

內容解密：

使用Cargo工作空間可以讓多個相關專案分享依賴和組態
成員列表中包含了主要的應用程式模組
這種結構有利於大型專案的管理和維護

2. 單一職責原則

每個邏輯上獨立的應用功能應該被放在自己的模組中。例如，Web層的處理函式應該只處理HTTP訊息的解析，而業務邏輯和資料庫存取邏輯則應該放在獨立的模組中。

// handlers.rs
pub async fn handle_course_list() -> impl Responder {
    // 只處理HTTP請求
}

// business_logic.rs
pub fn get_courses() -> Vec<Course> {
    // 處理業務邏輯
}

內容解密：

將不同層級的邏輯分離到不同的模組中
handle_course_list 只負責處理HTTP請求
get_courses 專注於業務邏輯處理

3. 可維護性

以下準則有助於提升程式碼的可維護性：

變數和函式名稱必須具有自我解釋性。
使用Rustfmt保持程式碼格式的一致性。
編寫自動化測試案例以檢測和防止迴歸問題。
專案結構和檔案名稱必須直觀易懂。

// 使用有意義的變數名稱
let course_count = courses.len();

// 使用Rustfmt格式化程式碼
fn main() {
    println!("Hello, world!");
}

內容解密：

清晰的命名約定有助於程式碼理解
統一的程式碼格式提高可讀性
自動化測試確保程式碼變更不會引入錯誤

4. 資安考量

本文將涵蓋使用JSON Web Tokens（JWT）和根據密碼的使用者認證。雖然基礎設施和網路層級的安全性不會在本文中討論，但值得注意的是，Rust本身提供了記憶體安全性和執行緒安全性。

// JWT驗證範例
use jsonwebtoken::{decode, Validation};

let token = "some.jwt.token";
let validation = Validation::default();
let decoded = decode::<Claims>(token, &secret, &validation)?;

內容解密：

使用JWT實作API認證
利用Rust的型別系統確保記憶體安全
避免常見的安全漏洞如資料競爭

5. 應用組態管理

在範例專案中，我們採用了將組態與應用程式分離的原則。

// 使用環境變陣列態應用程式
use std::env;

let database_url = env::var("DATABASE_URL")
    .expect("DATABASE_URL must be set");

內容解密：

將組態資訊存放在環境變數中
提高應用的靈活性和可佈署性
便於在不同環境中切換組態

系統架構圖示說明

@startuml
skinparam backgroundColor #FEFEFE
skinparam componentStyle rectangle

title Rust開發高效能分散式網頁應用

package "安全架構" {
    package "網路安全" {
        component [防火牆] as firewall
        component [WAF] as waf
        component [DDoS 防護] as ddos
    }

    package "身份認證" {
        component [OAuth 2.0] as oauth
        component [JWT Token] as jwt
        component [MFA] as mfa
    }

    package "資料安全" {
        component [加密傳輸 TLS] as tls
        component [資料加密] as encrypt
        component [金鑰管理] as kms
    }

    package "監控審計" {
        component [日誌收集] as log
        component [威脅偵測] as threat
        component [合規審計] as audit
    }
}

firewall --> waf : 過濾流量
waf --> oauth : 驗證身份
oauth --> jwt : 簽發憑證
jwt --> tls : 加密傳輸
tls --> encrypt : 資料保護
log --> threat : 異常分析
threat --> audit : 報告生成

@enduml

圖表翻譯： 此圖示呈現了EzyTutors系統的整體架構流程：

客戶端傳送HTTP請求到Web伺服器
Web伺服器將請求轉發給應用服務處理
應用服務進行業務邏輯處理並與資料函式庫互動
處理結果透過範本引擎渲染成網頁內容
最終將網頁內容回傳給客戶端瀏覽器顯示