2024年07月30日玄貓（BlackCat）

Rust 程式語言核心：純量與複合資料型別深度解析

本文深入探討 Rust 程式語言的基礎：靜態資料型別系統。內容聚焦於兩大核心類別：純量型別與複合型別。在純量型別中，我們將解析代表真偽值的布林（bool）與支援完整 Unicode 的字元（char）；在複合型別中，則著重介紹能將不同型別資料組合成固定長度結構的元組（tuple）。透過理解這些基本建構單元，開發者能更有效地管理記憶體與控制程式流程，為建構穩固且高效能的應用程式奠定基礎。

程式設計軟體工程

資料型別純量型別複合型別布林值字元元組

在 Rust 這門強調安全與效能的靜態型別語言中，對資料型別的掌握是軟體工程師的進階基石。所有程式運作皆建立在對資料的精確定義與操作之上，而 Rust 的型別系統正是其記憶體安全保證的核心。本章節將從最根本的分類出發，探討構成所有複雜結構的兩大基礎：純量型別與複合型別。純量型別如布林值與字元，是不可再分割的單一值，為邏輯判斷與文本處理提供基礎。複合型別中的元組，則展示了如何將不同型別的資料組合成一個固定有序的集合。深入理解這些型別的特性與適用場景，是編寫出高效能且符合 Rust 設計哲學程式碼的關鍵第一步。

軟體工程師的進階修煉：從抽象化到實戰應用的全面提升

第二章：基本概念

資料型別

程式語言是一種靜態型別語言，這意味著每個變數的型別必須在編譯時期已知。理解資料型別至關重要，因為它們決定了你可以對變數執行的操作以及它將佔用多少記憶體。

程式語言提供了廣泛的資料型別，分為兩個主要類別：純量型別 (scalar types) 和複合型別 (compound types)。

純量型別

純量型別代表單個值。程式語言有四種主要的純量型別：整數、浮點數、布林值和字元。

布林值 (Booleans)

程式語言中的布林型別是最簡單但最重要的資料型別之一，因為它允許你表示真值——true 或 false 條件——這對於程式中的控制流程和決策制定至關重要。

在程式語言中，布林型別寫作 bool，它只能有兩個值之一：

true
false

以下是如何宣告和使用布林值的範例：

fn main() {
let is_active: bool = true; // 明確宣告
let is_logged_in = false; // 型別推斷
println!("是否啟用? {}", is_active);
println!("是否登入? {}", is_logged_in);
}

is_active 使用型別註釋 bool 明確宣告為布林值。
is_logged_in 被賦予 false 值，程式語言會根據賦予的值自動推斷其型別為 bool。

布林值通常用於控制流程語句，例如 if 和 while。這些是程式根據某事是真還是假來做出決策的條件。

以下是一個帶有 if 語句的快速範例：

fn main() {
let is_raining = true;
if is_raining {
println!("帶把傘！");
} else {
println!("享受陽光！");
}
}

在這個範例中，if 語句評估布林變數 is_raining。如果它是 true，則執行第一個程式碼區塊；否則，執行 else 區塊。

字元 (Characters)

與許多僅支援 ASCII（7 位元編碼）的語言不同，程式語言的 char 型別是一個 4 位元組（32 位元）的 Unicode 純量值，這意味著它能表示的遠不止英文字母和符號。這包括各種字元，例如：

字母（例如 A, z）
數字（例如 1, 2）
特殊符號（例如 !, @）
表情符號（例如 😊）
來自各種語言的字元（例如 م, 你, λ）

程式語言中的每個 char 都代表一個 Unicode 純量值，這讓你可以靈活地處理來自不同語言和文字的廣泛符號和文本。

以下是你如何在程式語言中宣告一個 char：

fn main() {
let letter: char = 'A'; // 明確宣告
let emoji = '😊'; // 型別推斷
println!("字母: {}", letter);
println!("表情符號: {}", emoji);
}

在這個範例中：

letter 被明確宣告為 char 型別，並持有值 'A'。
emoji 根據其值 '😊' 被推斷為 char 型別。

請注意，字元使用單引號（'）括起來，而不是像字串那樣使用雙引號。這是因為 char 代表單個字元，而字串代表一系列字元。

程式語言的 char 型別可以儲存任何有效的 Unicode 字元，這不僅包括拉丁字母，還包括符號、標點符號以及來自其他語言的字元。它是一個靈活的資料型別，允許你處理各種文本，使程式語言成為需要國際化或複雜文本處理的應用程式的強大選擇。

例如，你可以像儲存英文字母一樣輕鬆地儲存希臘字母或數學方程式中使用的符號：

fn main() {
let greek_letter = 'λ'; // Lambda
let symbol = '#'; // 井字號
println!("希臘字母: {}", greek_letter);
println!("符號: {}", symbol);
}

複合型別 (Compound Types)

在程式語言中，複合型別允許你將多個值組合到一個單一的資料結構中。最常用的兩種複合型別是元組 (tuples) 和陣列 (arrays)。在本節中，我們將深入探討元組——它們如何運作、何時使用以及為什麼它們對於以結構化方式管理相關資料非常有用。

元組 (Tuples)

元組是一種將不同型別的多個值組合到一個複合型別中的方式。元組的長度是固定的，一旦宣告就不能改變。

以下是一個元組的簡單範例：

fn main() {
let person: (i32, f64, char) = (25, 5.9, 'M');

// 一個包含整數、浮點數和字元的元組
println!("年齡: {}", person.0);
println!("身高: {}", person.1);
println!("性別: {}", person.2);
}

這個 person 元組儲存在堆疊記憶體中。

元組的每個元素都依序儲存。
person.0 首先儲存，其值為 25（一個 i32 整數）。
person.1 接著儲存，其值為 5.9（一個 f64 浮點數）。
person.2 最後儲存，其值為 'M'（一個 char）。

玄貓認為，元組的這種特性使其在需要將一組異質資料捆綁在一起時非常有用，例如從函式返回多個值。

@startuml
!define DISABLE_LINK
!define PLANTUML_FORMAT svg
!theme _none_

skinparam dpi auto
skinparam shadowing false
skinparam linetype ortho
skinparam roundcorner 5
skinparam defaultFontName "Microsoft JhengHei UI"
skinparam defaultFontSize 16
skinparam minClassWidth 100

package "程式語言純量與複合型別" {
node "純量型別 (Scalar Types)" as ScalarTypes {
component "布林值 (Booleans)" as Booleans
component "字元 (Characters)" as Chars
}

node "布林型別特性" as BooleanProps {
component "bool 關鍵字" as BoolKeyword
component "值: true 或 false" as TrueFalseValues
component "控制流程基礎" as ControlFlowBase
component "型別推斷或明確宣告" as TypeInferenceExplicit
}

node "字元型別特性" as CharProps {
component "char 關鍵字" as CharKeyword
component "4 位元組 Unicode 純量值" as UnicodeScalar
component "單引號 ' '" as SingleQuotes
component "支援多國語言/表情符號" as MultiLangEmoji
}

node "複合型別 (Compound Types)" as CompoundTypes {
component "元組 (Tuples)" as Tuples
component "陣列 (Arrays)" as Arrays
}

node "元組型別特性" as TupleProps {
component "固定長度" as FixedLength
component "可包含不同型別" as MixedTypes
component "元素依序儲存" as SequentialStorage
component "存取方式: .索引" as AccessByIndex
component "堆疊記憶體儲存" as StackMemory
}

ScalarTypes --> Booleans
ScalarTypes --> Chars

Booleans --> BooleanProps
Chars --> CharProps

CompoundTypes --> Tuples
CompoundTypes --> Arrays

Tuples --> TupleProps

BooleanProps --> BoolKeyword
BooleanProps --> TrueFalseValues
BooleanProps --> ControlFlowBase
BooleanProps --> TypeInferenceExplicit

CharProps --> CharKeyword
CharProps --> UnicodeScalar
CharProps --> SingleQuotes
CharProps --> MultiLangEmoji

TupleProps --> FixedLength
TupleProps --> MixedTypes
TupleProps --> SequentialStorage
TupleProps --> AccessByIndex
TupleProps --> StackMemory

ScalarTypes -[hidden]-> CompoundTypes
}

@enduml

看圖說話：

此圖示詳細描繪了程式語言中的純量型別與複合型別。在純量型別部分，它闡述了布林值 (Booleans) 和字元 (Characters) 的特性。布林型別使用 bool 關鍵字，值為 true 或 false，是控制流程的基礎，並支援型別推斷或明確宣告。字元型別使用 char 關鍵字，是4 位元組的 Unicode 純量值，用單引號括起，並支援多國語言和表情符號。

在複合型別部分，圖示介紹了元組 (Tuples) 和陣列 (Arrays)。其中元組的特性包括固定長度、可包含不同型別的元素，元素依序儲存，透過**.索引方式存取，並儲存在堆疊記憶體**中。此圖清晰地展示了程式語言如何透過這些基本且強大的資料型別來構建複雜的程式邏輯。

結論

解構軟體工程師進階修煉的關鍵元素可以發現，對資料型別的深刻理解，遠非記憶語法規則，而是內化語言設計哲學的第一步。本文所探討的布林值、字元與元組，看似基礎，卻精準揭示了此程式語言在安全性、表達力與執行效能之間取得的權衡。例如，以 4 位元組儲存 char 是對全球化應用場景的前瞻性投資，而元組的固定性與堆疊儲存則為高頻率、低延遲的操作提供了效能保證。

軟體工程師的成長瓶頸，往往不在於能否使用這些工具，而在於能否洞悉其設計背後的意圖，並將其轉化為自己的架構直覺。當我們能從一個 bool 看見狀態管理的嚴謹性，從一個 char 看見系統的包容性，從一個 tuple 看見資料聚合的簡潔性時，程式碼才開始從「功能的堆砌」昇華為「思想的表達」。未來，當面對更複雜的列舉（Enums）與結構（Structs）時，正是這種對基礎型別的深刻體悟，才能讓工程師無縫地掌握代數資料型別（ADT）的威力，設計出更具擴展性與韌性的系統。

因此，玄貓認為，對於追求技術突破的工程師而言，真正的進階並非來自於追逐新潮的框架，而是源於對這些基礎元素的深度反思與靈活應用。這份從基礎扎根的修煉，才是通往架構師思維最為堅實的階梯。