2025年02月02日玄貓（BlackCat）

Scala高階函數應用：for推導式與聚合操作解析

本文深入探討 Scala 集合函式庫中的高階函數應用。首先解析 for 推導式如何作為 flatMap、filter 與 map 鏈式操作的語法糖，顯著提升複雜數據轉換的可讀性。接著，文章詳細比較 foldLeft 與 reduceLeft 兩種聚合函數，闡明它們在初始值設定、輸出型別彈性以及應用場景上的核心差異。最後，引入多型函數的概念，解釋其如何透過型別參數賦予函數處理多種資料型別的能力，是實現泛型與程式碼重用的關鍵。

軟體開發數據工程

Scala 高階函數 for推導式聚合函數多型函數函數式編程

在建構高效能的數據處理管道時，Scala 集合函式庫提供了強大的抽象能力。其中，高階函數的進階應用是提升程式碼表達力與維護性的核心。本文將從 for 推導式出發，剖析其作為一系列 flatMap、filter 與 map 操作的語法糖，如何在不犧牲效能的前提下，將複雜的數據流轉換邏輯以更具宣告性且易於理解的方式呈現。進一步地，我們將探討集合的聚合操作，透過比較 fold 與 reduce 系列函數，闡明它們在處理初始條件與回傳型別上的設計哲學差異，這對於實現精確的數據彙總至關重要。這些高階函數的彈性與通用性，源自於其底層的多型函數設計。理解多型性如何透過型別參數實現泛型編程，是掌握 Scala 函數式編程精髓、編寫可重用且型別安全程式碼的基石。

數據工程高科技養成：從理論到實踐的玄貓指引

Scala集合函式庫中的高階函數範例

範例 1.35：

scala> List.tabulate(50)(_ + 1).withFilter(_ % 2 == 0).map(_ * 2)
res: scala.collection.FilterMonadic[Int,List[Int]] = scala.collection.FilterMonadic$$anon$1@...

請注意，withFilter返回一個FilterMonadic型別的物件，該物件只包含map、flatMap、foreach和withFilter方法。這些是呼叫withFilter後唯一可以鏈接的方法。例如，以下程式碼將無法編譯：

範例 1.36：

List.tabulate(50)(_ + 1).withFilter(_ % 2 == 0).forall(_ % 2 == 0)

在實際應用中，將一系列flatMap、filter和map鏈接在一起是相當常見的，而Scala透過for推導式（for comprehensions）提供了語法糖來支援這一點。為了展示其作用，玄貓將考慮以下Person類別及其實例：

範例 1.37：

case class Person(firstName: String, isFemale: Boolean, children: Person*)
val bob = Person("Bob", false)
val jennette = Person("Jennette", true)
val laura = Person("Laura", true)
val jean = Person("Jean", true, bob, laura)
val persons = List(bob, jennette, laura, jean)

Person*表示一個型別為Person的可變參數。型別為T的可變參數必須是類別定義或方法簽名中的最後一個參數，並且接受零個、一個或多個T型別的實例。

現在假設玄貓想要獲取母子對，例如(Jean, Bob)和(Jean, Laura)。使用flatMap、filter和map，玄貓可以這樣寫：

範例 1.38：

scala> persons.filter(_.isFemale).flatMap(p => p.children.map(c => (p.firstName, c.firstName)))
res32: List[(String, String)] = List((Jean,Bob), (Jean,Laura))

上述表達式完成了任務，但它並不容易理解其內部運作。這正是for推導式發揮作用的地方：

範例 1.39：

scala> for {
| p <- persons
| if p.isFemale
| c <- p.children
| } yield (p.firstName, c.firstName)
res33: List[(String, String)] = List((Jean,Bob), (Jean,Laura))

這個程式碼片段更容易理解其功能。在幕後，Scala編譯器會將此表達式轉換為第一個表達式（唯一的區別是filter將被withFilter替換）。

Scala還提供了使用fold和reduce系列函數來組合集合元素的方法。兩者之間的主要區別可以透過它們的簽名來理解：

範例 1.40：

def foldLeft[B](z: B)(op: (B, A) ⇒ B): B
def reduceLeft[A1 >: A](op: (A1, A1) ⇒ A1): A1

這兩種方法都接受一個二元運算符，從左到右組合元素。然而，foldLeft接受一個零參數z，其型別為B（如果List為空則返回此值），並且輸出型別可以與List中元素的型別不同。另一方面，reduceLeft要求A1是A的超型別（>:表示下界）。因此，玄貓可以使用foldLeft來對List[Int]求和並返回Double值，如下所示：

範例 1.41：

scala> List(1,2,3,4).foldLeft[Double](0) ( _ + _ )
res34: Double = 10.0

玄貓不能對reduceLeft執行相同的操作（因為Double不是Int的超型別）。嘗試這樣做將會引發編譯時錯誤，提示型別參數[Double]不符合方法reduce的型別參數邊界[A1 >: Int]：

範例 1.42：

scala> List(1,2,3,4).reduce[Double] ( _ + _ )
<console>:12: error: type arguments [Double] do not conform to method
reduce's type parameter bounds [A1 >: Int]
List(1,2,3,4).reduce[Double] ( _ + _ )
^

foldRight和reduceRight從右到左組合集合元素。還有fold和reduce，對於這兩者，元素組合的順序是未指定的，並且可能是不確定的。

在本節中，玄貓看到了Scala集合函式庫中高階函數的幾個範例。讀者應該已經注意到，這些函數中的每一個都使用了型別參數。這些被稱為多型函數，這正是玄貓接下來要探討的內容。

理解多型函數

一個可以處理多種輸入參數型別或可以返回不同型別值的函數，被稱為多型函數。

此圖示：Scala集合高階函數的進階應用與效能考量

看圖說話：

此圖示深入探討了Scala集合高階函數的進階應用，特別是for推導式、聚合操作以及多型函數的概念。for推導式作為flatMap、filter和map等鏈接操作的語法糖，極大地提升了程式碼的可讀性，同時編譯器會對其進行優化，例如將filter替換為withFilter以提高效能。聚合操作則由foldLeft和reduceLeft代表，它們都能從左到右組合集合元素。foldLeft的獨特之處在於它接受一個初始值（z），並且輸出型別可以與集合元素型別不同，這使其應用更為廣泛。相比之下，reduceLeft則沒有初始值，並且要求輸出型別必須是元素型別本身或其超型別。這些聚合函數和許多其他高階函數都體現了多型函數的特性，即它們能夠透過型別參數（如T、A、B）處理多種型別的數據，實現泛型編程，從而帶來極大的彈性與程式碼重用性。這些高級特性是構建高效、可維護的數據處理管道不可或缺的基石。