2025年09月27日玄貓（BlackCat）

Python 效能剖析：精準鎖定程式瓶頸

本文探討 Python Profiler 的進階應用技巧，教你如何精準鎖定效能瓶頸。從預設 Profiler 輸出的困境出發，探討如何利用 `print_callers()` 追蹤函式呼叫鏈，找出效能問題的根源。同時，介紹如何使用 `tracemalloc`

程式效能 Python

Profiler 效能分析 tracemalloc 記憶體追蹤 Python 函式效能最佳化

Python 內建的 Profiler 提供執行時間分析，但其輸出資訊龐雜，難以直接找出效能瓶頸的根本原因。例如，單純得知某函式執行時間最長，並不足以判斷是由於自身邏輯複雜抑或被頻繁呼叫所致。print_callers() 則能追蹤函式呼叫關係，釐清效能問題的真正來源。同時，記憶體管理也是效能最佳化的重要環節，tracemalloc 模組能精確追蹤記憶體分配與釋放，協助開發者找出潛在的記憶體洩漏問題。透過結合 Profiler 的時間分析與 tracemalloc 的記憶體追蹤，能更全面地掌握程式效能瓶頸，進而進行 targeted 最佳化。

解鎖 Python 效能：Profiler 的進階應用

在追求卓越軟體效能的道路上，Profiling 扮演著至關重要的角色。它不僅能幫助我們找出程式碼中的瓶頸，更能讓我們深入瞭解程式的執行細節。但你是否曾覺得，預設的 Profiler 輸出資訊過於龐雜，難以聚焦？玄貓將分享如何運用 Python Profiler 的進階技巧，精準定位效能瓶頸。

預設輸出的困境：迷失在細節中

當我們使用 Python 內建的 Profiler 分析程式碼時，常常會得到一份冗長的統計報告。雖然這些資料封包含了函式的呼叫次數、執行時間等資訊，但卻缺乏更深層次的關聯性。例如，當一個函式被多次呼叫時，我們很難判斷是哪個呼叫方導致了效能瓶頸。

讓我們先看一段範例程式碼：

import time

def my_utility(a, b):
    time.sleep(0.01)  # 模擬耗時操作
    return a + b

def first_func():
    for i in range(1000):
        my_utility(1, i)

def second_func():
    for i in range(100):
        my_utility(1, i)

def my_program():
    for _ in range(20):
        first_func()
        second_func()

my_program()

如果直接使用預設的 print_stats 輸出，你可能會看到 my_utility 佔據了大部分的執行時間，但卻難以釐清是 first_func 還是 second_func 造成的。

`print_callers()`：追蹤效能的幕後黑手

為了更精確地找出效能瓶頸，Python Profiler 提供了 print_callers() 方法。這個方法能夠顯示每個函式的呼叫者，讓我們清楚地看到是哪些函式導致了效能瓶頸。

import cProfile
import time
import pstats

def my_utility(a, b):
    time.sleep(0.0001)  # 模擬耗時操作
    return a + b

def first_func():
    for i in range(1000):
        my_utility(1, i)

def second_func():
    for i in range(100):
        my_utility(1, i)

def my_program():
    for _ in range(20):
        first_func()
        second_func()

if __name__ == '__main__':
    profiler = cProfile.Profile()
    profiler.enable()
    my_program()
    profiler.disable()
    stats = pstats.Stats(profiler)
    stats.sort_stats('cumulative').print_callers()

執行這段程式碼後，你會看到類別似以下的輸出：

Function was called by...
         ncalls  tottime  cumtime
main.py:13(my_program)   <-
       main.py:7(first_func)       20   0.000    0.021  main.py:13(my_program)
       main.py:3(my_utility)    20000   0.019    0.019  main.py:7(first_func)
       main.py:11(second_func)       20   0.000    0.002  main.py:13(my_program)
       main.py:3(my_utility)     2000   0.002    0.002  main.py:11(second_func)

從輸出結果可以清楚看到，my_utility 函式主要被 first_func 呼叫，這表示 first_func 才是效能瓶頸的罪魁禍首。

記憶體追蹤：tracemalloc 的妙用

除了 CPU 執行時間，記憶體使用也是影響程式效能的重要因素。在 Python 中，雖然有垃圾回收機制，但記憶體洩漏仍然是一個常見的問題。tracemalloc 模組提供了一個強大的工具，可以幫助我們追蹤記憶體的使用情況。

import tracemalloc
import os

class MyObject:
    def __init__(self):
        self.x = os.urandom(100)

def get_data():
    return MyObject()

def waste_memory():
    deep_values = []
    for _ in range(10000):
        obj = MyObject()
    for _ in range(10000):
        deep_values.append(get_data())
    return deep_values

if __name__ == '__main__':
    tracemalloc.start(10)
    time1 = tracemalloc.take_snapshot()
    x = waste_memory()
    time2 = tracemalloc.take_snapshot()
    stats = time2.compare_to(time1, 'lineno')
    for stat in stats[:3]:
        print(stat)

這段程式碼會建立大量的 MyObject 物件，並將它們儲存在 deep_values 列表中，模擬記憶體洩漏的情況。透過 tracemalloc，我們可以輕鬆找出記憶體使用量最高的程式碼行數。

玄貓的經驗分享：善用工具，事半功倍

玄貓在過去的專案經驗中，曾多次使用 Profiler 和 tracemalloc 解決效能問題。我認為，Profiling 不僅僅是一種技術，更是一種思維方式。透過不斷地分析和最佳化，我們可以讓我們的程式碼更加高效、穩定。

重點回顧

Profiling 是最佳化 Python 程式碼的關鍵步驟。
print_callers() 能夠幫助我們找出效能瓶頸的呼叫者。
tracemalloc 模組可以追蹤記憶體使用情況，找出記憶體洩漏的根源。
善用 Profiler 和 tracemalloc，能夠讓我們更深入地瞭解程式碼的執行細節，進而提升效能。

希望這篇文章能夠幫助大家更深入地瞭解 Python Profiler 的應用。玄貓將持續分享更多實用的技術知識，敬請期待！