2024年09月17日玄貓（BlackCat）

Python敏感資料安全儲存與應用

本文探討如何在 Python 中安全地儲存和管理敏感資料，涵蓋金鑰輪換、信封加密、安全記憶體管理、日誌安全、監控與稽核等導向。文章提供程式碼範例，演示如何使用 `cryptography`

資安 Web 開發

API 整合 Python 函式 OAuth Kubernetes Docker 資安

現代應用程式中，敏感資料的保護至關重要。本文探討如何利用 Python 和密碼學技術，實作資料的安全儲存和管理。從金鑰輪換和信封加密策略，到安全記憶體管理和日誌記錄實踐，文章提供全面的技術指導。同時，也涵蓋了生產環境的安全組態、監控和入侵檢測，以及如何將安全檢查整合到 CI/CD 流程中，以確保應用程式的安全性。程式碼範例展示瞭如何使用 cryptography 函式庫進行對稱加密、雜湊、數位簽章和金鑰交換等操作，並強調了安全應用設計和金鑰管理的最佳實踐。

進階密碼學技術在敏感資料儲存中的應用

在現代軟體開發中，保護敏感資料的安全儲存是至關重要的。除了基本的加密措施外，進階技術如金鑰輪換、信封加密和安全記憶體管理等，能夠進一步強化資料保護。本文將探討這些技術如何在Python中實作，以確保敏感資料的安全。

金鑰輪換與信封加密

實施金鑰輪換政策是保護資料安全的重要措施。定期更換加密金鑰可以限制因金鑰洩露而導致的資料暴露風險。雖然金鑰輪換可能需要重新加密儲存的資料，但設計系統時採用信封加密（Envelope Encryption）可以顯著降低複雜度。信封加密允許在不立即影響主金鑰的情況下輪換資料金鑰。

from cryptography.hazmat.primitives import hashes
from cryptography.hazmat.primitives.kdf.hkdf import HKDF

def generate_data_key(master_key: bytes) -> bytes:
    hkdf = HKDF(
        algorithm=hashes.SHA256(),
        length=32,
        salt=None,
        info=b'envelope encryption'
    )
    data_key = hkdf.derive(master_key)
    return data_key

內容解密：

此程式碼段展示瞭如何使用主金鑰（master_key）衍生出資料金鑰（data_key）。HKDF（HMAC-based Key Derivation Function）是一種安全的金鑰衍生函式，它利用主金鑰生成用於實際資料加密的金鑰。這種信封加密方法使得金鑰管理更加靈活和安全。

安全記憶體管理

在執行階段處理敏感資訊時，安全儲存也至關重要。敏感資料應僅在必要時儲存在記憶體中。由於Python的垃圾回收機制，安全地清除記憶體中的敏感資料存在一定限制。然而，像cryptography這樣的函式庫提供了最佳實踐建議，包括在使用後明確覆寫緩衝區。

import secrets

def generate_secure_token(length: int = 32) -> str:
    return secrets.token_hex(length)

內容解密：

此函式使用secrets模組生成密碼學安全的隨機token。secrets.token_hex函式用於生成十六進製表示的隨機token，這在生成安全金鑰或令牌時非常有用。

快取與日誌安全

進階應用還必須考慮快取敏感資料的影響。像Redis這樣的記憶體快取必須組態為使用安全的傳輸通道（如TLS），並強制嚴格的存取控制。敏感快取也應實施短暫的過期時間，以確保機密資訊不會在記憶體中駐留過久。同樣，使用安全的日誌記錄實踐至關重要：日誌絕不能包含明文機密資訊。自定義日誌過濾器應清理可能包含敏感資訊的日誌資料。

監控與稽核

對機密資訊使用的稽核和監控在安全儲存策略中扮演不可或缺的角色。由作業系統或外部監控解決方案維護和保護的詳細稽核日誌，可以追蹤所有對敏感資料的存取。異常的存取模式可能指示違規，促使立即調查和補救措施。將此類別監控與入侵偵測系統（IDS）和組態管理工具整合，可以進一步強化組織的深度防禦。

將密碼學技術應用於資料安全

密碼學技術對於實作現代應用中的資料保密性、完整性和真實性是不可或缺的。在Python中，cryptography函式庫已成為事實上的標準，提供對複雜密碼學原語的高階抽象，同時保留了進階使用所需的靈活性。本文將探討一系列密碼學操作，從對稱加密和雜湊到數位簽章和金鑰交換協定，重點關注安全應用設計和適當的金鑰管理實踐。

對稱加密

控制資料保密性通常依賴於對稱加密方案，其中單一金鑰在加密和解密方之間共用。GCM模式下的AES演算法提供了保密性和內建的完整性檢查（透過認證標籤）。為了可靠地實作這一點，nonce的生成和金鑰的安全處理至關重要。

from cryptography.hazmat.primitives.ciphers.aead import AESGCM
import os

def encrypt_message(key: bytes, plaintext: bytes, associated_data: bytes = None) -> tuple:
    # 生成一個安全的隨機nonce。AES-GCM通常使用96位元nonce。
    nonce = os.urandom(12)
    aesgcm = AESGCM(key)
    ciphertext = aesgcm.encrypt(nonce, plaintext, associated_data)
    return nonce, ciphertext

def decrypt_message(key: bytes, nonce: bytes, ciphertext: bytes, associated_data: bytes = None) -> bytes:
    aesgcm = AESGCM(key)
    return aesgcm.decrypt(nonce, ciphertext, associated_data)

# 示例用法：
if __name__ == '__main__':
    key = AESGCM.generate_key(bit_length=128)
    plaintext = b"Confidential data that must remain secret."
    associated_data = b"authenticated but not encrypted data"
    nonce, ciphertext = encrypt_message(key, plaintext, associated_data)
    decrypted = decrypt_message(key, nonce, ciphertext, associated_data)
    assert decrypted == plaintext

內容解密：

此程式碼段演示瞭如何使用AES-GCM進行加密和解密操作。AESGCM類別用於建立一個支援AEAD（Authenticated Encryption with Associated Data）的加密器。encrypt_message函式生成一個隨機nonce並使用AES-GCM加密明文，而decrypt_message函式則執行相應的解密操作。這種方法確保了資料的保密性和完整性。

在Python中應用密碼學確保資料安全

在需要高效能與低延遲的應用場景中，妥善管理nonce（一次性使用的數字）至關重要。在AES-GCM加密模式下，若使用相同的金鑰重複nonce，將幾乎肯定導致機密性災難性失敗。進階的實作通常會將nonce生成與訊息處理分開，以避免無意中重複使用的後果。

資料完整性與真實性驗證

資料的完整性與真實性可透過密碼學雜湊函式和訊息認證碼（MACs）來確保。即使加密資料看似安全，攻擊者仍可能嘗試進行無法偵測的修改，除非資料經過認證。HMAC-SHA256是一種強健的方法，以下範例展示了其實作：

import hmac
import hashlib

def create_hmac(key: bytes, message: bytes) -> bytes:
    mac = hmac.new(key, message, hashlib.sha256)
    return mac.digest()

def verify_hmac(key: bytes, message: bytes, received_mac: bytes) -> bool:
    expected_mac = create_hmac(key, message)
    # 採用恆定時間比較以防止計時攻擊
    return hmac.compare_digest(expected_mac, received_mac)

# 使用範例：
if __name__ == '__main__':
    key = os.urandom(32)
    message = b"Sensitive transaction details."
    mac = create_hmac(key, message)
    assert verify_hmac(key, message, mac)

內容解密：

create_hmac函式使用提供的金鑰和訊息生成HMAC-SHA256認證碼。
verify_hmac函式驗證接收到的MAC是否與預期的MAC相符。
使用hmac.compare_digest進行恆定時間比較，防止計時攻擊。

開發者必須根據當前的威脅模型選擇適當的密碼學原語。例如，HMAC保證了資料的任何修改都是可偵測的，只要金鑰保持秘密。此外，使用恆定時間比較函式（如上所示）可減輕側通道攻擊的風險。

數位簽章與非對稱密碼學

數位簽章提供了一個基本機制，確保了真實性和不可否認性。非對稱密碼學允許一方在無需共用秘密金鑰的情況下驗證訊息的來源。RSA演算法仍然被廣泛使用，儘管近年來的趨勢偏好橢圓曲線密碼學（ECC），因為其效率更高且金鑰尺寸更小。以下程式碼展示了RSA金鑰生成和訊息簽章：

from cryptography.hazmat.primitives import serialization, hashes
from cryptography.hazmat.primitives.asymmetric import rsa, padding

def generate_rsa_keypair():
    private_key = rsa.generate_private_key(public_exponent=65537, key_size=2048)
    public_key = private_key.public_key()
    return private_key, public_key

def sign_message(private_key, message: bytes) -> bytes:
    signature = private_key.sign(
        message,
        padding.PSS(
            mgf=padding.MGF1(hashes.SHA256()),
            salt_length=padding.PSS.MAX_LENGTH
        ),
        hashes.SHA256()
    )
    return signature

def verify_signature(public_key, message: bytes, signature: bytes) -> bool:
    try:
        public_key.verify(
            signature,
            message,
            padding.PSS(
                mgf=padding.MGF1(hashes.SHA256()),
                salt_length=padding.PSS.MAX_LENGTH
            ),
            hashes.SHA256()
        )
        return True
    except Exception:
        return False

# 使用範例：
if __name__ == '__main__':
    message = b"Message requiring non-repudiation."
    private_key, public_key = generate_rsa_keypair()
    signature = sign_message(private_key, message)
    assert verify_signature(public_key, message, signature)

內容解密：

generate_rsa_keypair函式生成RSA私鑰和公鑰對。
sign_message函式使用私鑰對訊息進行簽章。
verify_signature函式使用公鑰驗證簽章。

對於根據ECC的簽章，也有類別似的方法，但使用不同的金鑰生成和簽章演算法。由於ECC具有更快的計算速度和更小的金鑰尺寸，在受限環境或高容量系統中使用這些技術可以獲得顯著的效能提升。

金鑰交換機制

金鑰交換機制對於安全通訊也至關重要。Diffie-Hellman（DH）及其改進版本，如橢圓曲線Diffie-Hellman（ECDH），使兩方能夠在不安全的通道上推匯出共用秘密。Python的cryptography函式庫為此類別操作提供了簡單的API。考慮以下使用ECDH的範例：

from cryptography.hazmat.primitives.asymmetric import ec

def generate_ecdh_keypair():
    private_key = ec.generate_private_key(ec.SECP384R1())
    public_key = private_key.public_key()
    return private_key, public_key

def derive_shared_secret(private_key, peer_public_key) -> bytes:
    return private_key.exchange(ec.ECDH(), peer_public_key)

# 使用範例：
if __name__ == '__main__':
    priv_key_a, pub_key_a = generate_ecdh_keypair()
    priv_key_b, pub_key_b = generate_ecdh_keypair()
    shared_secret_a = derive_shared_secret(priv_key_a, pub_key_b)
    shared_secret_b = derive_shared_secret(priv_key_b, pub_key_a)
    assert shared_secret_a == shared_secret_b

內容解密：

generate_ecdh_keypair函式生成ECDH私鑰和公鑰對。
derive_shared_secret函式推匯出雙方共用的秘密。

此共用秘密隨後可用作對稱加密的金鑰，從而建立一個混合密碼系統，利用非對稱和對稱技術進行安全通訊。

密碼學引數選擇與管理

選擇和管理密碼學引數需要專家審查。根據密碼的金鑰派生函式（PBKDF），如PBKDF2、scrypt或Argon2，對於將低熵秘密轉換為強大的密碼學金鑰至關重要。仔細最佳化迭代次數和鹽生成增加了對暴力破解攻擊的防禦層。下面展示了PBKDF2的使用範例：

from cryptography.hazmat.primitives.kdf.pbkdf2 import PBKDF2HMAC
from cryptography.hazmat.backends import default_backend
import base64

def derive_key(password: str, salt: bytes, iterations: int = 100000) -> bytes:
    kdf = PBKDF2HMAC(
        algorithm=hashes.SHA256(),
        length=32,
        salt=salt,
        iterations=iterations,
        backend=default_backend()
    )
    return base64.urlsafe_b64encode(kdf.derive(password.encode()))

# 使用範例：
if __name__ == '__main__':
    password = "ComplexPassphrase!"
    salt = os.urandom(16)
    key = derive_key(password, salt)

內容解密：

derive_key函式使用PBKDF2-HMAC從密碼和鹽派生出金鑰。

給定密碼學研究的持續進展和量子計算威脅的出現，保持與最佳實踐同步並定期更新密碼學原語是至關重要的。在確保舊的、已棄用的方法在生產系統中被逐步淘汰的同時，保持與新興演算法的相容性，是高階開發者的基本責任。

安全佈署：Python 應用程式的生產環境組態與監控

在現代軟體開發中，安全佈署是確保 Python 應用程式在生產環境中穩定執行的關鍵。本文將探討生產組態、環境隔離和監控方法，以保護 Python 應用程式免受新出現的安全威脅。

執行環境的安全組態

執行環境的安全組態是維運安全的第一步。生產系統應使用專用的組態管理系統，以確保秘密金鑰、存取憑證和組態檔案的安全載入。環境變數雖然廣泛使用，但必須使用安全的協調工具進行設定，並且不得在佈署構件中硬編碼。

使用 Kubernetes 管理秘密

例如，使用容器協調系統如 Kubernetes，可以透過以下 YAML 組態指定秘密：

apiVersion: v1
kind: Secret
metadata:
  name: app-secrets
type: Opaque
data:
  API_KEY: c29tZS1zZWNyZXQta2V5 # Base64-encoded value
---
apiVersion: v1
kind: Pod
metadata:
  name: secure-python-app
spec:
  containers:
  - name: app
    image: myregistry/secure-python-app:latest
    env:
    - name: API_KEY
      valueFrom:
        secretKeyRef:
          name: app-secrets
          key: API_KEY

Dockerfile 的安全最佳實踐

利用協調工具可以確保敏感引數在佈署期間動態注入，減少在版本控制系統和構建構件中暴露的可能性。此外，容器化本身提供了一層隔離。安全 Dockerfile 的實踐至關重要，例如最小化基礎映像足跡、以非 root 使用者身份執行、停用不必要的服務以及應用嚴格的檔案系統許可權。

FROM python:3.9-slim
# 防止 Python 寫入 .pyc 檔案並啟用無緩衝輸出。
ENV PYTHONDONTWRITEBYTECODE=1
ENV PYTHONUNBUFFERED=1

# 建立並使用非 root 使用者。
RUN adduser --disabled-password --gecos "" appuser
USER appuser
WORKDIR /home/appuser/app
# 複製依賴項規範並安裝生產依賴項。
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
# 複製應用程式原始碼。
COPY . .
# 定義非特權命令以供執行時使用。
CMD ["gunicorn", "-b", "0.0.0.0:8000", "app:app"]

內容解密：

FROM python:3.9-slim：使用精簡的 Python 3.9 映象作為基礎，減少了映像大小和攻擊面。
ENV PYTHONDONTWRITEBYTECODE=1 和 ENV PYTHONUNBUFFERED=1：設定環境變數以防止 Python 生成 .pyc 檔案並啟用無緩衝輸出，提高了安全性和除錯能力。
RUN adduser --disabled-password --gecos "" appuser：建立一個新的非 root 使用者 appuser，並停用密碼登入，提高安全性。
USER appuser 和 WORKDIR /home/appuser/app：切換到非 root 使用者並設定工作目錄，減少了應用程式的許可權。
COPY requirements.txt . 和 RUN pip install --no-cache-dir -r requirements.txt：安裝生產依賴項，避免將不必要的套件納入映像中。
COPY . .：將應用程式原始碼複製到容器中。
CMD ["gunicorn", "-b", "0.0.0.0:8000", "app:app"]：使用 Gunicorn 作為 WSGI 伺服器，並繫結到 0.0.0.0:8000，提供服務。

生產級 WSGI 伺服器與反向代理的組態

在生產環境中，選擇和組態 Web 伺服器或應用程式伺服器至關重要。使用生產級 WSGI 伺服器如 Gunicorn，結合反向代理如 Nginx，不僅提供效能最佳化，還增加了諸如請求過濾、速率限制和 TLS 終止等安全措施。

Gunicorn 組態範例

bind = "127.0.0.1:8000"
workers = 4
worker_class = "gevent"
timeout = 30
limit_request_line = 4094
limit_request_fields = 100
limit_request_field_size = 8190

Nginx 組態與 TLS 設定

Nginx 組態為安全地將流量路由到 Python 應用程式，同時在緩解拒絕服務攻擊和轉發安全標頭方面發揮作用。典型的生產組態包括利用強加密演算法和強制 HTTP 嚴格傳輸安全性（HSTS）的 TLS 設定。

日誌記錄與監控

除了組態之外，日誌記錄和監控是安全生產基礎設施的基本組成部分。全面日誌記錄必須捕捉與安全相關的事件，而不洩露敏感資訊。Python 中的高階日誌框架，如具有自定義格式化程式的日誌記錄，能夠從日誌中刪除機密詳細資訊。

安全日誌設定範例

import logging
import re

class RedactingFormatter(logging.Formatter):
    def format(self, record):
        message = super().format(record)
        # 編輯日誌中的潛在 API 金鑰或令牌。
        message = re.sub(r'(?i)(api[_-]?key\s*[:=]\s*)(\S+)', r'\1[REDACTED]', message)
        message = re.sub(r'(?i)(token\s*[:=]\s*)(\S+)', r'\1[REDACTED]', message)
        return message

logger = logging.getLogger("prodLogger")
handler = logging.StreamHandler()
handler.setFormatter(RedactingFormatter("%(asctime)s - %(levelname)s - %(message)s"))
logger.addHandler(handler)
logger.setLevel(logging.INFO)
logger.info("Application started with api_key: ABCDEFGHIJ1234567890")

內容解密：

自定義的日誌格式化程式 RedactingFormatter 繼承自 logging.Formatter，用於編輯敏感資訊。
使用正規表示式替換日誌中的 API 金鑰和令牌，避免敏感資訊洩露。

連續監控與入侵檢測

佈署環境應與 SIEM（安全資訊和事件管理）解決方案整合，能夠聚合日誌、檢測異常模式並提醒管理員注意可疑活動。監控可以包括檢查異常的 API 使用模式、意外的程式執行和網路探測。

自動化安全檢查與 CI/CD 整合

在應用程式生命週期內自動執行健康和安全檢查對於早期發現問題至關重要。將安全掃描器（如 bandit 用於靜態程式碼分析和 clair 用於容器漏洞掃描）整合到 CI/CD 管道中是必不可少的。

GitLab CI 組態範例

stages:
  - build
  - test
  - security_scan

build:
  stage: build
  script:
    - docker build -t myregistry/secure-python-app:latest .

unit_tests:
  stage: test
  script:
    - pytest --maxfail=1 --disable-warnings -q

dependency_scan:
  stage: security_scan
  image: python:3.9
  script:
    - pip install bandit
    - bandit -r .
  only:
    - merge_requests

內容解密：

定義了三個階段：build、test 和 security_scan。
在 build 階段，使用 Docker 建置映像。
在 test 階段，執行單元測試。
在 security_scan 階段，使用 Bandit 對程式碼進行靜態分析，檢查潛在的安全問題。

網路隔離與存取控制

生產環境中的存取控制透過網路分段和隔離策略進一步細化。虛擬私有雲（VPC）和軟體定義網路（SDN）可以組態為限制元件間的通訊僅限於必要範圍。實施防火牆、強制嚴格的入站/出站規則以及在 Linux 主機上使用 iptables 等工具，可以顯著減少攻擊面。

事件回應與災難還原

事件回應和災難還原程式必須明確定義並定期測試。這包括組態日誌保留策略、維護關鍵資料的備份副本（加密且防篡改），以及實施在檢測到入侵時快速回復的機制。

事件回應自動化範例

import requests
import json

def send_security_alert(message: str, severity: str = "high"):
    url = "https://alerting.example.com/webhook"
    payload = {
        "alert": message,
        "severity": severity
    }
    headers = {"Content-Type": "application/json"}
    response = requests.post(url, data=json.dumps(payload), headers=headers, timeout=10)
    response.raise_for_status()

內容解密：

定義了一個函式 send_security_alert，用於向集中式警示系統傳送安全警示。
使用 requests 傳送 POST 請求，將警示資訊和嚴重性級別傳遞給指定的 webhook URL。