异常处理进阶

Python进阶编程专题 · 构建健壮的Python异常处理体系

专题：Python进阶编程系统学习

关键词：Python, 异常处理进阶, 异常链, raise from, ExceptionGroup, 自定义异常, traceback

一、概述：异常处理在Python中的地位

Python的异常处理机制是其核心语言特性之一，也是编写健壮、可维护代码的关键。与C语言通过返回值传递错误不同，Python采用"请求宽恕比请求许可更容易"（EAFP, Easier to Ask for Forgiveness than Permission）的哲学，鼓励开发者大胆执行可能在运行时失败的操作，并在失败发生时优雅地捕获和处理异常。

然而，许多Python开发者对异常处理的理解停留在基础的 try-except-finally 层面，未能充分利用Python异常体系提供的丰富能力。本文将从进阶角度系统性地剖析Python异常处理的完整图景，涵盖异常链、自定义异常体系、异常分组、全局钩子、traceback深度分析和性能优化等高级主题。

理解这些进阶概念不仅能帮助你写出更健壮的代码，还能让你在设计库、框架和大型系统时做出更合理的错误处理架构决策。

二、异常链：捕获与重抛的完整信息保留

在实际开发中，经常需要在捕获一个异常后抛出另一个异常（异常转译）。Python通过 raise ... from ... 语法提供了异常链机制，确保错误追踪信息不会丢失。

2.1 raise from 的基本用法

当一个异常在捕获另一个异常后被引发时，Python会自动建立 __context__ 隐式异常链。使用 raise ... from ... 可以显式设置 __cause__ 属性。

# 隐式异常链：__context__
def divide(a, b):
    try:
        return a / b
    except ZeroDivisionError as e:
        raise ValueError("除数不能为零")  # 自动设置 __context__

# 显式异常链：__cause__
def load_config(path):
    try:
        with open(path) as f:
            return parse(f.read())
    except FileNotFoundError as e:
        raise ConfigError("配置文件不存在") from e  # 显式设置 __cause__

2.2 cause 与 context 的区别

__cause__ 和 __context__ 都是异常实例的属性，用于追踪异常的来源，但行为有所不同：

# __cause__ 使用 raise from 显式设置
try:
    raise ValueError("原始异常") from TypeError("根本原因")
except ValueError as e:
    print(f"__cause__: {e.__cause__}")       # TypeError("根本原因")
    print(f"__context__: {e.__context__}")    # None

# __context__ 由解释器自动设置（无 raise from）
try:
    raise TypeError("中间异常")
except TypeError:
    raise ValueError("最终异常")
# ValueError 的 __context__ 自动指向 TypeError

关键区别：当同时存在 __cause__ 和 __context__ 时，Python优先显示 __cause__ 且不显示 __context__。如果使用 raise from None，则显式抑制异常链，只显示最终异常。

2.3 raise from None 抑制异常链

在某些场景下，底层的实现细节不应暴露给调用者，此时可以使用 raise from None 切断异常链。

class UserNotFoundError(Exception):
    pass

def get_user(user_id):
    try:
        return database.query(f"SELECT * FROM users WHERE id = {user_id}")
    except DatabaseConnectionError:
        # 调用者不需要知道数据库连接细节
        raise UserNotFoundError(f"用户 {user_id} 不可用") from None

最佳实践：在库代码中，推荐使用 raise from 保留完整的错误上下文；仅在确定调用者不需要了解底层技术细节时才使用 raise from None。

三、自定义异常体系：设计可扩展的错误层次

在大型项目中，定义一套层次清晰的自定义异常体系至关重要。好的异常体系可以让调用者精确捕获特定的错误类型，同时保持向上兼容。

3.1 基类设计原则

Python的异常继承自 BaseException。用户自定义异常应该继承 Exception（而非 BaseException），因为 BaseException 的子类包括 SystemExit、KeyboardInterrupt 和 GeneratorExit，这些通常不应该被普通业务代码捕获。

# 应用级别的异常基类
class AppError(Exception):
    """应用所有异常的基类"""
    def __init__(self, message, code=None):
        self.code = code
        super().__init__(message)

# 分层设计：按模块划分
class DatabaseError(AppError):
    """数据库相关异常的基类"""
    pass

class ConnectionError(DatabaseError):
    """数据库连接异常"""
    def __init__(self, message, host=None, port=None):
        self.host = host
        self.port = port
        super().__init__(message, code="DB_CONN_ERR")

class QueryError(DatabaseError):
    """数据库查询异常"""
    pass

class BusinessError(AppError):
    """业务逻辑异常的基类"""
    pass

class InsufficientBalanceError(BusinessError):
    """余额不足异常"""
    def __init__(self, balance, required):
        self.balance = balance
        self.required = required
        super().__init__(
            f"余额不足: {balance} < {required}",
            code="INSUFFICIENT_BALANCE"
        )

3.2 捕获粒度的层次控制

自定义异常的层次结构赋予了调用者灵活的异常捕获能力——既可以用基类粗粒度捕获整类异常，也可以用子类细粒度处理特定错误。

# 粗粒度捕获：捕获所有数据库异常
try:
    result = execute_query(sql)
except DatabaseError as e:
    log.error(f"数据库操作失败: {e}")
    rollback()

# 细粒度捕获：分别处理不同类型的数据库异常
try:
    result = execute_critical_query(sql)
except ConnectionError as e:
    log.critical(f"数据库连接中断 [{e.host}:{e.port}]")
    notify_admin()
except QueryError as e:
    log.error(f"查询语法错误: {e}")
    raise  # 语法错误不应被吞没
except DatabaseError as e:
    log.warning(f"其他数据库异常: {e}")
    retry()

设计原则：自定义异常体系应遵循"宽基类、窄子类"原则。基类提供公共接口（如错误码、上下文属性），子类表达具体的错误语义。层次深度一般不超过3层。

四、异常分组：PEP 654 ExceptionGroup 与 except*

Python 3.11引入的PEP 654带来了 ExceptionGroup 和 except* 语法，这是异常处理机制自Python诞生以来最重大的变革之一。该特性使得同时抛出并分别处理多个无关的异常成为可能。

4.1 ExceptionGroup 的基本用法

ExceptionGroup 可以打包多个异常实例，每个异常可以属于不同的类型。使用 except* 可以根据异常类型分别处理组内的不同异常。

def validate_user(user):
    errors = []
    try:
        validate_name(user.name)
    except ValidationError as e:
        errors.append(e)
    try:
        validate_email(user.email)
    except ValidationError as e:
        errors.append(e)
    try:
        validate_age(user.age)
    except ValidationError as e:
        errors.append(e)

    if errors:
        raise ExceptionGroup("用户验证失败", errors)

# 使用 except* 分别处理
try:
    validate_user(user)
except* NameValidationError as e:
    print(f"名称验证问题: {e.exceptions}")
except* EmailValidationError as e:
    print(f"邮箱验证问题: {e.exceptions}")
except* AgeValidationError as e:
    print(f"年龄验证问题: {e.exceptions}")

4.2 except* 的匹配语义

except* 与传统的 except 在语义上有重要区别。传统 except 捕获一个异常后就退出 try 块；except* 则会扫描 ExceptionGroup 中所有异常，将匹配的异常取出处理，未匹配的继续留在组中。

try:
    raise ExceptionGroup("复合错误", [
        TypeError("类型错误"),
        ValueError("值错误"),
        RuntimeError("运行时错误"),
    ])
except* TypeError as e:
    print(f"处理类型错误: {e}")    # 仅取出 TypeError
except* ValueError as e:
    print(f"处理值错误: {e}")      # 仅取出 ValueError
# RuntimeError 未被捕获 —— 继续向上传播

注意：except* 不能与传统的 except 混用在同一个 try 块中。如果 ExceptionGroup 中的某个异常未被任何 except* 匹配，它会在处理完所有 except* 后被重新抛出。

4.3 应用场景：并发任务错误收集

ExceptionGroup 特别适用于并发编程场景，多个并发任务各自产生不同类型的异常需要统一收集和分类处理。

import asyncio

async def fetch_url(url, timeout):
    if timeout < 0:
        raise ValueError(f"无效超时: {timeout}")
    # 模拟网络请求
    await asyncio.sleep(0.1)
    return f"data from {url}"

async def fetch_all(urls):
    tasks = [
        asyncio.create_task(fetch_url(url, i - 1))
        for i, url in enumerate(urls)
    ]
    results = await asyncio.gather(*tasks, return_exceptions=True)

    errors = [r for r in results if isinstance(r, Exception)]
    successes = [r for r in results if not isinstance(r, Exception)]

    if errors:
        raise ExceptionGroup("部分请求失败", errors)

    return successes

五、异常抑制：contextlib.suppress

在某些场景下，我们希望忽略特定类型的异常而不做任何处理。传统方式是用空的 except 块，但这样不仅冗长，还会在代码中留下一个看似遗漏处理的视觉陷阱。contextlib.suppress 提供了语义清晰的替代方案。

from contextlib import suppress
import os

# 传统方式
try:
    os.remove("temp.txt")
except FileNotFoundError:
    pass

# 使用 suppress
with suppress(FileNotFoundError):
    os.remove("temp.txt")

# 同时抑制多种异常
with suppress(FileNotFoundError, PermissionError):
    os.remove("protected_file.txt")

# 抑制字典 KeyError
user = {"name": "Alice"}
with suppress(KeyError):
    print(user["age"])  # 键不存在时静默忽略

警告：suppress 适用于明确知道异常可以安全忽略的场景。滥用 suppress 会掩盖潜在的编程错误，应谨慎使用。

六、异常转译模式：适配层的错误抽象

异常转译（Exception Translation）是分层架构中的关键模式。当底层实现细节（如数据库驱动、网络协议、第三方SDK）发生变化时，如果没有异常适配层，上层代码将面临大规模修改。

6.1 适配器模式中的异常转译

# 第三方库可能抛出的异常
# psycopg2.OperationalError, pymongo.AutoReconnect, redis.ConnectionError

class StorageError(Exception):
    """应用层存储抽象异常"""
    pass

class StorageAdapter:
    """存储适配器：将底层异常转译为应用层异常"""

    def __init__(self, backend):
        self._backend = backend

    def save(self, key, value):
        try:
            self._backend.set(key, value)
        except (ConnectionError, TimeoutError) as e:
            raise StorageError(
                f"存储服务不可用: {key}"
            ) from e
        except PermissionError as e:
            raise StorageError(
                f"存储权限不足: {key}"
            ) from e

6.2 统一的异常转译装饰器

from functools import wraps

def translate_error(from_exc, to_exc, message=None):
    """装饰器：将指定类型的异常转译为目标异常"""
    def decorator(func):
        @wraps(func)
        def wrapper(*args, **kwargs):
            try:
                return func(*args, **kwargs)
            except from_exc as e:
                msg = message or str(e)
                raise to_exc(msg) from e
        return wrapper
    return decorator

class ServiceError(Exception):
    pass

class PaymentError(ServiceError):
    pass

@translate_error(ConnectionError, PaymentError, "支付网关连接失败")
def process_payment(amount, card_info):
    # 可能抛出 ConnectionError 的底层调用
    return payment_gateway.charge(amount, card_info)

转译原则：异常转译应遵循"保留下层语义，暴露上层抽象"的原则。使用 raise from 保留原始异常链，方便调试时追溯根因。避免在转译过程中丢失重要的错误上下文。

七、Clean Architecture 中的异常处理

在Clean Architecture（整洁架构）中，依赖规则要求内层（实体/用例层）不能依赖外层（基础设施层）。这一规则同样适用于异常处理——内层代码不能抛出或依赖外层定义的异常。

7.1 用例层的异常定义

# 领域层/用例层 —— 定义业务异常
class UseCaseError(Exception):
    """所有用例异常的基类"""
    pass

class EntityNotFoundError(UseCaseError):
    """实体未找到"""
    def __init__(self, entity_type, entity_id):
        self.entity_type = entity_type
        self.entity_id = entity_id
        super().__init__(f"{entity_type} 未找到: {entity_id}")

class BusinessRuleViolation(UseCaseError):
    """业务规则违反"""
    pass

# 用例层 —— 不依赖任何基础设施异常
class CreateOrderUseCase:
    def __init__(self, order_repo, payment_service):
        self._repo = order_repo
        self._payment = payment_service

    def execute(self, request):
        # 业务验证
        if request.amount <= 0:
            raise BusinessRuleViolation("订单金额必须为正数")

        # 领域层不捕获基础设施异常 ——
        # 由适配器层负责转译
        order = self._repo.save(request.to_order())
        return order

7.2 适配器层的异常转译责任

# 适配器层 —— 负责转译基础设施异常
class PostgresOrderRepository(OrderRepository):
    def save(self, order):
        try:
            with self._session.begin():
                self._session.add(order)
        except IntegrityError as e:
            # 将数据库异常转译为领域异常
            raise BusinessRuleViolation(
                "订单数据违反唯一约束"
            ) from e
        except OperationalError as e:
            raise EntityNotFoundError(
                "Order", order.id
            ) from e

架构价值：这种分层异常处理确保当数据库从PostgreSQL切换到MongoDB，甚至从关系型数据库切换到文件系统时，用例层的代码不需要任何修改。异常的转译边界正是架构的边界。

八、finally 与 with 语句的资源清理保证

资源清理（文件句柄、网络连接、锁等）是异常处理中最容易被忽视的环节。Python提供了 finally 和 with 两种机制来保证清理代码一定会被执行。

8.1 finally 的执行语义

finally 块在以下所有情况下都会执行：（1）try块正常结束；（2）遇到 return/break/continue；（3）异常被捕获；（4）异常未被捕获。唯一的例外是解释器被 os._exit() 强制终止或发生段错误。

def read_file(path):
    f = None
    try:
        f = open(path, "r")
        return f.read()     # ← return 会执行 finally 后再返回
    except FileNotFoundError:
        return "默认内容"    # ← 同样是 finally 执行后再返回
    finally:
        if f is not None:
            f.close()       # ← 无论如何都会执行

# 注意：finally 中的 return 会覆盖 try 中的 return
def subtle_bug():
    try:
        return "try"
    finally:
        return "finally"    # ← 覆盖了 "try"，返回 "finally"

陷阱：finally 块中不应包含 return 语句。这样做不仅会覆盖 try 块的返回值，还会吞掉 try 块中可能抛出的异常，导致极难排查的bug。

8.2 上下文管理器（with语句）

上下文管理器是比 try-finally 更优雅的资源管理方式。它通过 __enter__ 和 __exit__ 协议，将资源获取和释放封装在一起。

# 自定义上下文管理器
class ManagedTransaction:
    def __init__(self, conn):
        self._conn = conn

    def __enter__(self):
        self._conn.begin()
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        if exc_type is not None:
            # 有异常时回滚
            self._conn.rollback()
            return False  # 不吞没异常，继续传播
        else:
            # 无异常时提交
            self._conn.commit()
            return True

# 使用示例
with ManagedTransaction(connection) as tx:
    tx.execute("UPDATE accounts SET balance = balance - 100 WHERE id = 1")
    tx.execute("UPDATE accounts SET balance = balance + 100 WHERE id = 2")
    # 如果中间任何操作抛出异常，自动回滚

8.3 @contextmanager 装饰器

使用标准库的 @contextmanager 装饰器可以用生成器的形式快速创建上下文管理器，无需手动实现 __enter__ 和 __exit__。

from contextlib import contextmanager

@contextmanager
def timed_block(label):
    start = time.time()
    try:
        yield  # 这里是 with 块实际执行的区域
    finally:
        elapsed = time.time() - start
        print(f"{label} 耗时 {elapsed:.3f}s")

# 使用
with timed_block("数据库查询"):
    result = db.query("SELECT * FROM large_table")

# 多个上下文管理器嵌套
with (
    open("input.txt") as fin,
    open("output.txt", "w") as fout,
    timed_block("文件处理"),
):
    fout.write(fin.read().upper())

九、sys.excepthook：全局异常钩子

sys.excepthook 是Python解释器在遇到未捕获异常时调用的钩子函数。通过替换它，可以实现全局的异常记录、监控告警、自定义错误输出等功能。

9.1 基础用法

import sys
import logging

logger = logging.getLogger(__name__)

def global_exception_handler(exc_type, exc_value, exc_traceback):
    """全局未捕获异常处理器"""
    if issubclass(exc_type, KeyboardInterrupt):
        # 对于 Ctrl+C，调用系统默认处理器
        sys.__excepthook__(exc_type, exc_value, exc_traceback)
        return

    # 记录异常到日志系统
    logger.critical(
        "未捕获的异常",
        exc_info=(exc_type, exc_value, exc_traceback)
    )

    # 发送告警通知
    send_alert(f"进程异常终止: {exc_value}")

    # 调用系统默认处理器（可选）
    sys.__excepthook__(exc_type, exc_value, exc_traceback)

# 替换全局钩子
sys.excepthook = global_exception_handler

9.2 多线程中的异常钩子

需要注意的是，sys.excepthook 只对主线程有效。从Python 3.8开始，threading.excepthook 提供了线程级别的异常处理能力。

import threading

def thread_exception_handler(args):
    """工作线程的未捕获异常处理器"""
    print(f"线程 [{args.thread.name}] 发生未捕获异常:")
    print(f"  异常类型: {args.exc_type.__name__}")
    print(f"  异常信息: {args.exc_value}")

# 设置线程异常钩子
threading.excepthook = thread_exception_handler

def worker():
    raise RuntimeError("工作线程内部错误")

t = threading.Thread(target=worker, name="Worker-1")
t.start()
t.join()

9.3 asyncio 中的异常钩子

import asyncio

def asyncio_exception_handler(loop, context):
    """asyncio 事件循环中的异常处理器"""
    message = context.get("message", "未知异常")
    exception = context.get("exception")
    future = context.get("future")

    print(f"[事件循环异常] {message}")
    if exception:
        print(f"  类型: {type(exception).__name__}")
        print(f"  详情: {exception}")
    if future:
        print(f"  Future: {future}")

# 配置事件循环的异常处理器
loop = asyncio.new_event_loop()
loop.set_exception_handler(asyncio_exception_handler)
asyncio.set_event_loop(loop)

最佳实践：在生产环境中，sys.excepthook 通常是"最后一道防线"，应确保日志记录和告警通知不会抛出异常。建议在全局钩子内部包裹 try-except，以免钩子本身的异常导致信息丢失。

十、traceback 模块深入：精确的异常诊断

traceback 模块提供了比默认异常输出更精细的控制能力，是开发和运维中进行异常诊断的利器。

10.1 format_exc：获取格式化的异常字符串

import traceback
import sys

def risky_operation():
    return 1 / 0

try:
    risky_operation()
except Exception:
    # 获取完整的异常回溯字符串
    error_str = traceback.format_exc()
    print("=== 完整异常追踪 ===")
    print(error_str)

    # 只获取异常类型和消息（不含追踪栈）
    exc_type, exc_value, _ = sys.exc_info()
    print(f"精简报告: {exc_type.__name__}: {exc_value}")

10.2 extract_tb：结构化追踪栈分析

extract_tb 将回溯信息解析为结构化的 FrameSummary 对象列表，支持编程式分析和过滤。

import traceback

def inner():
    raise ValueError("内部错误")

def middle():
    inner()

def outer():
    middle()

try:
    outer()
except ValueError:
    tb = traceback.extract_tb(sys.exception().__traceback__)

    print("=== 追踪栈分析 ===")
    for frame in tb:
        print(f"  文件: {frame.filename}")
        print(f"  行号: {frame.lineno}")
        print(f"  函数: {frame.name}")
        print(f"  代码: {frame.line}")
        print(f"  是否源码: {not frame.locals}")
        print()

    # 过滤：只显示当前项目目录的帧
    project_frames = [
        f for f in tb
        if "/my_project/" in f.filename
    ]
    print(f"项目内帧数: {len(project_frames)}/{len(tb)}")

10.3 print_exception：自定义输出格式

import traceback

def custom_error_report(exception):
    """自定义异常报告格式"""
    print("=" * 60)
    print(f"[错误报告] {type(exception).__name__}")
    print("-" * 60)

    # 提取追踪栈
    tb = traceback.extract_tb(exception.__traceback__)

    # 从外到内打印调用链
    for i, frame in enumerate(tb):
        indent = "  " * i
        location = f"{frame.filename}:{frame.lineno}"
        print(f"{indent}→ {location}")
        print(f"{indent}  在 {frame.name}() 中")
        if frame.line:
            print(f"{indent}  └─ {frame.line.strip()}")

    print("-" * 60)
    print(f"错误信息: {exception}")
    print("=" * 60)

# 使用
try:
    # 一些复杂操作
    data = {"key": "value"}
    data["missing"]["nested"]
except Exception as e:
    custom_error_report(e)

10.4 walk_stack 与 walk_tb：生成器形式的遍历

import traceback

def debug_call_stack():
    """打印当前调用栈，用于调试"""
    print("=== 当前调用栈 ===")
    # 从当前栈帧往上遍历
    for frame, lineno in traceback.walk_stack(None):
        co = frame.f_code
        print(f"  {co.co_filename}:{lineno} in {co.co_name}")
        if frame.f_locals:
            # 显示关键局部变量
            for var in ["self", "request", "user_id"]:
                if var in frame.f_locals:
                    print(f"    [{var}] = {frame.f_locals[var]}")

性能提示：traceback.extract_tb 和 format_exc 在异常路径上调用有性能开销。在性能敏感的热路径上，应避免构建和格式化完整的追踪栈，可以考虑仅在日志级别达到 WARNING 或 ERROR 时才进行这些操作。

十一、异常处理的性能影响分析

异常处理不是免费的一一它既有语法层面的开销，也有运行时追踪栈构建的开销。理解这些性能特征对于编写高性能Python代码至关重要。

11.1 try 块零开销原则

Python解释器采用"零开销"模式实现 try 块：如果未发生异常，try 块没有任何性能开销。这是因为Python编译器在编译时就将异常处理表嵌入到字节码中，运行时不会检查异常。

import timeit

# 测试1：无 try 的正常执行
def no_try():
    for i in range(1000):
        _ = i * 2

# 测试2：有 try 但无异常
def try_no_exception():
    for i in range(1000):
        try:
            _ = i * 2
        except Exception:
            pass

# 测试3：每次抛出并捕获异常
def try_with_exception():
    for i in range(1000):
        try:
            raise ValueError("测试")
        except ValueError:
            pass

# 性能对比（结果仅供参考）
print("无 try:", timeit.timeit(no_try, number=1000))         # ~0.02s
print("有 try 无异常:", timeit.timeit(try_no_exception, number=1000))  # ~0.02s (基本无差异)
print("有异常:", timeit.timeit(try_with_exception, number=1000))       # ~1.5s (约75倍慢)

关键结论：try 块本身无性能开销；异常的抛出和捕获（而非 try 块）才是性能瓶颈。异常发生时，解释器需要构建 traceback 对象、展开栈帧、查找匹配的 except 处理器。因此，"用异常做流程控制"是性能反模式。

11.2 EAFP vs LBYL 的性能权衡

Python社区中关于EAFP（请求宽恕比请求许可容易）和LBYL（三思而后行）的争论往往聚焦于可读性，但性能也是一个重要的考量维度。

LBYL（先检查再执行）

def lbyl_divide(a, b):
    if not isinstance(a, (int, float)):
        return None
    if not isinstance(b, (int, float)):
        return None
    if b == 0:
        return None
    return a / b

EAFP（先执行再处理）

def eafp_divide(a, b):
    try:
        return a / b
    except (TypeError, ZeroDivisionError):
        return None

在正常路径（无异常）下，EAFP版本的性能优于LBYL版本，因为它避免了类型检查和条件判断。但在异常路径上，EAFP的开销远大于LBYL。因此，当异常概率很低时（<1%），EAFP更优；当异常概率较高时，LBYL更合适。

11.3 性能优化建议

避免在循环内部抛出异常：如果循环的大多数迭代都可能触发异常，应使用前置条件检查。
缩小 try 块的范围：只包裹可能抛出异常的代码行，而非整个函数体。
区分"真正的异常"和"预期分支"：KeyError/StopIteration 在特定场景下可作为流程控制（如生成器），但应保持克制。
使用 __suppress_context__ 优化异常链：如果不需要保留完整的异常链，考虑使用 raise from None 减少 traceback 构造开销。

# 不推荐：循环内抛异常
def find_user_bad(users, target_id):
    for user in users:
        try:
            if user.id == target_id:
                return user
        except AttributeError:
            pass  # user 没有 id 属性
    return None

# 推荐：前置检查
def find_user_good(users, target_id):
    for user in users:
        if not hasattr(user, 'id'):
            continue
        if user.id == target_id:
            return user
    return None

十二、核心要点总结

异常链（raise from）：使用 raise ... from ... 保留完整的异常因果链；使用 raise from None 仅在确定需要隐藏实现细节时使用。
自定义异常体系：继承 Exception 而非 BaseException；设计"宽基类、窄子类"的层次结构；利用基类提供统一的错误属性和代码。
ExceptionGroup（PEP 654）：Python 3.11+ 支持打包多个无关异常并用 except* 分类处理；特别适用于并发任务错误收集。
contextlib.suppress：比空的 except: pass 语义更清晰的异常抑制方式，但应谨慎使用。
异常转译：在分层架构的边界处（适配器层）进行异常转译，确保内层不依赖外层异常。
Clean Architecture：领域/用例层定义业务异常，适配器层负责将基础设施异常转译为业务异常。
资源清理：finally 保证在任何情况下执行；with 语句（上下文管理器）是更优雅的资源管理方式；谨慎对待 finally 中的 return 陷阱。
全局异常钩子：sys.excepthook（主线程）、threading.excepthook（工作线程）、asyncio事件循环异常处理器构成完整的全局异常监控体系。
traceback模块：format_exc 获取完整字符串、extract_tb 结构化分析追踪栈、print_exception 自定义输出、walk_stack/walk_tb 生成器遍历。
性能影响：try块零开销；异常的抛出和捕获有显著性能损耗（约50-100倍于正常路径）；EAFP在低异常率下性能优于LBYL。

十三、进一步思考

Python的异常处理机制经过多年的演化，从基础的 try-except 到PEP 654的 ExceptionGroup，正在逐步适应现代编程范式（异步、并发、结构化并发）对错误处理提出的新需求。

在实际项目中，异常处理的健壮性往往是区分"能用"和"好用"的重要指标。一个设计良好的异常体系可以极大地降低故障排查成本；反之，混乱的异常处理（吞没异常、裸露的技术异常泄露到客户端、异常层次扁平化）会显著增加系统的维护负担。

延伸阅读与探索方向：

Rust的Result类型与Python对比：探索使用 returns 库或 result 模式在Python中实现类似Rust的 Result<T, E> 错误处理。
结构化异常（PEP 678）：Python 3.11引入的 Exception.add_note() 可以为已存在的异常实例附加额外信息，无需修改异常类型。
三方的异常追踪增强：如 rich 库的异常美化输出、sentry_sdk 的生产级错误追踪。
异常治理的SRE视角：错误预算（Error Budget）、异常告警分级、SLO与错误率监控等运维层面的异常管理实践。