魔术方法（特殊方法）精讲 - Python进阶编程-学习笔记-上海佼艾

一、概述

Python的魔术方法（Magic Methods），也被称为特殊方法（Special Methods）或双下划线方法（Dunder Methods），是Python对象模型中最为核心的机制。它们以双下划线开头和结尾（如 __init__、__str__），允许开发者自定义类的行为，使其能够与Python的内置操作和语法无缝集成。

魔术方法是Python实现"协议导向编程"（Protocol-Oriented Programming）的基石。与Java等语言的接口（Interface）不同，Python的协议是松散的——一个类不需要显式声明实现了某个协议，只需要定义相应的方法即可。这种设计哲学被称为"鸭子类型"（Duck Typing）：如果它走路像鸭子、叫起来像鸭子，那么它就是鸭子。

核心思想：魔术方法是Python解释器与你编写的类之间的"约定"。当你定义了特定的魔术方法，Python解释器就会在相应的操作发生时自动调用它们。理解并善用魔术方法，是写出"Pythonic"代码的关键。

本文将从基础到进阶，系统性地梳理Python中所有重要的魔术方法，涵盖对象生命周期、字符串表示、容器协议、可调用对象、上下文管理、比较与散列、属性访问、数值运算、描述符协议等核心领域。

二、对象生命周期：创建、初始化与销毁

每个Python对象都经历创建（__new__）、初始化（__init__）和销毁（__del__）三个阶段。理解这三个阶段的区别是掌握Python对象模型的第一步。

2.1 new：对象的真实构造器

__new__ 是一个静态方法（虽然是静态方法但不需要用 @staticmethod 装饰），负责创建并返回一个新的对象实例。它在 __init__ 之前被调用。绝大多数情况下我们不需要重写 __new__，但在实现单例模式、不可变类型子类或自定义元类时，它是必不可少的工具。

class Singleton:
    _instance = None

    def __new__(cls, *args, **kwargs):
        if cls._instance is None:
            cls._instance = super().__new__(cls)
        return cls._instance

    def __init__(self, value):
        self.value = value

a = Singleton(10)
b = Singleton(20)
print(a is b)  # True —— 同一个实例
print(a.value)    # 20 —— __init__ 第二次被调用了

注意：当重写 __new__ 时，必须返回一个实例对象。如果 __new__ 返回的不是当前类的实例（例如返回了父类的实例或None），则 __init__ 不会被自动调用。

另一个典型应用是继承不可变类型（如 int、str、tuple），因为不可变类型在 __new__ 阶段就需要完成初始化：

class PositiveInteger(int):
    def __new__(cls, value):
        if value <= 0:
            raise ValueError("值必须为正数")
        return super().__new__(cls, value)

n = PositiveInteger(42)
print(n + 8)  # 50 —— 仍然是 int 类型

2.2 init：对象的初始化器

__init__ 是最广为人知的魔术方法，它在 __new__ 创建实例之后被调用，用于初始化实例的属性。__init__ 不应该返回任何值（返回 None 以外的值会引发 TypeError）。

class Book:
    def __init__(self, title, author, pages):
        self.title = title
        self.author = author
        self.pages = pages
        self._read_count = 0

book = Book("Python工匠", "朱雷", 350)

2.3 del：对象的析构器

__del__ 在对象被垃圾回收时调用。需要强调的是，__del__ 的调用时机是不确定的，因为你无法精确控制Python解释器何时回收内存。因此，不应将重要资源的释放逻辑完全依赖于 __del__。

警告：不要将 __del__ 等同于C++中的析构函数。Python使用垃圾回收机制，对象销毁的时机不确定。对于文件、网络连接等资源的释放，应优先使用上下文管理器（with 语句）。__del__ 的最佳用途是提供额外的安全保障（fallback），而非主要的清理手段。

class Resource:
    def __init__(self, name):
        self.name = name
        print(f"资源 {self.name} 已打开")

    def __del__(self):
        print(f"资源 {self.name} 已被垃圾回收")

r = Resource("database-conn")
del r  # 引用计数归零，立即触发 __del__

三、字符串表示协议

Python提供了三个关键的字符串表示魔术方法，让开发者控制对象如何以字符串形式展示给不同场景下的使用者。

3.1 repr 与 str：开发者和用户的对话

__repr__ 的目标是"无歧义"，面向开发者，返回的字符串应尽可能包含足够的信息来重建该对象（或至少是清晰的调试信息）。__str__ 的目标是"可读性"，面向最终用户，返回的字符串应简洁易懂。如果只实现了其中一个，Python会使用 __repr__ 作为 __str__ 的备选。

class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"Point(x={self.x}, y={self.y})"

    def __str__(self):
        return f"坐标：({self.x}, {self.y})"

p = Point(3, 4)
print(repr(p))  # Point(x=3, y=4)
print(str(p))   # 坐标：(3, 4)
print(p)        # 坐标：(3, 4) —— print() 调用 __str__

最佳实践：始终为你的类实现 __repr__。即使不实现 __str__，__repr__ 也能在日志记录和调试场景中提供巨大帮助。一个好的 __repr__ 应当包含类名和关键属性：ClassName(key1=val1, key2=val2)。

3.2 format：自定义格式化输出

__format__ 在对象被用于格式化字符串（如 f"{obj:spec}" 或 format(obj, spec)）时被调用。它接收一个格式说明符（format spec），让你支持自定义的格式化逻辑：

class Money:
    def __init__(self, amount, currency="CNY"):
        self.amount = amount
        self.currency = currency

    def __format__(self, format_spec):
        if format_spec == "":
            return f"{self.currency} {self.amount:.2f}"
        elif format_spec == "usd":
            return f"${self.amount:.2f}"
        elif format_spec == "cny":
            return f"¥{self.amount:.2f}"
        raise ValueError(f"不支持的格式：{format_spec}")

m = Money(128.5)
print(format(m, "usd"))  # $128.50
print(format(m))          # CNY 128.50
print(f"{m:cny}")          # ¥128.50

四、容器与序列协议

Python的容器协议允许你创建行为类似于列表、字典或集合的自定义类。这是Python最强大也最常用的协议之一。

4.1 只读容器：len 与 getitem

只需实现 __len__ 和 __getitem__ 两个方法，你的类就具备了序列的基本行为：支持 len()、下标访问和 for 循环迭代。

class Playlist:
    def __init__(self, songs):
        self._songs = list(songs)

    def __len__(self):
        return len(self._songs)

    def __getitem__(self, index):
        return self._songs[index]

playlist = Playlist(["晴天", "七里香", "夜曲"])
print(len(playlist))        # 3
print(playlist[1])          # 七里香
print(playlist[1:])         # ['七里香', '夜曲']——自动支持切片
for song in playlist:       # 自动支持迭代
    print(song)

深入理解：Python的切片访问（如 obj[1:3]）传递给 __getitem__ 的是一个 slice 对象（包含 start、stop、step 属性）。如果你的 __getitem__ 没有处理 slice 类型，切片操作将会失败。只需将下标操作委托给内部的列表/元组，即可免费获得切片支持。

4.2 可变容器：setitem 与 delitem

如果要让你的容器支持元素赋值和删除操作，需要额外实现这两个方法：

class MutablePlaylist(Playlist):
    def __setitem__(self, index, value):
        self._songs[index] = value

    def __delitem__(self, index):
        del self._songs[index]

    def append(self, song):
        self._songs.append(song)

mp = MutablePlaylist(["A", "B", "C"])
mp[0] = "X"     # __setitem__
del mp[1]        # __delitem__ —— 现在是 ['X', 'C']

4.3 成员检测：contains

__contains__ 决定了 in 操作符的行为。如果没有实现，Python会退而使用 __iter__ 进行迭代检查，或者使用 __getitem__ 进行顺序扫描——但这两种方式效率都较低。

class BloomFilterSet:
    def __contains__(self, item):
        # 假设这里有高效的布尔过滤器逻辑
        return hash(item) % 1000 < 900

print(42 in BloomFilterSet())  # 调用 __contains__

4.4 迭代协议：iter 与 next

支持 for item in obj 的核心是迭代协议。实现 __iter__ 返回一个迭代器对象，迭代器对象实现 __next__ 在无元素时抛出 StopIteration：

class Countdown:
    def __init__(self, start):
        self.start = start

    def __iter__(self):
        return CountdownIterator(self.start)

class CountdownIterator:
    def __init__(self, start):
        self.current = start

    def __iter__(self):
        return self

    def __next__(self):
        if self.current < 0:
            raise StopIteration
        value = self.current
        self.current -= 1
        return value

for i in Countdown(3):
    print(i)  # 3, 2, 1, 0

更简洁的方式是使用生成器让类本身成为迭代器（但注意这只能迭代一次）：

class Countdown:
    def __init__(self, start):
        self.start = start

    def __iter__(self):
        for i in range(self.start, -1, -1):
            yield i

4.5 reversed：反向迭代

实现 __reversed__ 可以支持 reversed() 内置函数：

def __reversed__(self):
    return CountdownIterator(0)  # 反向逻辑的迭代器

4.6 missing：字典缺失键处理

__missing__ 是 dict 子类的一个特殊钩子，当访问的键不存在时自动调用。这在创建默认值字典时非常有用：

class DefaultListDict(dict):
    def __missing__(self, key):
        self[key] = []  # 创建空列表并插入字典
        return self[key]

d = DefaultListDict()
d["fruits"].append("apple")  # 无需显式检查键是否存在
d["fruits"].append("banana")
print(d)  # {'fruits': ['apple', 'banana']}

五、可调用对象协议

5.1 call：让对象像函数一样调用

通过在类中定义 __call__ 方法，可以使对象实例像函数一样被调用。这在实现"函数对象"（Functor）、装饰器、偏函数等场景中非常有用。可调用对象与普通函数相比，最大的优势在于它可以携带状态信息。

class Counter:
    def __init__(self, start=0):
        self.count = start

    def __call__(self):
        self.count += 1
        return self.count

counter = Counter(10)
print(counter())  # 11
print(counter())  # 12

__call__ 的经典应用是实现带状态的装饰器：

class Retry:
    def __init__(self, max_attempts=3):
        self.max_attempts = max_attempts

    def __call__(self, func):
        import functools

        @functools.wraps(func)
        def wrapper(*args, **kwargs):
            last_exc = None
            for attempt in range(self.max_attempts):
                try:
                    return func(*args, **kwargs)
                except Exception as e:
                    last_exc = e
            raise last_exc
        return wrapper

@Retry(max_attempts=5)
def unstable_api():
    # 可能失败的操作
    pass

六、上下文管理协议

上下文管理是Python中资源管理的核心工具。with 语句背后的协议由两个迁移方法组成：__enter__ 和 __exit__。它们确保在代码块执行前后执行必要的设置与清理操作——即使代码块中抛出了异常。

6.1 基础实现

class ManagedFile:
    def __init__(self, filename, mode="r"):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        self.file = open(self.filename, self.mode)
        return self.file  # as 子句接收的值

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.file.close()
        if exc_type is FileNotFoundError:
            print(f"文件未找到：{self.filename}")
            return True  # 抑制异常，不让它向上传播
        return False     # 不抑制异常，让异常继续传播

# 使用示例
with ManagedFile("test.txt", "w") as f:
    f.write("Hello, World!")

__exit__ 的三个参数：

exc_type：异常类型（如果没有异常则为 None）
exc_val：异常实例（如果没有异常则为 None）
exc_tb：异常回溯对象（如果没有异常则为 None）

返回值含义：返回 True 表示"我已处理这个异常，请勿继续向上传播"；返回 False（或 None）表示"让异常正常传播"。

6.2 使用 contextlib 简化上下文管理器

Python标准库的 contextlib 模块提供了多种简化上下文管理器创建的工具：

from contextlib import contextmanager

@contextmanager
def managed_file(filename, mode):
    f = open(filename, mode)
    try:
        yield f          # yield 之前是 __enter__，之后是 __exit__
    finally:
        f.close()

with managed_file("test.txt", "w") as f:
    f.write("使用 contextmanager!")

使用建议：对于简单的上下文管理场景，优先使用 @contextmanager 装饰器，它更简洁。对于需要精细控制异常处理逻辑的场景，则使用类形式手动实现 __enter__ 和 __exit__。

6.3 异步上下文管理器：aenter 与 aexit

Python 3.5+ 引入了异步上下文管理器，用于 async with 语句，在异步编程中管理资源：

class AsyncDatabase:
    async def __aenter__(self):
        print("异步连接数据库...")
        await asyncio.sleep(0.1)
        return self

    async def __aexit__(self, exc_type, exc_val, exc_tb):
        print("异步关闭数据库连接...")
        await asyncio.sleep(0.1)

七、比较与散列协议

7.1 比较运算符协议

Python支持六种比较运算符，各自对应一个魔术方法。利用 functools.total_ordering 装饰器可以大幅减少需要手动实现的方法数量：

运算符	魔术方法	说明
==	__eq__	相等判断
!=	__ne__	不等判断（Python 3自动从 __eq__ 取反）
<	__lt__	小于
<=	__le__	小于等于
>	__gt__	大于
>=	__ge__	大于等于

from functools import total_ordering

@total_ordering
class Version:
    def __init__(self, major, minor, patch):
        self.major = major
        self.minor = minor
        self.patch = patch
        self._key = (major, minor, patch)

    def __eq__(self, other):
        if not isinstance(other, Version):
            return NotImplemented
        return self._key == other._key

    def __lt__(self, other):
        if not isinstance(other, Version):
            return NotImplemented
        return self._key < other._key

    def __repr__(self):
        return f"Version({self.major}, {self.minor}, {self.patch})"

v1 = Version(3, 10, 0)
v2 = Version(3, 11, 0)
print(v1 < v2)    # True
print(v1 >= v2)   # False —— total_ordering 自动推导

重要：当比较操作涉及不同类型的对象且当前类型不知道如何处理时，应返回 NotImplemented（不是 NotImplementedError！）而不是抛出异常。这会告诉Python解释器尝试交换操作数，给对方一个处理的机会。

7.2 hash：让对象成为字典键

__hash__ 返回一个整数，用于在字典和集合中快速定位对象。可变对象通常不应实现 __hash__（或应显式设为 None），因为哈希值变化会导致对象在字典中"丢失"。

Python的约定是：如果两个对象通过 __eq__ 判断为相等，则它们的哈希值必须相等。反之则不一定成立（哈希碰撞是允许的）。

class ImmutablePoint:
    def __init__(self, x, y):
        object.__setattr__(self, 'x', x)
        object.__setattr__(self, 'y', y)

    def __setattr__(self, name, value):
        raise AttributeError("不可变对象")

    def __eq__(self, other):
        if not isinstance(other, ImmutablePoint):
            return NotImplemented
        return self.x == other.x and self.y == other.y

    def __hash__(self):
        return hash((self.x, self.y))

    def __repr__(self):
        return f"ImmutablePoint({self.x}, {self.y})"

p = ImmutablePoint(1, 2)
d = {p: "origin"}
print(d[ImmutablePoint(1, 2)])  # "origin"

经验法则：如果一个类有 __eq__ 但没有 __hash__，Python会隐式地将 __hash__ 设为 None，使实例变成"不可哈希"的，从而防止被用作字典键或集合元素。对于不可变的值对象（如坐标、货币金额），应同时实现 __eq__ 和 __hash__。使用 hash((self.attr1, self.attr2)) 是一种常见的技巧。

7.3 bool：真值测试

__bool__ 决定对象在布尔上下文（如 if obj:）中的真假。如果没有实现，Python会退而调用 __len__——长度为0视为False，非0视为True。

class Task:
    def __init__(self, title, completed=False):
        self.title = title
        self.completed = completed

    def __bool__(self):
        return self.completed

task = Task("写文章")
if not task:
    print("任务未完成")  # 输出此句

八、属性访问协议

Python的属性访问机制非常灵活，允许你在属性被读取、赋值或删除时插入自定义逻辑。这是实现懒加载、验证、计算属性等多种模式的基础。

8.1 getattr vs getattribute

这两个方法在行为上有本质区别：__getattr__ 仅在属性通过正常查找机制失败后才被调用；而 __getattribute__ 在每次属性访问时都会被无条件调用。

方法	调用时机	典型用途
__getattr__	属性查找失败时	提供动态属性、友好的错误提示
__getattribute__	每次属性访问	属性访问拦截（需谨慎使用）
__setattr__	属性赋值时	数据验证、属性修改跟踪
__delattr__	删除属性时	防止删除关键属性
__dir__	调用 dir() 时	自定义对象内容列表

class LazyConfig:
    def __init__(self):
        object.__setattr__(self, '_loaded', False)
        object.__setattr__(self, '_config', {})

    def _load_config(self):
        print("加载配置...")
        config = {"host": "localhost", "port": 8080, "debug": True}
        object.__setattr__(self, '_config', config)
        object.__setattr__(self, '_loaded', True)

    def __getattr__(self, name):
        if not self._loaded:
            self._load_config()
        if name in self._config:
            return self._config[name]
        raise AttributeError(f"配置项 '{name}' 不存在")

config = LazyConfig()
print(config.host)  # 首次访问触发加载："加载配置..." + "localhost"
print(config.port)  # 直接返回，不重复加载：8080

8.2 setattr：属性赋值的守卫

在 __setattr__ 中进行属性赋值时必须小心，直接使用 self.name = value 会递归调用自身，导致无限循环。正确的做法是调用父类的 __setattr__ 或 object.__setattr__。

class ValidatedProduct:
    def __init__(self, name, price):
        # 在 __init__ 中也需要通过 object.__setattr__ 避免递归
        object.__setattr__(self, 'name', name)
        object.__setattr__(self, 'price', price)

    def __setattr__(self, name, value):
        if name == 'price':
            if not isinstance(value, (int, float)):
                raise TypeError("价格必须是数字")
            if value < 0:
                raise ValueError("价格不能为负数")
        object.__setattr__(self, name, value)

__slots__ 说明：在类中定义 __slots__ 可以限制实例只能拥有在 slots 中声明的属性，Python也会因此不再为每个实例创建 __dict__，从而显著减少内存使用。但使用 slots 也会禁止 __getattr__ 等动态属性机制：

class Point3D:
    __slots__ = ('x', 'y', 'z')

    def __init__(self, x, y, z):
        self.x = x
        self.y = y
        self.z = z

p = Point3D(1, 2, 3)
# p.w = 4  # AttributeError: 'Point3D' object has no attribute 'w'

九、数值转换与算术运算协议

9.1 类型转换方法

这些方法允许Python的内置类型转换函数处理自定义对象：

方法	对应的内置函数	说明
__int__	int(obj)	转换为整数
__float__	float(obj)	转换为浮点数
__bool__	bool(obj)	转换为布尔值
__complex__	complex(obj)	转换为复数
__bytes__	bytes(obj)	转换为字节串
__index__	operator.index(obj)	转换为纯整数（用于切片等）

class ScientificNotation:
    def __init__(self, mantissa, exponent):
        self.mantissa = mantissa
        self.exponent = exponent

    def __int__(self):
        return int(self.mantissa * (10 ** self.exponent))

    def __float__(self):
        return self.mantissa * (10 ** self.exponent)

    def __bool__(self):
        return self.mantissa != 0

n = ScientificNotation(3.14, 2)
print(int(n))    # 314
print(float(n))  # 314.0

9.2 算术运算符方法

Python为所有算术运算符提供了对应的魔术方法，每组运算符包含正向、反向和原地操作三种变体：

类别	正向操作	反向操作	原地操作
加法 +	__add__	__radd__	__iadd__
减法 -	__sub__	__rsub__	__isub__
乘法 *	__mul__	__rmul__	__imul__
真除法 /	__truediv__	__rtruediv__	__itruediv__
整除 //	__floordiv__	__rfloordiv__	__ifloordiv__
取模 %	__mod__	__rmod__	__imod__
幂运算 **	__pow__	__rpow__	__ipow__
左移 <<	__lshift__	__rlshift__	__ilshift__
右移 >>	__rshift__	__rrshift__	__irshift__
按位与 &	__and__	__rand__	__iand__
按位或 \|	__or__	__ror__	__ior__
按位异或 ^	__xor__	__rxor__	__ixor__
取反 ~	__invert__	—	—
正号 +	__pos__	—	—
负号 -	__neg__	—	—
绝对值 abs()	__abs__	—	—

反向操作（如 __radd__）在正向操作返回 NotImplemented 或操作数类型不匹配时被调用。例如 5 + obj 会先尝试 (5).__add__(obj)，如果返回 NotImplemented，再尝试 obj.__radd__(5)。

class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __add__(self, other):
        if not isinstance(other, Vector):
            return NotImplemented
        return Vector(self.x + other.x, self.y + other.y)

    def __radd__(self, other):
        # 允许标量加向量：5 + Vector(1,2) = Vector(6,7)
        if isinstance(other, (int, float)):
            return Vector(self.x + other, self.y + other)
        return NotImplemented

    def __mul__(self, other):
        if isinstance(other, (int, float)):
            return Vector(self.x * other, self.y * other)
        return NotImplemented

    __rmul__ = __mul__  # 乘法是可交换的，反向操作可与正向相同

    def __repr__(self):
        return f"Vector({self.x}, {self.y})"

v1 = Vector(1, 2)
v2 = Vector(3, 4)
print(v1 + v2)   # Vector(4, 6)
print(5 + v1)    # Vector(6, 7) —— __radd__
print(v1 * 3)   # Vector(3, 6) —— __mul__
print(3 * v1)    # Vector(3, 6) —— __rmul__

十、描述符协议

描述符（Descriptor）是Python属性访问中最底层的机制之一。它是很多高级特性的基石，包括 @property、@classmethod、@staticmethod 和 __slots__ 等。

10.1 描述符的定义

一个类如果实现了以下任一方法，就称为描述符：

__get__(self, instance, owner_class) — 获取属性时调用
__set__(self, instance, value) — 设置属性时调用
__delete__(self, instance) — 删除属性时调用

只实现了 __get__ 的称为"非数据描述符"（non-data descriptor），同时实现了 __set__ 或 __delete__ 的称为"数据描述符"（data descriptor）。数据描述符的优先级高于实例字典（__dict__）。

10.2 使用描述符实现验证器

class Validator:
    def __set_name__(self, owner, name):
        self.name = '_' + name

    def __get__(self, instance, owner):
        if instance is None:
            return self
        return getattr(instance, self.name)

    def __set__(self, instance, value):
        self.validate(value)
        setattr(instance, self.name, value)

    def validate(self, value):
        raise NotImplementedError

class Positive(Validator):
    def validate(self, value):
        if value <= 0:
            raise ValueError(f"{self.name} 必须是正数")

class NotEmptyString(Validator):
    def validate(self, value):
        if not isinstance(value, str) or len(value.strip()) == 0:
            raise ValueError(f"{self.name} 不能为空")

class Person:
    name = NotEmptyString()
    age = Positive()

    def __init__(self, name, age):
        self.name = name
        self.age = age

p = Person("Alice", 30)
print(p.name)  # Alice
# p.age = -5  # ValueError: _age 必须是正数

__set_name__：Python 3.6 引入的类级钩子，在类创建时自动调用，告知描述符它被赋值给了哪个属性名。这使得描述符无需依赖 __init__ 中的显式传参即可知道自己的名称，大大简化了描述符的实现。

10.3 property 的本质

@property 装饰器本质上就是一个数据描述符。等价的纯描述符实现如下：

class property:
    "模拟 builtins.property 的核心行为"
    def __init__(self, fget=None, fset=None, fdel=None):
        self.fget = fget
        self.fset = fset
        self.fdel = fdel

    def __get__(self, instance, owner):
        if instance is None:
            return self
        return self.fget(instance)

    def __set__(self, instance, value):
        if self.fset is None:
            raise AttributeError("只读属性")
        self.fset(instance, value)

十一、更多魔术方法

11.1 instancecheck 与 subclasscheck

这两个方法定义在元类中，分别控制 isinstance() 和 issubclass() 的行为。借助 __subclasshook__，可以实现"虚拟子类"（Virtual Subclass），即一个类无需实际继承即可被认定为另一个类的子类：

from abc import ABCMeta

class DuckLike(metaclass=ABCMeta):
    @classmethod
    def __subclasshook__(cls, C):
        if any("quack" in B.__dict__ for B in C.__mro__):
            return True
        return NotImplemented

class MyDuck:
    def quack(self):
        print("Quack!")

print(isinstance(MyDuck(), DuckLike))  # True —— 尽管没有继承关系

11.2 copy 与 deepcopy

控制 copy.copy() 和 copy.deepcopy() 的行为：

import copy

class DatabaseConnection:
    def __init__(self, conn_str):
        self.conn_str = conn_str
        self._connected = False

    def __copy__(self):
        # 浅拷贝：只拷贝连接字符串，不拷贝实际连接
        return DatabaseConnection(self.conn_str)

    def __deepcopy__(self, memo):
        # 深拷贝可能需要特殊处理（如有锁、文件句柄等）
        return DatabaseConnection(copy.deepcopy(self.conn_str, memo))

11.3 sizeof 与 __length_hint__

__sizeof__ 返回对象的内存大小（字节），供 sys.getsizeof() 使用。__length_hint__ 为迭代器提供一个预估的长度提示，可在不知道确切长度时优化内存分配。

十二、最佳实践与常见陷阱

12.1 始终返回 NotImplemented，不要抛出异常

在比较运算和算术运算中，当你不知道如何处理另一个操作数时，应该返回 NotImplemented（单例对象），而不是抛出 TypeError。这给了Python解释器尝试反向操作的机会，也是实现运算符多态的正确方式。

错误做法：

def __eq__(self, other):
    if not isinstance(other, MyClass):
        raise TypeError("不支持的类型")
    return self.val == other.val

正确做法：

def __eq__(self, other):
    if not isinstance(other, MyClass):
        return NotImplemented
    return self.val == other.val

12.2 hash 与 eq 的对称性

如果你实现了 __eq__ 但没有实现 __hash__，Python会将 __hash__ 设为 None，这意味着实例不可哈希。如果希望对象可哈希，必须同时实现两者。关键约束是：a == b 必须推导出 hash(a) == hash(b)。

12.3 init 中不要忘记 super()

使用继承时，子类的 __init__ 应当调用 super().__init__()，确保父类的初始化逻辑也被执行。这在多重继承中尤其重要，因为Python使用C3线性化算法（MRO）决定方法解析顺序。

class Base:
    def __init__(self, *, **kwargs):
        self.created = True

class Child(Base):
    def __init__(self, name, **kwargs):
        super().__init__(**kwargs)
        self.name = name

# 使用关键字参数和 **kwargs 是多重继承中 __init__ 的最佳实践

12.4 避免 getattribute 的性能陷阱

__getattribute__ 在每次属性访问时被调用——包括方法调用。实现不当会严重拖慢程序。在绝大多数情况下，__getattr__ 是更安全、更高效的选择。如果确实需要 __getattribute__，务必在方法内部调用 object.__getattribute__ 而不是 self.__getattribute__ 来避免无限递归。

12.5 slots 的使用场景

__slots__ 的主要价值是节省内存（每个Python对象默认有一个 __dict__ 字典，占用约数百字节）。在以下场景中特别有用：

需要创建大量实例（数百万级）的数据类
对内存使用有严格要求的嵌入式或移动端应用
需要限制属性名的场景（防止拼写错误）

但要注意：使用 __slots__ 后，不能添加未列出的新属性；不能使用 __getattr__；多重继承时子类也需定义 __slots__。

12.6 慎用 del

__del__ 的调用时机不确定，不应用于关键资源的清理。尤其是在循环引用且涉及自定义 __del__ 时，Python的垃圾回收器可能无法回收这些对象（Python 3.4+ 的GC有所改进但仍有风险）。始终优先使用 with 语句（上下文管理器）来管理资源。

十三、核心要点总结

魔术方法的核心价值：

语法集成：让你的自定义类能够无缝使用Python的内置函数、运算符和语法结构（如 for、with、in、len()、str() 等）。
代码可读性：用自然的方式表达语义，而不是通过显式的 getter/setter 方法。
协议导向：Python的魔术方法构成了多个松散的"协议"，遵循这些协议可以让你的代码更加Pythonic。

学习路线建议：

第一阶段：掌握 __init__、__str__、__repr__、__len__、__getitem__——这些是日常开发使用频率最高的魔术方法。
第二阶段：学习 __call__、__enter__/__exit__、__eq__/__hash__、__iter__/__next__——用于实现特定设计模式和资源管理。
第三阶段：深入 __getattr__/__setattr__、描述符协议、__new__、元类相关方法——用于框架开发和库编写。

在Python生态中，大量流行框架和库都深度依赖魔术方法：

NumPy/PyTorch：通过算术运算符方法实现张量的数学运算
Django/SQLAlchemy：通过 __getattr__ 等实现动态模型属性和懒加载
Flask/FastAPI：利用 __call__ 和描述符实现路由和依赖注入
contextlib/contextvars：围绕上下文管理协议构建的工具链

掌握魔术方法，本质上是深入理解Python解释器如何与你写的代码进行交互。当你在编写类的过程中思考"用户会期望怎样使用这个类"时，魔术方法就是你将这种期望变成现实的桥梁。写得一手好Python代码的秘诀，不在于使用多少高级特性，而在于能让代码自然地"融入"Python的语法生态中——这正是魔术方法的精髓所在。

一、概述

二、对象生命周期：创建、初始化与销毁

2.1 __new__：对象的真实构造器

2.2 __init__：对象的初始化器

2.3 __del__：对象的析构器

三、字符串表示协议

3.1 __repr__ 与 __str__：开发者和用户的对话

3.2 __format__：自定义格式化输出

四、容器与序列协议

4.1 只读容器：__len__ 与 __getitem__

4.2 可变容器：__setitem__ 与 __delitem__

4.3 成员检测：__contains__

4.4 迭代协议：__iter__ 与 __next__

4.5 __reversed__：反向迭代

4.6 __missing__：字典缺失键处理