collections模块 — 高效容器数据类型

Python标准库精讲专题 · 数据结构与算法工具篇 · 掌握高效容器数据类型

专题：Python标准库精讲系统学习

关键词：Python, 标准库, collections, namedtuple, deque, Counter, OrderedDict, defaultdict, ChainMap

一、collections模块概述

collections是Python标准库中最重要的模块之一，它提供了Python内置容器类型（dict、list、set、tuple）之外的一系列高性能容器数据类型。这些数据类型针对特定场景进行了优化，能够显著简化代码并提升运行效率。

Python内置的容器类型虽然功能强大，但在某些专业场景下存在不足。例如，tuple是不可变的，无法通过名称访问字段；list在头部插入元素时性能很差；普通dict在3.7版本之前不保证插入顺序。collections模块正是为弥补这些不足而设计的。

模块核心类一览

数据类型	功能描述	替代内置类型	适用场景
namedtuple	具名元组，支持字段名访问	tuple	轻量级数据对象、数据库记录
deque	双端队列，两端高效操作	list	队列/栈、滑动窗口、BFS
Counter	计数器，统计可哈希对象	dict	词频统计、投票计数、数据分析
defaultdict	默认值字典，避免KeyError	dict	分组聚合、字典嵌套、缓存
OrderedDict	有序字典，记录插入顺序	dict	LRU缓存、顺序敏感配置
ChainMap	链映射，多字典逻辑合并	dict.update()	作用域链、多配置合并、默认值
UserDict	字典包装类（便于继承）	dict	自定义字典行为
UserList	列表包装类（便于继承）	list	自定义列表行为
UserString	字符串包装类（便于继承）	str	自定义字符串行为

核心思想：collections模块并非取代内置类型，而是在特定场景下提供更高效、更语义化的替代方案。选择正确的容器类型，代码不仅更快，而且更可读。

二、namedtuple具名元组

namedtuple工厂函数创建了一个tuple的子类，它允许通过字段名而不是索引位置来访问元素。这既保留了tuple的不可变性和轻量性，又提供了类似字典的字段访问方式，是定义简单数据对象的理想选择。

基本创建与访问

from collections import namedtuple

# 语法：namedtuple(类型名, [字段名列表])
Point = namedtuple('Point', ['x', 'y'])
p = Point(10, 20)

print(p.x)       # 10  — 字段名访问
print(p[0])      # 10  — 索引访问（兼容tuple）
print(p)         # Point(x=10, y=20)
x, y = p         # 元组解包
print(x, y)      # 10 20

字段名有多种指定方式：逗号分隔字符串 'x y'、字符串列表 ['x','y']、或由空格或逗号分隔的字符串 'x, y'。推荐使用字符串列表，明确且不易出错。

内置实用方法

# _replace — 返回新实例，替换指定字段值
p2 = p._replace(x=100)
print(p2)         # Point(x=100, y=20)
print(p)          # Point(x=10, y=20)  不可变，原值不变

# _asdict — 转换为OrderedDict（有序字典）
d = p._asdict()
print(d)          # {'x': 10, 'y': 20}

# _make — 从可迭代对象创建实例
data = [30, 40]
p3 = Point._make(data)
print(p3)         # Point(x=30, y=40)

# _fields — 查看所有字段名
print(Point._fields)  # ('x', 'y')

继承与扩展

# 方式一：通过namedtuple的verbose参数查看源码后手动扩展
# 方式二：直接继承（推荐）
class Person(namedtuple('PersonBase', ['name', 'age', 'gender'])):
    __slots__ = ()  # 防止创建__dict__，保持轻量

    @property
    def is_adult(self):
        return self.age >= 18

    def greet(self):
        return f"你好，我是{self.name}，今年{self.age}岁。"

p = Person('张三', 25, '男')
print(p.is_adult)  # True
print(p.greet())   # 你好，我是张三，今年25岁。

namedtuple的最佳实践：当需要一个"只是存数据"的简单类时，优先使用namedtuple而非手写class。它自动实现了__init__、__repr__、__eq__、__hash__等魔术方法，省去大量样板代码。

三、deque双端队列

deque（double-ended queue）是支持两端高效插入和删除操作的线性容器。与list不同，deque在头部进行操作的时间复杂度为O(1)，而list在头部插入删除需要O(n)的时间，因为所有后续元素都需要移动。

基本操作

from collections import deque

# 创建双端队列
d = deque([1, 2, 3])
print(d)  # deque([1, 2, 3])

# 右端操作（类似list）
d.append(4)       # 右端添加 → deque([1, 2, 3, 4])
d.pop()           # 右端移除 → 4

# 左端操作（list不支持的高效操作）
d.appendleft(0)   # 左端添加 → deque([0, 1, 2, 3])
d.popleft()       # 左端移除 → 0

# 批量扩展
d.extend([4, 5])          # 右端扩展 → deque([1, 2, 3, 4, 5])
d.extendleft([-1, 0])     # 左端扩展(逆序插入) → deque([0, -1, 1, 2, 3, 4, 5])

旋转操作

d = deque([1, 2, 3, 4, 5])

# 正数右旋：元素向右移动
d.rotate(1)
print(d)  # deque([5, 1, 2, 3, 4])

# 负数左旋：元素向左移动
d.rotate(-2)
print(d)  # deque([2, 3, 4, 5, 1])

# 应用场景：循环队列、轮播图、密码本
def circular_counter(n, k):
    """约瑟夫环问题"""
    dq = deque(range(1, n + 1))
    while len(dq) > 1:
        dq.rotate(-(k - 1))
        dq.popleft()
    return dq[0]

print(circular_counter(7, 3))  # 4

maxlen限制与性能对比

# maxlen：固定长度队列，超限时自动丢弃另一端元素
d = deque(maxlen=3)
d.extend([1, 2, 3])
print(d)  # deque([1, 2, 3], maxlen=3)
d.append(4)
print(d)  # deque([2, 3, 4], maxlen=3)  自动丢弃了1

# 应用：保留最近N条记录（日志分析、消息历史）
def tail(filename, n=10):
    """读取文件最后n行"""
    with open(filename, 'r') as f:
        return deque(f, maxlen=n)

print(tail('example.log', 5))
#                    list               deque
# 头部插入    O(n) ✗             O(1) ✓
# 尾部插入    O(1) ✓             O(1) ✓
# 头部删除    O(n) ✗             O(1) ✓
# 尾部删除    O(1) ✓             O(1) ✓
# 按索引访问  O(1) ✓             O(n) ✗
# 内存占用    紧凑 ✓ 	   稍高 ✗

何时选择deque：当你需要频繁在序列两端进行插入/删除操作时（如BFS广搜算法、任务队列、撤销历史），请选择deque而非list。但如果你需要频繁的随机访问（通过索引读取中间元素），list仍然是更好的选择。

deque实现栈与队列

# 作为栈(LIFO)：使用右端
stack = deque()
stack.append('a')
stack.append('b')
stack.append('c')
print(stack.pop())   # 'c'
print(stack.pop())   # 'b'
print(stack.pop())   # 'a'

# 作为队列(FIFO)：左进右出 或 右进左出
queue = deque()
queue.append('task1')     # 右端入队
queue.append('task2')
queue.append('task3')
print(queue.popleft())    # 'task1'  左端出队
print(queue.popleft())    # 'task2'
print(queue.popleft())    # 'task3'

四、Counter计数器

Counter是dict的一个子类，用于统计可哈希对象的出现次数。它简化了"count-everything"这类常见任务，提供了一套专为计数设计的API。Counter的元素存储为字典的键，计数存储为字典的值。

基础用法与most_common

from collections import Counter

# 创建方式
# 1. 从可迭代对象
cnt = Counter('abracadabra')
print(cnt)  # Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

# 2. 从字典
cnt2 = Counter({'apples': 3, 'oranges': 2})

# 3. 使用关键字参数
cnt3 = Counter(cats=4, dogs=3, birds=1)

# most_common：按计数降序返回前n个元素
words = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
word_cnt = Counter(words)
print(word_cnt.most_common(2))
# [('apple', 3), ('banana', 2)]

# 不传参返回所有
print(word_cnt.most_common())
# [('apple', 3), ('banana', 2), ('orange', 1)]

elements方法与缺失键处理

# elements：按计数重复返回每个元素（顺序不定）
c = Counter(a=3, b=1, c=0, d=-2)
print(sorted(c.elements()))
# ['a', 'a', 'a', 'b']  — 只返回计数大于0的元素

# 访问不存在的键不会KeyError，返回0
print(c['e'])  # 0  — 这是Counter与dict的关键区别

# 删除计数为0或负数的键
c = Counter(a=1, b=0, c=-1)
print(+c)  # Counter({'a': 1})  只保留正数
print(-c)  # Counter({'c': 1})  取负后保留正数

算术运算与update/subtract

c1 = Counter(a=3, b=2, c=1)
c2 = Counter(a=1, b=2, c=3)

# update：合并计数（累加）
c1.update(c2)  # 相当于 c1 = c1 + c2
print(c1)  # Counter({'a': 4, 'b': 4, 'c': 4})

c3 = Counter(a=3, b=2, c=1)
c4 = Counter(a=1, b=2, c=3)

# subtract：扣减计数
c3.subtract(c4)
print(c3)  # Counter({'a': 2, 'b': 0, 'c': -2})

# + 和 - 运算符（只保留正数）
a = Counter(a=3, b=2, c=1)
b = Counter(a=1, b=2, c=3)
print(a + b)  # Counter({'a': 4, 'b': 4, 'c': 4})
print(a - b)  # Counter({'a': 2})  只保留正数

# & 和 | 运算符（交集/并集）
print(a & b)  # Counter({'a': 1, 'b': 2})  取较小计数
print(a | b)  # Counter({'a': 3, 'c': 3, 'b': 2})  取较大计数

Counter与普通dict的对比：Counter在访问不存在的键时返回0而非抛出KeyError，这使计数代码更简洁。但如果你需要明确区分"存在但为0"和"不存在"这两种语义，建议使用普通的defaultdict(int)或dict。

五、defaultdict默认字典

defaultdict是dict的一个子类，它重写了一个方法并添加了一个可写实例变量。当访问不存在的键时，defaultdict会自动调用工厂函数生成默认值。这消除了手动检查键是否存在的样板代码，使分组和聚合操作更加优雅。

各种默认工厂

from collections import defaultdict

# default_factory = list — 自动创建列表
# 场景：将相同键的值收集到列表中
d = defaultdict(list)
d['fruits'].append('apple')
d['fruits'].append('banana')
d['veggies'].append('carrot')
print(d)  # defaultdict(<class 'list'>, {'fruits': ['apple', 'banana'], 'veggies': ['carrot']})

# 对比普通dict的写法：
d = {}
for k, v in pairs:
    if k not in d:
        d[k] = []
    d[k].append(v)  # 需要3行代码

# 对比defaultdict：
d = defaultdict(list)
for k, v in pairs:
    d[k].append(v)  # 1行代码

# default_factory = set — 自动创建集合
d = defaultdict(set)
d['tags'].add('python')
d['tags'].add('programming')
d['tags'].add('python')  # 自动去重

# default_factory = int — 自动创建整数0
# 场景：计数器
d = defaultdict(int)
for char in 'hello world':
    d[char] += 1
print(d)  # defaultdict(<class 'int'>, {'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

嵌套defaultdict

# 二维嵌套：defaultdict(lambda: defaultdict(int))
# 场景：二维计数（如单词共现矩阵）
word_pairs = [
    ('python', 'java'), ('python', 'go'),
    ('java', 'python'), ('go', 'python')
]
co_occur = defaultdict(lambda: defaultdict(int))
for w1, w2 in word_pairs:
    co_occur[w1][w2] += 1
print(co_occur['python']['java'])  # 1
print(co_occur['java']['python'])  # 1

# 深度嵌套：任意层级
# 场景：JSON式多层字典，无需手动创建每层
tree = lambda: defaultdict(tree)
data = tree()
data['user']['name'] = 'Alice'
data['user']['address']['city'] = 'Beijing'
data['user']['address']['zip'] = '100000'
print(data)
# {'user': {'name': 'Alice', 'address': {'city': 'Beijing', 'zip': '100000'}}}

default_factory的注意事项

# 与普通dict的区别：访问不存在的键会创建默认值
d = defaultdict(int)
print(d['missing'])      # 0 — 自动创建并返回0
print(d)                 # defaultdict(<class 'int'>, {'missing': 0})

# 而普通dict会抛出KeyError
d2 = {}
# d2['missing']  # KeyError: 'missing'

# default_factory为None时行为同普通dict
d3 = defaultdict(None)
# d3['missing']  # KeyError: 'missing'

# 重要：in 操作符不会触发default_factory
print('missing' in d)    # True — 因为刚才已经创建了

# 要避免的陷阱：default_factory只在__getitem__时触发
d = defaultdict(list)
if d['key']:  # 这会创建空列表，布尔值为False
    pass
d['key'].append(1)  # 先创建空列表，再追加1
print(d)  # defaultdict(<class 'list'>, {'key': [1]})

六、OrderedDict有序字典

OrderedDict是dict的一个子类，它记住了键值对插入的顺序。在Python 3.7之前，这是唯一能保证插入顺序的字典实现。Python 3.7+虽然普通dict也保持了插入顺序，但OrderedDict提供了额外的有序相关方法。

顺序保持与对比

from collections import OrderedDict

# 基本使用
od = OrderedDict()
od['z'] = 1
od['y'] = 2
od['x'] = 3
print(od)
# OrderedDict([('z', 1), ('y', 2), ('x', 3)])

# 遍历保证顺序
for key in od:
    print(key, od[key])  # z→y→x

# Python 3.7+ 普通dict也保持插入顺序
d = {}
d['z'] = 1
d['y'] = 2
d['x'] = 3
print(d)  # {'z': 1, 'y': 2, 'x': 3}

# 关键区别：OrderedDict支持顺序敏感的相等比较
od1 = OrderedDict([('a', 1), ('b', 2)])
od2 = OrderedDict([('b', 2), ('a', 1)])
print(od1 == od2)  # False — 顺序不同

d1 = {'a': 1, 'b': 2}
d2 = {'b': 2, 'a': 1}
print(d1 == d2)    # True — 普通dict忽略顺序

move_to_end与popitem

od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])

# move_to_end：将指定键移到末尾（或开头）
od.move_to_end('a')
print(od)  # OrderedDict([('b', 2), ('c', 3), ('a', 1)])

od.move_to_end('a', last=False)  # 移到开头
print(od)  # OrderedDict([('a', 1), ('b', 2), ('c', 3)])

# popitem：弹出并返回键值对
# last=True（默认）：LIFO，弹出最后插入的
print(od.popitem(last=True))   # ('c', 3)
# last=False：FIFO，弹出最先插入的
print(od.popitem(last=False))  # ('a', 1)

实战：LRU缓存实现

class LRUCache:
    """使用OrderedDict实现LRU缓存"""

    def __init__(self, capacity):
        self.capacity = capacity
        self.cache = OrderedDict()

    def get(self, key):
        if key not in self.cache:
            return -1
        # 访问后将键移到末尾（最近使用）
        self.cache.move_to_end(key)
        return self.cache[key]

    def put(self, key, value):
        if key in self.cache:
            # 已存在，移到最后
            self.cache.move_to_end(key)
        self.cache[key] = value
        if len(self.cache) > self.capacity:
            # 超出容量，移除最久未使用的（第一个）
            self.cache.popitem(last=False)

# 测试
lru = LRUCache(3)
lru.put(1, 'A')
lru.put(2, 'B')
lru.put(3, 'C')
lru.get(1)        # 访问1，1成为最近使用
lru.put(4, 'D')   # 超出容量，淘汰最久未用的2
print(lru.cache)  # OrderedDict([(1, 'A'), (3, 'C'), (4, 'D')])

何时使用OrderedDict：当你需要顺序相关的操作（如move_to_end、顺序敏感的相等比较、FIFO/LIFO弹出）时，必须使用OrderedDict。普通dict虽然Python 3.7+保持插入顺序，但不提供这些专用的顺序操作方法。

七、ChainMap链映射

ChainMap将多个字典（或其他映射类型）组合成一个单一的、可更新的视图。它的核心优势在于不会实际合并底层字典，而是维护一个搜索链。查找操作会依次搜索每个映射，直到找到目标键。这使得它非常适合管理分层作用域和默认值配置。

基本用法

from collections import ChainMap

# 创建ChainMap
defaults = {'theme': 'light', 'language': 'en', 'show_sidebar': True}
user_prefs = {'language': 'zh-CN', 'font_size': 14}

combined = ChainMap(user_prefs, defaults)
print(combined['language'])    # 'zh-CN'  — 优先使用user_prefs
print(combined['theme'])       # 'light'  — 从defaults获取
print(combined['font_size'])   # 14       — 从user_prefs获取

# 获取完整的映射列表
print(combined.maps)
# [{'language': 'zh-CN', 'font_size': 14}, {'theme': 'light', 'language': 'en', 'show_sidebar': True}]

更新策略：为何写操作只影响第一个映射

config = ChainMap(user_prefs, defaults)

# 写操作（修改、添加、删除）只影响第一个映射
config['theme'] = 'dark'       # 修改 → 写入user_prefs
config['new_key'] = 'value'    # 添加 → 写入user_prefs

del config['language']         # 删除 → 从user_prefs删除
# del config['show_sidebar']   # KeyError — 不存在于第一个映射中

print(user_prefs)   # {'font_size': 14, 'theme': 'dark', 'new_key': 'value'}
print(defaults)     # {'theme': 'light', 'language': 'en', 'show_sidebar': True}

# 若想全局写入，新建一个映射并放在最前面
new_settings = ChainMap({}, user_prefs, defaults)
new_settings['language'] = 'ja'
print(new_settings['language'])  # 'ja'
print(new_settings.maps[0])      # {'language': 'ja'} — 不影响原始字典

作用域链模拟

# ChainMap的典型应用：模拟编程语言的作用域链
def simulate_scope():
    """模拟嵌套作用域"""
    builtins = {'print': 'builtin_func', 'len': 'builtin_func', 'range': 'builtin_func'}
    globals_scope = {'x': 10, 'y': 20, 'add': 'lambda'}
    locals_scope = {'x': 100, 'z': 300}

    # 作用域链：局部→全局→内置
    scope_chain = ChainMap(locals_scope, globals_scope, builtins)

    print(scope_chain['x'])       # 100  — 使用局部变量
    print(scope_chain['y'])       # 20   — 使用全局变量
    print(scope_chain['print'])   # 'builtin_func'  — 使用内置函数
    print(scope_chain['z'])       # 300  — 使用局部变量

    # 子作用域：新局部变量不影响外层
    child_scope = scope_chain.new_child({'x': 1000, 'w': 400})
    print(child_scope['x'])       # 1000 — 被新局部覆盖
    print(child_scope['w'])       # 400
    print(child_scope['y'])       # 20   — 继承自外层

simulate_scope()

实用方法

# parent — 返回去掉第一个映射的新ChainMap
cm = ChainMap({'a': 1, 'b': 2}, {'b': 3, 'c': 4}, {'d': 5})
print(cm.parents)  # ChainMap({'b': 3, 'c': 4}, {'d': 5})

# new_child — 在开头插入新映射（创建新作用域）
cm2 = cm.new_child({'e': 6})
print(cm2)  # ChainMap({'e': 6}, {'a': 1, 'b': 2}, {'b': 3, 'c': 4}, {'d': 5})

# maps属性 — 直接操作底层映射列表
del cm2.maps[2]['b']  # 从第三个映射（即原第二个）中删除'b'
print(cm2)  # {'b': 2, ...}  现在'b'从第二个映射获取

ChainMap vs dict.update()：update()会创建一个全新的合并字典，修改互不影响；ChainMap是视图，修改子字典会实时反映。ChainMap更节省内存（不复制数据），且支持分层查找策略。当配置层级不超过3层时，推荐使用ChainMap。

八、实战案例与总结

案例一：词频统计与数据清洗

from collections import Counter, defaultdict
import re

def analyze_text(text):
    """完整的文本分析工具"""
    # 1. 清洗文本并分词
    words = re.findall(r'\b\w+\b', text.lower())
    stop_words = {'the', 'a', 'an', 'and', 'or', 'but', 'in', 'on', 'at', 'to', 'for', 'of', 'with', 'by'}

    # 2. 高频词统计
    word_count = Counter(words)
    meaningful_words = {word: count for word, count in word_count.items()
                       if word not in stop_words}

    # 3. 找出TOP10关键词
    top_10 = Counter(meaningful_words).most_common(10)

    # 4. 按首字母分组
    grouped = defaultdict(list)
    for word, _ in top_10:
        grouped[word[0]].append(word)

    # 5. 字符级频率
    char_freq = Counter(''.join(words))

    return {
        'total_words': len(words),
        'unique_words': len(word_count),
        'top_keywords': top_10,
        'grouped_by_letter': dict(grouped),
        'most_common_char': char_freq.most_common(1)[0]
    }

sample = "The quick brown fox jumps over the lazy dog. The dog barks at the fox."
result = analyze_text(sample)
print(f"总词数: {result['total_words']}")           # 14
print(f"不重复词数: {result['unique_words']}")       # 11
print(f"TOP关键词: {result['top_keywords']}")         # [('fox', 2), ('dog', 2), ...]
print(f"分组: {result['grouped_by_letter']}")
print(f"最常见字符: {result['most_common_char']}")    # ('o', 4)

案例二：OrderedDict实现LRU缓存

from collections import OrderedDict
import time

class TimedLRUCache:
    """带过期时间的LRU缓存"""

    def __init__(self, capacity, ttl=60):
        self.capacity = capacity
        self.ttl = ttl       # 过期时间（秒）
        self.cache = OrderedDict()
        self.timestamps = {}

    def _is_expired(self, key):
        if key not in self.timestamps:
            return True
        return time.time() - self.timestamps[key] > self.ttl

    def _evict_expired(self):
        expired = [k for k in self.cache if self._is_expired(k)]
        for k in expired:
            del self.cache[k]
            del self.timestamps[k]

    def get(self, key):
        if key not in self.cache or self._is_expired(key):
            return -1
        self.cache.move_to_end(key)
        self.timestamps[key] = time.time()
        return self.cache[key]

    def put(self, key, value):
        self._evict_expired()
        self.cache[key] = value
        self.timestamps[key] = time.time()
        self.cache.move_to_end(key)
        if len(self.cache) > self.capacity:
            oldest, _ = self.cache.popitem(last=False)
            del self.timestamps[oldest]

    def __repr__(self):
        return f"TimedLRUCache({dict(self.cache)})"

# 使用示例
cache = TimedLRUCache(3, ttl=5)
cache.put('a', 1)
cache.put('b', 2)
cache.put('c', 3)
print(cache.get('a'))           # 1
cache.put('d', 4)               # 淘汰b（最久未使用）
print(cache)                    # a、c、d 在缓存中

案例三：多配置合并（命令行+用户+默认）

from collections import ChainMap
import json

def load_config():
    """分层加载应用配置"""
    # 1. 默认配置
    defaults = {
        'host': 'localhost',
        'port': 8080,
        'debug': False,
        'database': {
            'engine': 'sqlite',
            'name': 'app.db'
        },
        'logging': {
            'level': 'INFO',
            'file': 'app.log'
        }
    }

    # 2. 用户配置文件（可能不存在）
    try:
        with open('user_config.json', 'r') as f:
            user_config = json.load(f)
    except (FileNotFoundError, json.JSONDecodeError):
        user_config = {}

    # 3. 命令行参数（最高优先级）
    cli_args = {}
    # 模拟从argparse获取的参数
    import sys
    if hasattr(sys, 'argv'):
        pass  # 实际开发中使用argparse

    # 链式合并：命令行 > 用户配置 > 默认配置
    config = ChainMap(cli_args, user_config, defaults)

    # 访问时自动按优先级查找
    print(f"Host: {config['host']}")
    print(f"Port: {config['port']}")
    print(f"Debug: {config['debug']}")

    return config

# 只读访问使用ChainMap，写配置时注意：
def update_config(config, key, value):
    """只更新用户配置层"""
    config.maps[1][key] = value  # 写入第二层（用户配置）

config = load_config()
update_config(config, 'port', 9090)
print(config['port'])  # 9090

collections模块性能总结

容器类型	时间复杂度特性	内存效率	推荐指数
namedtuple	同tuple（O(1)访问）	★★★★★ 极高	⭐⭐⭐⭐⭐
deque	两端O(1)，中间O(n)	★★★★ 良好	⭐⭐⭐⭐⭐
Counter	同dict（O(1)访问）	★★★★ 良好	⭐⭐⭐⭐⭐
defaultdict	同dict（O(1)访问）	★★★★ 良好	⭐⭐⭐⭐⭐
OrderedDict	同dict（O(1)访问）	★★★ 略高	⭐⭐⭐⭐
ChainMap	O(n)查找（n=映射数）	★★★★★ 极高	⭐⭐⭐⭐

核心总结：collections模块是Python标准库的"容器工具箱"。掌握这些数据类型的正确使用时机，是写出高效、可读、Pythonic代码的关键。日常编程中，建议将namedtuple、deque、Counter、defaultdict作为默认优先考虑的数据结构，它们能覆盖绝大多数常见场景。

Python之禅（The Zen of Python）有云："Simple is better than complex." 选择正确的容器类型，就是让复杂的逻辑变得简单的第一步。collections模块中的每一种容器，都是为了让你少写代码、多得效率而设计的。

进一步学习路径

初级：熟练掌握namedtuple、deque、Counter、defaultdict的日常用法
中级：理解OrderedDict的顺序操作、ChainMap的分层查找策略、通过继承UserDict/UserList自定义容器
进阶：阅读collections模块的C语言实现源码（_collections.c），理解CPython层面的容器优化原理
扩展：了解heapq（堆队列）、array（紧凑数组）、bisect（二分查找）等与collections配合使用的标准库模块