logging日志系统：从调试到监控

Python 测试与调试专题 · 用日志记录替代print进行调试

专题：Python 测试与调试系统学习

关键词：Python, 测试, 调试, logging, 日志系统, 日志级别, RotatingFileHandler, 日志配置, 日志调试

一、logging概述

Python的logging模块是标准库中功能最强大的日志工具之一，它提供了一套完整的日志记录体系，能够满足从开发调试到生产监控的各类需求。与简单的print()语句相比，logging模块具备日志级别控制、输出目标多样化、日志格式统一管理、运行时动态配置等核心能力，是构建高质量Python应用不可或缺的基础设施。

四大核心组件

logging模块基于"四大组件"架构设计，各组件各司其职、灵活组合。第一是Logger（日志器），作为应用程序与日志系统的接口，开发者通过Logger对象记录日志消息。第二是Handler（处理器），负责将日志记录发送到指定的目标位置，例如控制台、文件、网络服务等。第三是Formatter（格式化器），定义日志记录的最终输出格式，控制每条日志包含的时间、级别、模块名等信息。第四是Filter（过滤器），提供比日志级别更精细的过滤能力，可以根据日志记录的内容或上下文决定是否输出。

# 四大组件协同工作示例
import logging

# 1. Logger：应用的日志入口
logger = logging.getLogger('myapp')
logger.setLevel(logging.DEBUG)

# 2. Handler：输出到控制台
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.INFO)

# 3. Formatter：定义日志格式
formatter = logging.Formatter(
    '%(asctime)s | %(name)s | %(levelname)-8s | %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S'
)
console_handler.setFormatter(formatter)

# 4. Filter：自定义过滤器
class ImportantOnlyFilter(logging.Filter):
    def filter(self, record):
        return '关键' in record.getMessage()

# 组装：将Handler添加到Logger
logger.addHandler(console_handler)

# 记录日志
logger.info('应用启动成功')
logger.info('关键数据处理完成')  # 会被过滤

日志级别说明

logging模块定义了五个标准的日志级别，从低到高依次为：DEBUG（10）用于记录调试阶段的详细信息；INFO（20）用于跟踪程序正常运行过程中的关键事件；WARNING（30）用于提示潜在问题，程序仍能正常运行；ERROR（40）用于记录错误事件，程序可能无法继续执行某些功能；CRITICAL（50）用于记录严重错误，可能导致程序终止。Logger和Handler各自拥有独立的级别设置，最终输出与否取决于两者级别的交集——仅当消息级别同时高于Logger和Handler的设定阈值时才会输出。

# 日志级别对比演示
import logging

# 创建logger并设置为DEBUG（接收所有级别）
logger = logging.getLogger('level_demo')
logger.setLevel(logging.DEBUG)

# Handler设置为WARNING（只输出WARNING及以上）
handler = logging.StreamHandler()
handler.setLevel(logging.WARNING)
formatter = logging.Formatter('%(levelname)-8s | %(message)s')
handler.setFormatter(formatter)
logger.addHandler(handler)

# 下面只有WARNING及以上的消息会被输出
logger.debug('配置信息')          # 不输出
logger.info('服务启动完成')        # 不输出
logger.warning('磁盘空间剩余10%')   # 输出
logger.error('数据库连接超时')      # 输出
logger.critical('系统即将崩溃')     # 输出

与print对比

许多初学者习惯用print()进行调试，这在小型脚本中可以工作，但在生产环境下会带来诸多问题：print输出无法分级控制，要么全部显示要么全部隐藏；print输出难以重定向到文件或日志收集系统；print输出缺乏时间戳、模块名等元信息；print在高并发环境下可能导致输出混乱。而logging模块提供了成熟的解决方案：通过级别控制区分调试信息和生产日志；通过Handler实现多目标输出；通过Formatter统一管理元信息；通过线程安全特性保障并发环境下的输出正确性。因此，专业项目应始终使用logging替代print。

# print vs logging 对比
import logging

logging.basicConfig(
    level=logging.INFO,
    format='[%(asctime)s] %(levelname)s | %(module)s:%(lineno)d | %(message)s'
)

# print方式（不推荐）
def process_data_print(items):
    print(f'开始处理{len(items)}条数据')  # 无法控制级别
    for item in items:
        print(f'处理: {item}')             # 生产环境需逐行删除
    print('处理完成')

# logging方式（推荐）
def process_data_log(items):
    logging.info(f'开始处理 {len(items)} 条数据')
    logging.debug(f'处理: {item}')          # DEBUG级别，生产可关闭
    logging.info('处理完成')

二、Logger使用

Logger是整个日志系统的入口，应用程序通过Logger实例记录日志消息。正确使用Logger是构建健壮日志体系的基础，涉及Logger的获取、级别设置、传播机制以及层级命名等关键概念。

获取Logger

获取Logger实例的标准方式是调用logging.getLogger(name)。按照Python社区的惯例，模块级别的Logger通常使用__name__作为名称参数，这样Logger的名称会自动反映模块的完整包路径，便于在日志中快速定位日志来源。getLogger方法是幂等的——在同一进程中多次使用相同的name调用会返回同一个Logger实例，这意味着在多个模块中共享同一命名的Logger不会产生重复配置的问题。

# 模块级别的Logger获取
# app/database.py
import logging
logger = logging.getLogger(__name__)  # 结果为 'app.database'

def connect(dsn):
    logger.info('正在连接数据库: %s', dsn)
    try:
        # 连接逻辑...
        logger.debug('数据库连接参数: %s', dsn)
        logger.info('数据库连接成功')
    except Exception as e:
        logger.error('数据库连接失败: %s', e)
        raise

级别设置与传播机制

Logger的级别设置决定了什么样的消息能够被Logger接收，未达到级别的消息被直接丢弃。需要注意的是，Logger的默认级别为WARNING，这意味着新创建的Logger默认不会输出DEBUG和INFO级别的消息。传播（propagation）是Logger的一个重要特性：当Logger设置了propagate = True（默认值）时，该Logger记录的日志消息不仅会传递给自身的Handler，还会向上传递给父级Logger的Handler，直至根Logger。这种机制允许在根Logger上设置全局的Handler和格式，同时通过子Logger控制级别。但是，这也可能导致日志重复输出——如果子Logger和根Logger都添加了控制台Handler，每条消息将被打印两次。

# Logger层级与传播
import logging

# 根Logger配置
root_logger = logging.getLogger()
root_logger.setLevel(logging.WARNING)
console = logging.StreamHandler()
console.setFormatter(logging.Formatter('[ROOT] %(message)s'))
root_logger.addHandler(console)

# 子Logger 'app' - 设置了Handler
app_logger = logging.getLogger('app')
app_logger.setLevel(logging.DEBUG)
app_handler = logging.StreamHandler()
app_handler.setFormatter(logging.Formatter('[APP] %(message)s'))
app_logger.addHandler(app_handler)

# 关闭传播避免重复输出
app_logger.propagate = False

app_logger.debug('这条debug消息只在app_logger输出')
app_logger.warning('这条warning消息只在app_logger输出')

# 恢复传播观察效果
app_logger.propagate = True
app_logger.error('此消息会被输出两次（APP + ROOT）')

层级命名与继承关系

Logger的名称支持点号分隔的层级结构，例如'app'、'app.database'、'app.database.mysql'构成了自顶向下的继承链。子Logger会自动继承父Logger的Handler和级别设置，除非显式覆盖。利用这种继承关系，可以实现精细的日志控制——在'app'级别设置通用的输出目标和格式，在更具体的子Logger上调整级别。例如，可以对'app.database'设置DEBUG级别以捕获数据库查询细节，而对'app.cache'保持WARNING级别以减少缓存命中的噪音日志。

# 层级命名实践
import logging

# 顶层Logger - 配置全局Handler
app = logging.getLogger('app')
app.setLevel(logging.INFO)
handler = logging.StreamHandler()
handler.setFormatter(logging.Formatter(
    '%(name)-25s | %(levelname)-8s | %(message)s'
))
app.addHandler(handler)

# 子Logger自动继承父Logger的Handler
db_logger = logging.getLogger('app.database')
db_logger.setLevel(logging.DEBUG)     # 降低级别以输出SQL
cache_logger = logging.getLogger('app.cache')
cache_logger.setLevel(logging.WARNING) # 提高级别减少噪音

db_logger.debug('SELECT * FROM users WHERE id=1')  # 输出
cache_logger.debug('缓存命中: user_1')               # 不输出
cache_logger.warning('缓存连接断开，降级到数据库')      # 输出

三、Handler类型

Handler决定了日志消息的最终去向。Python的logging模块提供了丰富的内置Handler类型，满足从本地文件记录到远程日志收集的各种场景需求。选择合适的Handler组合，能够构建灵活高效的日志输出架构。

StreamHandler与FileHandler

StreamHandler是最基本的Handler，它将日志消息输出到任何具有write()方法的流对象，默认输出到sys.stderr。通过指定不同的流对象，可以将日志输出到标准输出、文件甚至网络连接。FileHandler是StreamHandler的子类，专门用于将日志写入文件。它支持指定文件名、打开模式（追加'a'或覆写'w'）以及编码格式。在生产环境中，FileHandler是最常用的Handler之一，它将日志持久化到磁盘，便于后续检索和分析。

# StreamHandler 和 FileHandler 使用
import logging
import sys

# 创建logger
logger = logging.getLogger('handler_demo')
logger.setLevel(logging.DEBUG)

# StreamHandler: 输出到控制台
console = logging.StreamHandler(sys.stdout)  # 输出到stdout而非默认的stderr
console.setLevel(logging.INFO)
console.setFormatter(logging.Formatter('[控制台] %(message)s'))

# FileHandler: 输出到文件
file_handler = logging.FileHandler('app.log', encoding='utf-8')
file_handler.setLevel(logging.DEBUG)
file_handler.setFormatter(logging.Formatter(
    '%(asctime)s [%(levelname)s] %(message)s'
))

# 添加两个Handler
logger.addHandler(console)
logger.addHandler(file_handler)

logger.debug('调试信息（仅写入文件）')     # 控制台不输出，文件记录
logger.info('普通信息（双向输出）')        # 控制台+文件
logger.error('错误信息（双向输出）')       # 控制台+文件

RotatingFileHandler与TimedRotatingFileHandler

生产环境中的日志文件如果不加管理，会持续增长直至占满磁盘空间。RotatingFileHandler和TimedRotatingFileHandler解决了这一问题。RotatingFileHandler基于文件大小进行轮转——当日志文件达到指定大小时，自动重命名并创建新文件，同时可设置保留的历史文件数量。TimedRotatingFileHandler则基于时间间隔进行轮转——支持按秒、分钟、小时、天、星期甚至特定时间点进行日志切割。这两种Handler配合使用，可以实现按大小和时间双维度的日志管理策略。

# RotatingFileHandler：按大小轮转
import logging
from logging.handlers import RotatingFileHandler

# 每1MB轮转一次，保留5个备份文件
r_handler = RotatingFileHandler(
    'server.log',
    maxBytes=1024 * 1024,  # 1MB
    backupCount=5,
    encoding='utf-8'
)
r_handler.setFormatter(logging.Formatter(
    '%(asctime)s [%(levelname)s] %(message)s'
))

logger = logging.getLogger('rotating')
logger.addHandler(r_handler)

# 模拟大量日志
for i in range(10000):
    logger.info(f'日志条目 #{i}: 这是一条测试日志')
# 目录下会生成: server.log, server.log.1, ..., server.log.5

# TimedRotatingFileHandler：按时间轮转
import logging
from logging.handlers import TimedRotatingFileHandler

# 每天午夜轮转一次，保留30天
t_handler = TimedRotatingFileHandler(
    'daily.log',
    when='midnight',        # 可选: S, M, H, D, W0-W6, midnight
    interval=1,
    backupCount=30,
    encoding='utf-8'
)
t_handler.setFormatter(logging.Formatter(
    '%(asctime)s [%(levelname)s] %(name)s: %(message)s'
))

app_logger = logging.getLogger('app')
app_logger.addHandler(t_handler)
app_logger.info('系统启动 - 将写入 daily.log')
# 第二天会自动重命名为 daily.log.2026-05-05

SMTPHandler与HTTPHandler

SMTPHandler允许在发生特定级别（如ERROR或CRITICAL）的日志事件时，自动发送电子邮件通知。这对于生产环境中的异常预警非常有用，运维人员可以在第一时间收到错误通知。HTTPHandler则将日志记录发送到HTTP服务器，通过GET或POST方法将日志数据传输到远程API。QueueHandler是异步日志方案的关键组件，它将日志记录放入内存队列中，由后台线程异步处理，避免日志写入阻塞应用程序的核心流程。QueueHandler与QueueListener配合使用，是实现高性能异步日志的推荐模式。

# SMTPHandler：邮件告警
import logging
from logging.handlers import SMTPHandler

# 配置邮件Handler - 仅ERROR及以上触发
mail_handler = SMTPHandler(
    mailhost=('smtp.example.com', 587),
    fromaddr='monitor@example.com',
    toaddrs=['ops@example.com'],
    subject='[生产告警] 应用错误通知',
    credentials=('monitor@example.com', 'password'),
    secure=()
)
mail_handler.setLevel(logging.ERROR)

logger = logging.getLogger('payment')
logger.addHandler(mail_handler)
logger.error('支付接口超时，订单ID: 12345')  # 自动发送告警邮件

# QueueHandler + QueueListener：异步日志
import logging
import logging.handlers
from queue import Queue
import time

# 创建日志队列
log_queue = Queue()
queue_handler = logging.handlers.QueueHandler(log_queue)

# 配置实际的文件Handler
file_handler = logging.FileHandler('async.log', encoding='utf-8')
file_handler.setFormatter(logging.Formatter(
    '%(asctime)s [%(levelname)s] %(message)s'
))

# QueueListener在后台线程中消费队列
listener = logging.handlers.QueueListener(log_queue, file_handler)
listener.start()

logger = logging.getLogger('async_demo')
logger.addHandler(queue_handler)
logger.setLevel(logging.DEBUG)

# 主线程：日志写入队列后立即返回，不阻塞
for i in range(1000):
    logger.info(f'异步日志 #{i}')

# 程序退出前等待后台线程处理完成
listener.stop()

四、Formatter与Filter

Formatter和Filter是对日志输出内容进行精细化控制的两大工具。Formatter决定了日志记录的呈现格式，Filter则决定了哪些日志记录应该被输出。两者结合使用，可以实现灵活且丰富的日志输出策略。

日志格式定义

Formatter通过格式字符串定义了日志记录的输出模板，格式字符串中的%(name)s占位符会被对应的日志记录属性替换。常用的属性包括：%(asctime)s（日志时间）、%(name)s（Logger名称）、%(levelname)s（日志级别文本）、%(levelno)s（日志级别数值）、%(message)s（日志消息）、%(module)s（模块名）、%(funcName)s（函数名）、%(lineno)d（行号）、%(pathname)s（完整文件路径）、%(process)d（进程ID）、%(thread)d（线程ID）。通过组合这些属性，可以构造包含丰富上下文信息的日志输出。

# Formatter 格式示例
import logging

# 简化格式（开发环境）
dev_format = logging.Formatter(
    '%(levelname)-8s | %(message)s'
)

# 标准格式（生产环境）
prod_format = logging.Formatter(
    '%(asctime)s | %(levelname)-8s | %(name)s | %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S'
)

# 详细格式（调试环境，含调用者信息）
debug_format = logging.Formatter(
    '%(asctime)s.%(msecs)03d | %(levelname)-8s | '
    '%(module)s.%(funcName)s:%(lineno)d | '
    '%(threadName)s | %(message)s',
    datefmt='%H:%M:%S'
)

# 应用不同格式
logger = logging.getLogger('format_demo')
logger.setLevel(logging.DEBUG)

console = logging.StreamHandler()
console.setFormatter(debug_format)  # 控制台使用详细格式
logger.addHandler(console)

logger.debug('正在处理用户请求')
# 输出示例: 10:30:45.123 | DEBUG    | format_demo.<module>:63 | MainThread | 正在处理用户请求

自定义Formatter

除了内置的格式属性，开发者还可以通过继承Formatter类来自定义格式行为。例如，创建彩色格式器为不同级别的日志添加ANSI颜色代码，或创建JSON格式器将日志输出为结构化数据。自定义Formatter通常通过重写format()方法来实现，在方法内部可以对LogRecord对象进行预处理、添加自定义字段等操作。

# 自定义彩色Formatter
import logging

class ColoredFormatter(logging.Formatter):
    """为控制台输出添加ANSI颜色"""
    COLORS = {
        'DEBUG': '\033[36m',      # 青色
        'INFO': '\033[32m',       # 绿色
        'WARNING': '\033[33m',    # 黄色
        'ERROR': '\033[31m',      # 红色
        'CRITICAL': '\033[41m',   # 红底
        'RESET': '\033[0m',       # 重置
    }

    def format(self, record):
        color = self.COLORS.get(record.levelname, '')
        reset = self.COLORS['RESET']
        message = super().format(record)
        return f'{color}{message}{reset}'

# 应用彩色Formatter
handler = logging.StreamHandler()
handler.setFormatter(ColoredFormatter(
    '%(levelname)-8s | %(message)s'
))
logging.getLogger().addHandler(handler)
logging.warning('这条警告显示为黄色')

Filter过滤器

Filter提供了比日志级别更精细的过滤能力。与级别过滤的单调递增不同，Filter可以根据日志记录的具体内容、Logger名称、运行时上下文等条件做出判断。Filter既可以附加到Logger上（过滤所有经过该Logger的记录），也可以附加到Handler上（仅过滤该Handler的输出）。多个Filter可以组合使用，实现复杂的过滤规则——例如，只记录特定模块中消息包含特定关键词的ERROR级别日志。

# Filter 使用示例
import logging

# 自定义Filter：只允许包含特定关键字的日志
class CriticalErrorFilter(logging.Filter):
    def filter(self, record):
        # 只过滤出包含"严重"或"FATAL"的日志
        msg = record.getMessage()
        return '严重' in msg or 'FATAL' in msg

# Filter：只允许特定Logger
class ModuleFilter(logging.Filter):
    def __init__(self, module_name):
        self.module_name = module_name

    def filter(self, record):
        return record.name.startswith(self.module_name)

# 应用Filter
logger = logging.getLogger('app.payment')
logger.setLevel(logging.DEBUG)

handler = logging.StreamHandler()
handler.setLevel(logging.INFO)
handler.addFilter(CriticalErrorFilter())      # 仅Handler级别过滤
logger.addHandler(handler)
logger.addFilter(ModuleFilter('app.payment'))  # Logger级别过滤

logger.info('普通支付记录')                    # 被CriticalErrorFilter过滤
logger.error('支付失败严重错误: 余额不足')    # 通过

五、日志配置

日志系统的配置方式直接影响项目的可维护性和灵活性。Python logging模块提供了多种配置方式，从简单的basicConfig到强大的dictConfig，再到支持外部配置文件的文件加载方式，开发者可以根据项目规模和复杂度选择合适的方案。

basicConfig快速配置

basicConfig是配置日志系统的最简单方式，适合小型脚本和快速原型开发。它一次性配置根Logger的级别、格式和Handler，在调用后对根Logger的后续修改将不生效（除非设置force=True）。basicConfig支持的关键参数包括：level设置根日志级别、format设置格式字符串、datefmt设置日期格式、filename指定输出文件（使用FileHandler）、filemode指定文件打开模式、stream指定输出流、handlers指定Handler列表等。需要注意的是，basicConfig在根Logger已有Handler配置时不会生效，应确保在程序入口处尽早调用。

# basicConfig 配置示例
import logging

# 方式1：输出到控制台
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s [%(levelname)s] %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S'
)

# 方式2：输出到文件
# logging.basicConfig(
#     level=logging.DEBUG,
#     format='%(asctime)s [%(levelname)s] %(name)s: %(message)s',
#     filename='app.log',
#     filemode='a',  # 追加模式
#     encoding='utf-8'
# )

# 方式3：使用自定义Handler列表
# console = logging.StreamHandler()
# console.setLevel(logging.INFO)
# logging.basicConfig(
#     level=logging.DEBUG,
#     handlers=[console]
# )

logging.info('应用启动，日志系统已初始化')

dictConfig字典配置

对于中大型项目，推荐使用logging.config.dictConfig()进行配置。dictConfig使用嵌套字典定义完整的日志配置，支持配置多个Logger、Handler、Formatter和Filter，以及它们之间的引用关系。这种方式的优势在于：配置信息集中管理、易于序列化和版本控制、支持动态重载、可以与框架的配置系统集成。字典配置的结构包含四个主要部分：version（当前仅支持1）、formatters（格式化器定义）、handlers（处理器定义）、loggers（日志器定义）以及root（根日志器）、filters（过滤器定义）、incremental（是否为增量更新）。

# dictConfig 字典配置
import logging
import logging.config

LOGGING_CONFIG = {
    'version': 1,
    'disable_existing_loggers': False,
    'formatters': {
        'standard': {
            'format': '%(asctime)s [%(levelname)s] %(name)s: %(message)s',
            'datefmt': '%Y-%m-%d %H:%M:%S'
        },
        'detailed': {
            'format': '%(asctime)s.%(msecs)03d | %(levelname)-8s | %(module)s:%(lineno)d | %(message)s'
        },
    },
    'handlers': {
        'console': {
            'class': 'logging.StreamHandler',
            'level': 'INFO',
            'formatter': 'standard',
        },
        'file': {
            'class': 'logging.handlers.RotatingFileHandler',
            'level': 'DEBUG',
            'formatter': 'detailed',
            'filename': 'app.log',
            'maxBytes': 10485760,  # 10MB
            'backupCount': 5,
            'encoding': 'utf-8',
        },
    },
    'loggers': {
        'app': {
            'handlers': ['console', 'file'],
            'level': 'DEBUG',
            'propagate': False,
        },
        'app.database': {
            'handlers': ['file'],
            'level': 'DEBUG',
        },
        'app.api': {
            'handlers': ['console'],
            'level': 'WARNING',
        },
    },
    'root': {
        'handlers': ['console'],
        'level': 'WARNING',
    },
}

# 应用配置
logging.config.dictConfig(LOGGING_CONFIG)

# 使用配置的Logger
logger = logging.getLogger('app.database')
logger.info('数据库连接池初始化完成，最大连接数: 20')

JSON/YAML文件配置

dictConfig的强大之处在于其配置本身就是纯数据，可以轻松地与JSON或YAML格式的文件互通。通过将日志配置存储在独立的配置文件中，可以实现日志配置与代码的完全解耦，支持在不修改代码的情况下调整日志策略。这对于生产环境中的运维尤为有用——当需要临时提高某个模块的日志级别进行问题排查时，只需修改配置文件并触发重载即可。

# 从JSON文件加载日志配置
# logging_config.json 文件内容:
# {
#     "version": 1,
#     "formatters": { ... },
#     "handlers": { ... },
#     "loggers": { ... }
# }

import json
import logging.config

with open('logging_config.json', 'r', encoding='utf-8') as f:
    config = json.load(f)

logging.config.dictConfig(config)

# YAML文件配置（需安装 PyYAML）
# import yaml
# with open('logging_config.yaml', 'r', encoding='utf-8') as f:
#     config = yaml.safe_load(f)
# logging.config.dictConfig(config)

# config文件配置（类似INI格式）
import logging.config

# logging.conf 文件内容:
# [loggers]
# keys=root,app
# 
# [logger_app]
# level=DEBUG
# handlers=console,file
# qualname=app
# propagate=0
# 
# [handler_console]
# class=StreamHandler
# level=INFO
# formatter=standard
# args=(sys.stdout,)
# 
# [formatter_standard]
# format=%(asctime)s [%(levelname)s] %(name)s: %(message)s

# 加载config文件配置（Python标准库方式）
logging.config.fileConfig('logging.conf')

# 配置文件的更灵活替代：硬编码配置
from logging.config import dictConfig
dictConfig({
    'version': 1,
    'formatters': {
        'default': {'format': '%(levelname)s: %(message)s'}
    },
    'handlers': {
        'console': {
            'class': 'logging.StreamHandler',
            'level': 'INFO',
            'formatter': 'default'
        }
    },
    'root': {'handlers': ['console'], 'level': 'INFO'}
})

六、日志调试

日志是生产环境调试最重要的工具之一。与传统的断点调试不同，日志调试具有非侵入性、可持久化、可远程收集等诸多优势。Python的logging模块提供了丰富的调试支持功能，能够精确捕获程序运行时的状态信息。

日志替代print进行调试

使用日志替代print进行调试是专业开发者的基本素养。print输出的信息无法分级、无法定向、无法格式化，而logging提供了完整的解决方案。在实际调试过程中，应根据信息的性质选择合适的日志级别：详细的变量追踪使用DEBUG级别；关键的流程节点使用INFO级别；潜在的问题隐患使用WARNING级别；确定性的错误使用ERROR级别。调试完毕后，只需调整日志级别配置即可关闭调试输出，无需逐行删除print语句。配合条件日志（仅在满足特定条件时记录），可以大幅减少日志噪音，提高问题定位效率。

# 用logging进行方法调试
import logging
logger = logging.getLogger(__name__)

def process_order(order_id, user_id, items):
    # 方法入口和参数记录
    logger.debug('process_order 被调用: order_id=%s, user_id=%s, items_count=%d',
                 order_id, user_id, len(items))

    # 中间状态追踪
    total = 0
    for idx, item in enumerate(items):
        price = item['price'] * item['quantity']
        logger.debug('  计算第%d项: %s, 单价=%.2f, 数量=%d, 小计=%.2f',
                     idx, item['name'], item['price'],
                     item['quantity'], price)
        total += price

    # 检查可疑数据
    if total > 100000:
        logger.warning('大额订单预警: order_id=%s, total=%.2f', order_id, total)

    # 关键节点记录
    logger.info('订单处理完成: order_id=%s, total=%.2f', order_id, total)
    return {'order_id': order_id, 'total': total}

调用者信息与栈信息

logging模块能够自动记录日志调用的来源信息，这在追踪日志来源时极为有用。通过在格式字符串中使用%(module)s、%(funcName)s、%(lineno)d等占位符，每条日志都会附带其产生的精确位置。此外，stack_info=True参数可以在日志中附加当前调用栈信息，帮助理解日志记录时的调用上下文。stacklevel参数则用于调整调用位置的检测层级——当在封装函数中使用日志时，设置stacklevel=2可以让日志指向调用封装函数的代码行，而非封装函数内部。

# 调用者信息与栈信息
import logging
logging.basicConfig(
    level=logging.DEBUG,
    format='%(asctime)s [%(levelname)s] %(module)s.%(funcName)s:%(lineno)d | %(message)s'
)
logger = logging.getLogger(__name__)

def outer_func(value):
    # stack_info 参数：附加当前调用栈
    if value < 0:
        logger.warning('传入负数: %d', value, stack_info=True)
    return inner_func(value * 2)

def inner_func(data):
    # 使用exc_info记录异常信息
    try:
        result = 100 / data
        return result
    except ZeroDivisionError:
        logger.error('除零错误: data=%d', data, exc_info=True)
        return None

outer_func(-5)
outer_func(0)

异常日志与exc_info

在生产环境中记录异常信息是日志系统最重要的功能之一。在except块中使用logger.exception()或设置exc_info=True，可以自动记录完整的异常回溯信息（traceback），包括异常的完整堆栈和错误类型。这对于排查生产环境问题至关重要——仅仅记录"数据库连接失败"等消息而没有堆栈信息，往往无法定位根因。logger.exception()等同于logger.error(exc_info=True)，它会自动将当前异常的traceback信息附加到日志记录中。对于预期的业务异常，建议使用WARNING级别配合有限的堆栈信息；对于非预期的系统异常，则应使用ERROR级别并包含完整的trackback。

# 异常日志最佳实践
import logging
logger = logging.getLogger(__name__)

def fetch_user_data(user_id):
    try:
        # 模拟数据库查询
        if user_id < < 0:
            raise ValueError('无效的用户ID')
        result = {'id': user_id, 'name': '测试用户'}
        logger.info('用户数据查询成功: user_id=%d', user_id)
        return result

    except ValueError as e:
        # 业务逻辑异常 - WARNING级别
        logger.warning('业务校验失败: %s', e)
        raise

    except ConnectionError as e:
        # 基础设施异常 - ERROR级别 + 完整traceback
        logger.error('数据库连接异常: %s', e, exc_info=True)
        # 或者使用简写: logger.exception('数据库连接异常: %s', e)
        return None

    except Exception:
        # 未知异常 - CRITICAL级别
        logger.critical('查询用户数据时发生未知错误: user_id=%d', user_id,
                        exc_info=True)
        return None

七、上下文日志

在实际应用中，仅仅记录日志消息本身往往不够——我们需要知道每条日志所属的请求、用户、会话等上下文信息。上下文日志（Contextual Logging）技术通过在日志记录中注入业务上下文，使日志具备更强的可追溯性和可关联性。Python logging提供了多种方式实现上下文日志。

LoggerAdapter

LoggerAdapter是标准库提供的上下文日志方案。它包装了一个Logger实例，并允许在每条日志记录中添加额外的上下文字段。LoggerAdapter的用法非常简单：创建LoggerAdapter时传入logger对象和上下文字典，后续通过该适配器记录的日志都会自动携带这些上下文信息。LoggerAdapter也支持自定义处理逻辑——通过继承LoggerAdapter并重写process()方法，可以在日志记录前动态添加上下文数据。这种方式的优势在于改造成本低，无需修改现有的Logger使用方式即可为日志注入额外的维度信息。

# LoggerAdapter 使用示例
import logging

# 配置日志格式（包含上下文字段）
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s [%(levelname)s] %(request_id)s | %(message)s'
)

# 创建LoggerAdapter并注入请求ID
logger = logging.getLogger('web.request')
adapter = logging.LoggerAdapter(
    logger,
    {'request_id': 'REQ-20260505-001'}
)

adapter.info('开始处理用户请求')
adapter.warning('请求处理耗时过长')
adapter.error('请求处理失败')
# 输出示例：2026-05-05 10:30:00 [INFO] REQ-20260505-001 | 开始处理用户请求

# 自定义LoggerAdapter
import logging

class RequestLoggerAdapter(logging.LoggerAdapter):
    """自动注入请求上下文的自定义适配器"""

    def __init__(self, logger, request_id, user_id=None, ip=None):
        self.request_id = request_id
        self.user_id = user_id
        self.ip = ip
        extra = {'request_id': request_id, 'user_id': user_id, 'ip': ip}
        super().__init__(logger, extra)

    def process(self, msg, kwargs):
        # 动态添加上下文信息到extra字典
        kwargs.setdefault('extra', {}).update(self.extra)
        return msg, kwargs

# 使用方式
logger = logging.getLogger('api')
adapter = RequestLoggerAdapter(
    logger,
    request_id='REQ-123',
    user_id='USER-456',
    ip='192.168.1.100'
)
adapter.info('API请求开始: GET /api/users')
adapter.error('API响应超时')

Filter传递上下文

除了LoggerAdapter之外，还可以通过自定义Filter向LogRecord中添加自定义属性，从而为日志注入上下文信息。Filter在日志记录被Handler处理之前对LogRecord进行修改，因此可以在Filter中向记录添加request_id、user_id、session_id等自定义属性。这些属性随后可以在Formatter的格式字符串中使用。Filter方式的优势在于与现有的Logger使用方式完全解耦——无需修改任何调用日志的代码，只需在配置阶段添加适当的Filter即可实现上下文的自动注入。

# 使用Filter注入请求上下文
import logging
import threading

# 使用线程局部变量存储请求上下文
_request_context = threading.local()

def set_request_context(request_id, user_id):
    _request_context.request_id = request_id
    _request_context.user_id = user_id

def clear_request_context():
    _request_context.request_id = None
    _request_context.user_id = None

class RequestContextFilter(logging.Filter):
    """自动从线程局部变量中提取上下文并注入LogRecord"""
    def filter(self, record):
        record.request_id = getattr(_request_context, 'request_id', '-')
        record.user_id = getattr(_request_context, 'user_id', '-')
        return True  # 不过滤任何记录，只添加上下文

# 配置日志系统
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s [%(request_id)s] [user:%(user_id)s] %(message)s'
)
logging.getLogger().addFilter(RequestContextFilter())

# 模拟请求处理
set_request_context('REQ-789', 'USER-012')
logger = logging.getLogger('order')
logger.info('创建订单成功')
# 输出示例: 2026-05-05 10:30:00 [REQ-789] [user:USER-012] 创建订单成功

协程上下文

在异步编程日益普及的今天，线程局部变量在协程（coroutine）环境中不再适用——因为多个协程可能运行在同一线程中。对于asyncio应用，应使用contextvars模块替代threading.local()来管理请求上下文。contextvars提供了与协程配合良好的上下文变量，在每个协程中拥有独立的值，确保日志上下文不会在不同协程间串扰。这一方案在主流异步框架（如FastAPI、aiohttp）中已被广泛采用。

# 使用contextvars实现协程安全的日志上下文
import logging
import asyncio
from contextvars import ContextVar

request_id_var = ContextVar('request_id', default='-')

class CoroutineContextFilter(logging.Filter):
    def filter(self, record):
        record.request_id = request_id_var.get()
        return True

# 配置
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s [%(request_id)s] %(message)s'
)
logging.getLogger().addFilter(CoroutineContextFilter())

async def handle_request(req_id):
    request_id_var.set(req_id)
    logger = logging.getLogger('async_app')
    logger.info('开始处理异步请求')
    await asyncio.sleep(0.1)
    logger.info('请求处理完成')

# 并发运行多个请求，上下文不会串扰
async def main():
    await asyncio.gather(
        handle_request('REQ-A'),
        handle_request('REQ-B'),
    )

asyncio.run(main())

八、结构化日志

随着微服务架构的普及和日志数据量的爆炸式增长，传统纯文本日志的局限性日益凸显。结构化日志（Structured Logging）以JSON等机器可读的格式输出日志，使得日志数据可以被日志采集、存储和分析系统高效处理。结构化日志是现代可观测性体系（Observability）的基石。

JSON格式日志

JSON格式日志是结构化日志最常用的形式。每条日志记录被序列化为一个JSON对象，日志的各个维度（时间、级别、模块、消息、上下文等）作为JSON字段独立存储。这意味着日志分析工具可以直接按字段进行搜索、过滤和聚合，而无需依赖正则表达式解析纯文本。Python中实现JSON日志的最简单方式是自定义Formatter，在format()方法中将LogRecord对象序列化为JSON字符串。对于高性能场景，还可以使用第三方库如python-json-logger和structlog，它们提供了更完善的JSON日志支持。

# 自定义JSON Formatter
import logging
import json
from datetime import datetime

class JSONFormatter(logging.Formatter):
    def format(self, record):
        log_entry = {
            'timestamp': datetime.fromtimestamp(record.created).isoformat(),
            'level': record.levelname,
            'logger': record.name,
            'module': record.module,
            'function': record.funcName,
            'line': record.lineno,
            'message': record.getMessage(),
        }
        # 添加上下文字段（如果有的话）
        if hasattr(record, 'request_id'):
            log_entry['request_id'] = record.request_id
        if hasattr(record, 'user_id'):
            log_entry['user_id'] = record.user_id
        # 添加异常信息
        if record.exc_info and record.exc_info[0]:
            log_entry['exception'] = {
                'type': record.exc_info[0].__name__,
                'value': str(record.exc_info[1]),
            }
        return json.dumps(log_entry, ensure_ascii=False)

# 配置JSON日志
handler = logging.StreamHandler()
handler.setFormatter(JSONFormatter())
logger = logging.getLogger('payment')
logger.addHandler(handler)
logger.setLevel(logging.INFO)

logger.info('支付成功', extra={'request_id': 'REQ-001', 'user_id': 'U-100'})
# 输出: {"timestamp": "2026-05-05T10:30:00", "level": "INFO", "logger": "payment", ...}

ELK集成与日志采集

在现代应用架构中，日志的最终归宿通常是集中式日志平台。ELK（Elasticsearch + Logstash + Kibana）栈是目前最流行的开源日志管理方案。日志从产生到可查询的典型流程为：应用程序输出JSON格式日志到文件；Filebeat作为轻量级日志采集器，监控日志文件的变化并将新增内容发送到Logstash或直接发送到Elasticsearch；Logstash对日志进行过滤、解析和 enrichment；Elasticsearch对日志进行索引和存储；Kibana提供搜索、可视化和告警界面。在这个流程中，每条JSON日志中的字段（如level、logger、request_id）都会成为Elasticsearch中的可索引字段，支持快速过滤和聚合分析。

# Filebeat 配置示例 (filebeat.yml)
# filebeat.inputs:
# - type: log
#   enabled: true
#   paths:
#     - /var/log/app/*.log
#   json.keys_under_root: true
#   json.add_error_key: true
#
# output.elasticsearch:
#   hosts: ["https://elasticsearch:9200"]
#   index: "app-logs-%{+yyyy.MM.dd}"

# Python端：输出文件到标准日志目录，由Filebeat采集
import logging
import logging.handlers

class JSONFileHandler:
    """输出JSON日志到文件，供Filebeat采集"""
    @staticmethod
    def setup(log_dir='/var/log/app'):
        handler = logging.handlers.TimedRotatingFileHandler(
            filename=f'{log_dir}/app.log',
            when='midnight',
            backupCount=7,
            encoding='utf-8'
        )
        handler.setFormatter(JSONFormatter())  # 使用上面定义的JSONFormatter
        handler.setLevel(logging.INFO)
        return handler

# 使用方式
logger = logging.getLogger('web')
logger.addHandler(JSONFileHandler.setup())
logger.info('服务已启动')

结构化调试信息

结构化日志不仅适用于生产监控，同样可以极大地提升调试效率。通过在JSON日志中包含结构化的调试信息（如请求参数、数据库查询语句、API响应时间、内存使用情况等），开发者可以在Kibana等日志分析平台上直接进行调试数据分析和趋势观察。例如，可以通过聚合分析发现哪些API端点的响应时间异常升高，哪些数据库查询频率过高，哪些用户的请求频繁出错。这种"调试左移"的思路，将调试工作从本地开发环境延伸到生产环境，使得问题可以在影响用户之前被及时发现和解决。

# 结构化调试日志示例
import logging
import json
import time

class StructuredDebugLogger:
    def __init__(self, logger):
        self.logger = logger

    def log_api_call(self, method, path, status_code, duration_ms,
                      request_body=None, response_size=None):
        log_data = {
            'type': 'api_call',
            'method': method,
            'path': path,
            'status_code': status_code,
            'duration_ms': round(duration_ms, 2),
        }
        if request_body:
            log_data['request_body_size'] = len(str(request_body))
        if response_size:
            log_data['response_size'] = response_size

        # 根据状态码选择日志级别
        if status_code >= 500:
            self.logger.error(json.dumps(log_data, ensure_ascii=False))
        elif duration_ms > 1000:
            log_data['warning'] = '响应时间过长'
            self.logger.warning(json.dumps(log_data, ensure_ascii=False))
        else:
            self.logger.info(json.dumps(log_data, ensure_ascii=False))

# 使用
logger = logging.getLogger('api.structured')
sd_logger = StructuredDebugLogger(logger)
sd_logger.log_api_call('GET', '/api/users', 200, 45.2)
sd_logger.log_api_call('POST', '/api/orders', 502, 3200.5, request_body={'user_id': 123})

九、实战案例

理论知识的价值最终体现在解决实际问题的能力上。本节通过三个完整的实战案例，展示logging日志系统在Web应用、调试策略和生产运维中的综合应用。

案例1：Web应用请求日志中间件

在Web应用中，为每个HTTP请求生成结构化的日志记录是最常见的日志需求之一。以下是基于FastAPI框架的请求日志中间件实现，它记录了每个请求的完整生命周期：请求到达时间、客户端信息、请求路径、处理耗时、响应状态码和潜在的错误信息。通过为每个请求分配唯一的request_id，可以轻松地将同一请求的所有相关日志关联起来。这种实现结合了LoggerAdapter和结构化日志的理念，在日志中包含了丰富的请求上下文，便于在ELK等日志平台中进行多维度的分析。

# Web应用请求日志中间件（FastAPI示例）
import logging
import time
import uuid
from contextvars import ContextVar
from fastapi import FastAPI, Request

request_id_var = ContextVar('request_id', default='-')
app = FastAPI()
logger = logging.getLogger('web.requests')

@app.middleware('http')
async def log_requests(request: Request, call_next):
    # 生成唯一请求ID
    request_id = str(uuid.uuid4())[:8]
    request_id_var.set(request_id)

    # 记录请求开始
    start_time = time.time()
    client_ip = request.client.host if request.client else 'unknown'
    logger.info(
        '请求开始 | method=%s path=%s client=%s',
        request.method, request.url.path, client_ip,
        extra={'request_id': request_id}
    )

    try:
        response = await call_next(request)
        duration = (time.time() - start_time) * 1000

        # 根据状态码和耗时选择级别
        if response.status_code >= 500:
            logger.error(
                '请求失败 | status=%d duration=%.1fms',
                response.status_code, duration
            )
        elif duration > 1000:
            logger.warning(
                '请求缓慢 | status=%d duration=%.1fms',
                response.status_code, duration
            )
        else:
            logger.info(
                '请求完成 | status=%d duration=%.1fms',
                response.status_code, duration
            )
        return response

    except Exception as e:
        duration = (time.time() - start_time) * 1000
        logger.critical(
            '请求异常 | duration=%.1fms error=%s',
            duration, str(e), exc_info=True
        )
        raise

案例2：调试日志策略

在实际项目开发中，合理的调试日志策略可以大幅提升问题定位的效率。核心原则是根据不同的调试场景配置不同的日志输出方案。在本地开发时，建议将控制台日志级别设为DEBUG并包含详细的行号和函数名信息，以便快速定位代码位置；同时可以开启模块级别的日志过滤，只关注当前正在开发的模块的输出。在CI/CD流水线中，应将日志级别设为INFO以上并输出到文件，便于在构建失败时回溯。针对特定的Bug复现场景，可以利用动态级别调整功能，在不重启服务的情况下临时提高某个模块的日志级别，捕获详细的运行时状态。

# 多环境调试日志策略
import logging
import os
import logging.config

def setup_debug_logging(env='development'):
    """根据环境配置日志策略"""
    config = {
        'version': 1,
        'formatters': {
            'debug': {
                'format': '%(levelname)-8s | %(module)s.%(funcName)s:%(lineno)d | %(message)s'
            },
            'info': {
                'format': '%(asctime)s [%(levelname)s] %(message)s'
            },
        },
        'handlers': {
            'console': {
                'class': 'logging.StreamHandler',
                'level': logging.INFO,
            },
        },
        'loggers': {
            '': {},  # root
        }
    }

    if env == 'development':
        # 开发环境：控制台DEBUG级别 + 详细格式
        config['handlers']['console']['level'] = logging.DEBUG
        config['handlers']['console']['formatter'] = 'debug'
    elif env == 'testing':
        # 测试环境：文件日志 + INFO级别
        config['handlers']['file'] = {
            'class': 'logging.FileHandler',
            'filename': 'test_debug.log',
            'level': logging.DEBUG,
            'formatter': 'debug',
            'encoding': 'utf-8'
        }
        config['loggers']['']['handlers'] = ['console', 'file']
    else:
        # 生产环境：INFO级别
        config['handlers']['console']['formatter'] = 'info'

    config['root'] = {
        'handlers': ['console'],
        'level': logging.DEBUG,
    }
    logging.config.dictConfig(config)

# 使用
setup_debug_logging(os.getenv('APP_ENV', 'development'))
logger = logging.getLogger(__name__)
logger.debug('开发环境才能看到这条调试信息')

案例3：生产环境动态日志级别调整

在生产环境中，当需要排查一个难以复现的Bug时，最有效的手段是动态调整目标模块的日志级别，在不重启服务的情况下捕获详细的调试信息。以下实现基于Python logging模块的运行时配置能力，提供了一个HTTP端点用于动态调整任意Logger的日志级别。通过调用该端点，运维人员可以临时将某个模块的级别设为DEBUG，收集所需的调试信息后，再将级别恢复为正常值。这种模式比重启服务并修改配置文件要高效得多，尤其适用于无法轻易复现的间歇性故障排查。

# 生产环境动态日志级别调整
import logging
import logging.config
from flask import Flask, request, jsonify

app = Flask(__name__)

# 存储原始级别，便于恢复
_original_levels = {}

@app.route('/debug/log/level', methods=['POST'])
def set_log_level():
    """动态调整日志级别
    JSON请求体: {"logger": "app.payment", "level": "DEBUG"}
    """
    data = request.get_json()
    logger_name = data.get('logger', 'root')
    level_name = data.get('level', 'INFO').upper()

    # 检查级别是否有效
    level = getattr(logging, level_name, None)
    if level is None:
        return jsonify({'error': f'无效的日志级别: {level_name}'}), 400

    # 获取Logger并设置级别
    target_logger = logging.getLogger(logger_name)

    # 保存原始级别（首次调整时）
    if logger_name not in _original_levels:
        _original_levels[logger_name] = target_logger.level

    target_logger.setLevel(level)
    logging.getLogger().info(
        '动态调整日志级别: logger=%s %s->%s',
        logger_name,
        logging.getLevelName(_original_levels.get(logger_name, 0)),
        level_name
    )

    return jsonify({
        'message': f'Logger "{logger_name}" 级别已设置为 {level_name}',
        'original_level': logging.getLevelName(_original_levels[logger_name])
    })

@app.route('/debug/log/reset', methods=['POST'])
def reset_log_level():
    """恢复所有Logger的原始日志级别"""
    for name, level in _original_levels.items():
        logging.getLogger(name).setLevel(level)
        logging.getLogger().info(
            '恢复日志级别: logger=%s level=%s',
            name, logging.getLevelName(level)
        )
    _original_levels.clear()
    return jsonify({'message': '所有Logger级别已恢复'})

# 使用示例：
# curl -X POST -H "Content-Type: application/json" \
#   -d '{"logger": "app.payment", "level": "DEBUG"}' \
#   http://localhost:5000/debug/log/level

核心要点总结：

1. logging四大组件（Logger/Handler/Formatter/Filter）各司其职，灵活组合可应对各种日志需求。

2. 日志级别控制（DEBUG/INFO/WARNING/ERROR/CRITICAL）实现了信息的精细化筛选，替代print的核心优势之一。

3. 多样的Handler类型（Stream、File、RotatingFile、SMTP等）支持从本地到远程的全方位输出目标。

4. 日志配置应作为项目基础设施的一部分，使用dictConfig实现配置与代码的分离，支持环境差异化。

5. 结构化日志（JSON格式）与ELK栈的集成为生产环境提供了强大的可观测能力。