grep 文本搜索工具完整指南

grep 学习笔记 -- 命令行文本搜索大师

分类：命令行工具

核心主题：grep 文本搜索工具完整学习笔记

主要内容：全面系统地讲解 grep 文本搜索工具，涵盖安装配置、基本用法、正则表达式匹配、递归搜索、输出控制、上下文控制、性能优化及与 Claude Code 结合使用。

关键词：grep, 文本搜索, 正则表达式, Linux命令, 文件搜索, 字符串匹配, 代码搜索, 日志搜索

grep 概述与基本概念
安装与基本用法
正则表达式匹配
递归搜索与文件过滤
输出控制与格式化
上下文控制（前后行显示）
二进制文件与压缩文件搜索
扩展 grep 家族（egrep、fgrep、rgrep）
性能优化与高级技巧
与 Claude Code 结合使用
常见问题与排错
核心总结

一、grep 概述与基本概念

1.1 什么是 grep

grep 是 Linux/Unix 系统中最基础也最强大的文本搜索工具。其名称来源于 ed 编辑器中的命令 g/re/p（Global Regular Expression Print），意为"全局搜索正则表达式并打印匹配行"。grep 由 Ken Thompson 在 1974 年编写，是所有 Unix 系统的标准组件。

grep 的核心能力

grep 可以在文件或标准输入中搜索符合正则表达式模式的行，并将匹配的行输出到标准输出。它的核心能力包括：文件内容模式匹配、递归目录搜索、多文件并行处理、正则表达式引擎支持、上下文控制、输出格式定制、退出状态码判断等。

1.2 grep 的工作模式

grep 支持三种正则表达式模式，可以通过不同选项切换：

模式	选项	说明	适用场景
基本正则表达式 (BRE)	`-G`（默认）	元字符 `?+{}()\|` 需要反斜杠转义	简单字符串匹配，兼容性最广
扩展正则表达式 (ERE)	`-E`	元字符直接使用，无需转义	复杂模式匹配，日常推荐使用
Perl 兼容正则 (PCRE)	`-P`	支持零宽断言、非贪婪匹配等高级特性	需要高级正则特性的场景（GNU 扩展）

核心建议：日常使用中建议默认使用 grep -E（扩展正则），它可以减少大量不必要的反斜杠转义，提高命令的可读性。只有在需要 PCRE 高级特性（如零宽断言 (?=...)、非贪婪匹配 .*?）时才使用 -P 选项。

1.3 grep 的退出状态码

grep 的退出状态码是该工具最实用的特性之一，在脚本编程中广泛用于条件判断：

退出码	含义	常见用法
0	匹配到至少一行	模式存在 / 条件成立
1	没有匹配到任何行	模式不存在 / 条件不成立
2	发生错误（文件不存在、权限不足等）	需要检查错误日志

# 在脚本中利用退出码进行条件判断
if grep -q "ERROR" /var/log/app.log; then
    echo "发现错误，需要处理！"
    send_alert
fi

# 检查配置项是否已设置
if grep -q "^server_name" nginx.conf; then
    echo "server_name 已配置"
else
    echo "缺少 server_name 配置"
fi

# 链式检查退出码
grep -q "pattern" file.txt && echo "找到匹配"
grep -q "pattern" file.txt || echo "未找到匹配"

1.4 grep 在 Unix 哲学中的位置

grep 完美体现了 Unix 哲学"做一件事并把它做好"。它只专注于文本模式匹配，通过管道与其他命令组合实现更复杂的任务。grep 的输入可以是文件，也可以是管道传入的标准输入，输出同样可以传递给其他程序。

文件/输入 → grep 模式匹配 → 匹配行输出 → 管道传递 → 下一命令处理

grep 是 Unix 工具箱中最锋利的刀刃。它简单、专注、高效，与管道结合在一起时，它的力量会成倍增长。

二、安装与基本用法

2.1 在不同平台上安装 grep

大多数 Linux 发行版和 macOS 系统已经预装了 grep。以下是不同平台上的安装方式：

平台/发行版	安装命令	说明
Ubuntu/Debian	`sudo apt install grep`	预装，grep 3.7+
CentOS/RHEL/Fedora	`sudo yum install grep` 或 `sudo dnf install grep`	预装，grep 3.x
macOS	`brew install grep`	预装 BSD grep，Homebrew 可装 GNU grep
Windows (WSL)	`sudo apt install grep`	WSL 环境中安装
Windows (Git Bash)	安装 Git for Windows 时自带	包含在 Git Bash 中
Windows (Cygwin)	Cygwin 安装时选择 grep 包	Cygwin 包管理器

GNU grep vs BSD grep

macOS 默认使用 BSD 版本的 grep，它与 Linux 上的 GNU grep 有一些细微差异：

GNU grep 支持 -P（PCRE），BSD grep 不支持
GNU grep 的 -r 行为更丰富
BSD grep 的某些正则表达式语法略有不同
建议 macOS 用户通过 Homebrew 安装 GNU grep：brew install grep，安装后命令为 ggrep

2.2 基本语法结构

grep 命令的基本语法结构十分简洁：

# grep 基本语法
grep [选项] "模式" [文件...]

# 最简单的用法：在文件中搜索字符串
grep "hello" file.txt

# 从标准输入中搜索
echo "hello world" | grep "world"

# 搜索多个文件
grep "error" file1.txt file2.txt file3.txt

# 使用通配符匹配文件
grep "main" *.py

# 递归搜索目录
grep -r "TODO" /path/to/project/

2.3 最常用选项速览

以下是最常用的 grep 选项及其含义，掌握这些选项可以覆盖 90% 的日常使用场景：

选项	长选项	功能说明	示例
`-i`	`--ignore-case`	忽略大小写	`grep -i "error" log.txt`
`-v`	`--invert-match`	反向匹配（显示不包含模式的行）	`grep -v "^#" config.ini`
`-n`	`--line-number`	显示匹配行的行号	`grep -n "TODO" *.py`
`-c`	`--count`	统计匹配的行数	`grep -c "function" script.js`
`-r`	`--recursive`	递归搜索子目录	`grep -r "pattern" ./`
`-l`	`--files-with-matches`	只显示包含匹配的文件名	`grep -l "config" *.ini`
`-w`	`--word-regexp`	匹配整个单词	`grep -w "class" *.java`
`-x`	`--line-regexp`	匹配整行	`grep -x "version=1.0" config`
`-q`	`--quiet`	静默模式（只检查退出码）	`grep -q "pattern" file`
`-E`	`--extended-regexp`	使用扩展正则	`grep -E "[0-9]+" file`
`-o`	`--only-matching`	只输出匹配的部分	`grep -o "[0-9]\+" file`
`-e`	`--regexp`	指定多个模式	`grep -e "cat" -e "dog" file`
`-m`	`--max-count`	最多匹配 N 行后停止	`grep -m 10 "error" huge.log`

# 基本搜索：显示 file.txt 中包含 "hello" 的所有行
grep "hello" file.txt

# 忽略大小写搜索
grep -i "error" application.log

# 反向匹配：显示不含 "debug" 的所有行
grep -v "debug" log.txt

# 显示行号
grep -n "import" app.py

# 统计匹配行数
grep -c "function" script.js

# 只显示匹配的文件名
grep -l "class" *.py

# 整个单词匹配
grep -w "is" text.txt       # 匹配 "is" 但不匹配 "this"、"island"

# 静默模式：只检查是否存在匹配
grep -q "ERROR" log.txt && echo "发现错误"

# 最多显示前 5 个匹配
grep -m 5 "exception" huge_trace.log

# 匹配整行
grep -x "# configuration end" config.txt

2.4 多个文件搜索

grep 在处理多文件搜索时会自动在输出行前面加上文件名，方便区分匹配来源：

# 搜索当前目录下所有 .log 和 .txt 文件
grep "ERROR" *.log *.txt

# 使用 find 与 grep 组合
find . -name "*.py" -exec grep -l "def main" {} \;

# 使用 xargs 提高效率（大量文件时）
find . -name "*.log" -print0 | xargs -0 grep "ERROR"

# 强制显示文件名（即使只有一个文件）
grep -H "pattern" file.txt

# 强制不显示文件名
grep -h "pattern" file1.txt file2.txt

$ grep "ERROR" *.log app.log:2026-05-08 10:23:45 ERROR Database connection failed app.log:2026-05-08 10:23:46 ERROR Retry attempt 1 failed system.log:2026-05-08 09:15:22 ERROR Disk space low

-- 参数分隔符

当搜索的模式以 - 开头时，grep 可能会将其误认为选项。使用 -- 可以明确分隔选项和参数：

grep -- "-v" file.txt -- 搜索字面字符串 "-v"
grep -e "-v" file.txt -- 使用 -e 指定模式也可解决
grep -- "-v" -- *.txt -- 第二个 -- 可选，用于分隔文件名

三、正则表达式匹配

3.1 基本正则表达式 (BRE)

默认情况下，grep 使用基本正则表达式。在 BRE 模式下，元字符 ?+{}()| 被视为字面字符，需要使用反斜杠转义才能获得特殊含义。

# BRE 模式（默认）
grep "colou\?r" file.txt     # 匹配 color 或 colour，? 需要转义
grep "go\+gle" file.txt      # 匹配 gogle、google、gooogle... + 需要转义
grep "\(abc\)\{3\}" file.txt # 匹配 abcabcabc，() 和 {} 都需要转义
grep "cat\|dog" file.txt     # 匹配 cat 或 dog，| 需要转义

3.2 扩展正则表达式 (ERE)

使用 -E 选项启用扩展正则表达式，这也是日常使用中推荐的模式。ERE 中所有元字符都无需转义，语法更加直观。

# ERE 模式（推荐日常使用）
grep -E "colou?r" file.txt    # 匹配 color 或 colour
grep -E "go+gle" file.txt     # 匹配 gogle、google、gooogle...
grep -E "(abc){3}" file.txt   # 匹配 abcabcabc
grep -E "cat|dog" file.txt    # 匹配 cat 或 dog
grep -E "^[A-Z].*\.$" file.txt # 以大写字母开头、句号结尾的行

3.3 Perl 兼容正则 (PCRE)

GNU grep 支持 -P 选项启用 PCRE，提供更强大的正则能力：

# PCRE 模式（GNU grep 扩展）

# 非贪婪匹配
grep -P "<.+?>" file.html     # 匹配 HTML 标签（非贪婪，一次一个标签）
# 对比：grep -E "<.+>" 会贪婪匹配

# 零宽断言
grep -P "(?<=\$)[0-9.]+" prices.txt  # 匹配 $ 后面的数字（正向向后断言）
grep -P "[0-9]+(?=%)" data.txt      # 匹配 % 前面的数字（正向向前断言）
grep -P "(? nums.txt  # 匹配独立的 123（负向断言）

# 非捕获组
grep -P "(?:https?|ftp)://\S+" urls.txt  # 匹配 URL 但不捕获协议部分

# 命名捕获组 (Perl 5.10+)
grep -P "(?P\d+\.\d+\.\d+\.\d+)" access.log

# 递归模式（匹配嵌套结构）
grep -P "\((?:[^()]+|(?R))*\)" code.c  # 匹配嵌套括号

选型建议：日常使用优先选择 grep -E（ERE），可读性好且跨平台兼容。只在需要零宽断言、非贪婪匹配、递归匹配等高级特性时使用 grep -P。注意 -P 是 GNU 扩展，macOS 原版 grep 和某些嵌入式系统上不可用。

3.4 字符类与 POSIX 字符集

POSIX 标准定义了一组字符类，可以在正则表达式中使用，提供更好的可移植性：

POSIX 类	等价于	说明
`[:alnum:]`	`[a-zA-Z0-9]`	字母和数字
`[:alpha:]`	`[a-zA-Z]`	字母
`[:digit:]`	`[0-9]`	数字
`[:lower:]`	`[a-z]`	小写字母
`[:upper:]`	`[A-Z]`	大写字母
`[:space:]`	`[ \t\n\r\f\v]`	所有空白字符
`[:blank:]`	`[ \t]`	空格和制表符
`[:punct:]`	[!-/:-@[-`{-~]	标点符号
`[:print:]`		可打印字符（包括空格）
`[:graph:]`		可见字符（不包括空格）
`[:cntrl:]`		控制字符
`[:xdigit:]`	`[0-9a-fA-F]`	十六进制数字

# POSIX 字符类使用示例
grep -E "[[:space:]]+" file.txt      # 匹配连续空白
grep -E "^[[:upper:]]" file.txt       # 以大写字母开头的行
grep -E "[[:punct:]]$" file.txt       # 以标点符号结尾的行
grep -E "[[:digit:]]{3,}" file.txt    # 匹配至少3位数字
grep -E "^[[:space:]]*$" file.txt    # 匹配空行（只含空白）
grep -E "[[:alpha:]]+@[[:alpha:]]+\.[[:alpha:]]{2,}" emails.txt  # 简单邮箱匹配

3.5 实用正则模式大全

匹配目标	正则表达式 (ERE)	说明
IPv4 地址	`(25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.(25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.(25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)\.(25[0-5]\|2[0-4][0-9]\|[01]?[0-9][0-9]?)`	完整的 IPv4 地址匹配
Email 地址	`[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}`	基础邮箱格式
URL	`https?://[^\s"'>]+`	HTTP/HTTPS 链接
日期 (YYYY-MM-DD)	`[0-9]{4}-(0[1-9]\|1[0-2])-(0[1-9]\|[12][0-9]\|3[01])`	带日期合法性验证
时间 (HH:MM:SS)	`(0[0-9]\|1[0-9]\|2[0-3]):[0-5][0-9]:[0-5][0-9]`	24 小时时间格式
十六进制颜色	`#([0-9a-fA-F]{3}\|[0-9a-fA-F]{6})\b`	#RGB 或 #RRGGBB
HTML 标签	`<[^>]+>`	匹配任意 HTML 标签
中文字符 (PCRE)	`[\x{4e00}-\x{9fff}]`	匹配中文字符（需 -P）
中文字符 (ERE)	`[一-龥]`	匹配中文字符（字符集覆盖）
文件路径	`(/[^/ ]*)+/?`	类 Unix 文件路径
GUID/UUID	`[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}`	标准 UUID 格式
浮点数	`-?[0-9]+(\.[0-9]+)?`	整数或小数
版本号 (semver)	`[0-9]+\.[0-9]+\.[0-9]+`	语义化版本号如 1.2.3
MAC 地址	`([0-9a-fA-F]{2}:){5}[0-9a-fA-F]{2}`	MAC 地址 xx:xx:xx:xx:xx:xx

# 在日志文件中提取 IP 地址
grep -oE "(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)" access.log

# 提取所有邮箱地址
grep -oE "[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}" contacts.txt

# 提取 URL
grep -oE "https?://[^\s\"'<>]+" index.html

# 查找中文字符行
grep -P "[\x{4e00}-\x{9fff}]" document.txt

# 查找所有 TODO 注释
grep -rnE "(TODO|FIXME|HACK|XXX|BUG):" --include="*.{py,js,ts,java,cpp}" .

# 匹配日志级别
grep -E "\b(ERROR|FATAL|CRITICAL)\b" application.log

3.6 模式文件 (.gitignore 风格)

当有多个搜索模式时，可以将模式写入文件，使用 -f 选项读取：

# 创建模式文件 patterns.txt
# 内容：
# ERROR
# FATAL
# CRITICAL

# 从模式文件中读取多个模式
grep -f patterns.txt log.txt

# 结合 -v 反向匹配：排除多个不需要的模式
grep -v -f exclude_patterns.txt data.txt

四、递归搜索与文件过滤

4.1 递归搜索基础

递归搜索是在项目中查找内容最常用的方式，grep 提供了多种递归搜索的选项：

# 递归搜索当前目录（默认不跟随符号链接）
grep -r "pattern" .

# 递归搜索并跟随符号链接
grep -R "pattern" .

# 递归搜索指定目录（多个目录）
grep -r "main" src/ tests/

# 递归搜索时指定最大深度
# grep 本身不支持 -maxdepth，需结合 find 使用
find . -maxdepth 3 -name "*.py" -exec grep -l "class" {} \;

4.2 文件类型过滤

grep 提供了 --include 和 --exclude 选项来精确控制需要搜索的文件：

选项	功能	示例
`--include=GLOB`	只搜索匹配 glob 的文件	`--include="*.py"`
`--exclude=GLOB`	排除匹配 glob 的文件	`--exclude="*.min.js"`
`--exclude-dir=DIR`	排除指定目录	`--exclude-dir=node_modules`
`-r`	递归搜索
`-R`	递归搜索并跟随符号链接

# 只搜索 Python 文件
grep -r --include="*.py" "def " .

# 搜索多种文件类型
grep -r --include="*.{py,js,ts}" "import" .

# 排除特定文件
grep -r --exclude="*.min.*" "function" .

# 排除特定目录
grep -r --exclude-dir="node_modules" --exclude-dir=".git" --exclude-dir="__pycache__" "pattern" .

# 组合多个过滤条件
grep -rn \
    --include="*.{js,ts,jsx,tsx}" \
    --exclude="*.test.*" \
    --exclude="*.spec.*" \
    --exclude-dir="node_modules" \
    --exclude-dir="dist" \
    "useEffect" src/

4.3 与 find 命令组合

当 --include 和 --exclude 无法满足复杂需求时，可以结合 find 命令使用：

# find + xargs + grep：最灵活的组合
find . -type f -name "*.py" -size +1k | xargs grep -l "def main"

# 搜索最近 7 天内修改过的文件
find . -type f -name "*.log" -mtime -7 | xargs grep "ERROR"

# 搜索特定权限的文件
find . -type f -perm 755 | xargs grep -l "#!/bin/bash"

# 搜索特定用户拥有的文件
find /home -user nginx -name "*.conf" | xargs grep "server_name"

# 安全处理文件名中的特殊字符（空格、换行等）
find . -type f -name "*.txt" -print0 | xargs -0 grep "pattern"

# 排除 git 目录的 find 搜索
find . -path ./.git -prune -o -type f -print | xargs grep "TODO"

# 限制搜索深度
find . -maxdepth 2 -name "*.md" | xargs grep "grep"

find + grep 组合技巧

使用 -print0 + xargs -0 处理含空格的文件名
大量文件时使用 xargs 比 -exec 效率更高
find 提供更细粒度的文件过滤（大小、时间、权限等）
使用 find ... -prune 模式排除不需要的目录

4.4 大型项目搜索策略

# 搜索大型项目时的最佳实践

# 1. 先从根目录排除不必要的目录
grep -rn --exclude-dir={node_modules,.git,target,build,dist,vendor} "pattern" .

# 2. 先用 -l 找到文件，再详细查看
grep -rl "pattern" --include="*.py" . | xargs grep -n "pattern"

# 3. 使用 -m 限制匹配数量，快速确认
grep -r -m 5 "pattern" .

# 4. 结合 wc 统计分布
grep -rl "TODO" --include="*.py" . | wc -l
# 输出：有多少个 Python 文件包含 TODO

# 5. 使用 git grep（仅限 git 仓库，自动忽略 .gitignore）
git grep "pattern"
git grep --cached "pattern"  # 只搜索暂存区

git grep vs grep -r

在 Git 仓库中，git grep 比 grep -r 更有优势：

自动遵守 .gitignore，不会搜索被忽略的文件
性能更优（可以利用 Git 的对象存储）
可以只搜索暂存区或特定提交
支持更丰富的输出格式（行号、颜色等）

但 grep -r 更通用，可以搜索非 Git 目录，且带有更丰富的选项。

五、输出控制与格式化

5.1 颜色高亮

grep 默认在交互终端中会高亮显示匹配的关键词，--color 选项提供了多种控制方式：

# 自动颜色（交互终端启用，管道中禁用）- 默认行为
grep --color=auto "pattern" file.txt

# 始终启用颜色（即使在管道中也保留颜色代码）
grep --color=always "pattern" file.txt | less -R

# 禁用颜色
grep --color=never "pattern" file.txt

# 设置别名，日常使用自动颜色
# 在 ~/.bashrc 或 ~/.zshrc 中添加：
alias grep='grep --color=auto'

颜色配置

可以通过 GREP_COLORS 环境变量自定义颜色方案：

export GREP_COLORS='ms=01;31:mc=01;31:sl=:cx=:fn=35:ln=32:bn=32:se=36'
# ms=01;31  -- 匹配文本为红色粗体
# fn=35     -- 文件名为紫色
# ln=32     -- 行号为绿色
# se=36     -- 分隔符为青色

5.2 只输出匹配部分 (-o)

-o 选项只输出匹配到的部分，而不是整行。这在提取特定信息时非常有用：

# 提取所有邮箱地址（只输出匹配的字符串本身）
grep -oE "[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}" contacts.txt

# 提取所有 IP 地址
grep -oE "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}" access.log

# 提取所有数字
grep -oE "[0-9]+" data.txt

# 结合排序去重：统计 IP 访问量
grep -oE "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}" access.log \
    | sort | uniq -c | sort -rn | head -10

# 提取 HTML 标签内容
grep -oP "\K[^<]+"</span> index.html  <span class="comment"># \K 会丢弃前面匹配的内容</span>

<span class="comment"># 提取 Markdown 标题</span>
grep -oP <span class="string">"^#+\s+\K.*"</span> README.md

<span class="comment"># 多模式匹配：提取多种信息</span>
grep -oE <span class="string">"(ERROR|WARN|INFO)"</span> log.txt | sort | uniq -c</div>

            <h3>5.3 输出格式控制</h3>
            <table>
                <tr><th>选项</th><th>功能</th><th>示例</th></tr>
                <tr><td><code>-n</code></td><td>显示行号</td><td><code>grep -n "pattern" file.txt</code></td></tr>
                <tr><td><code>-b</code></td><td>显示字节偏移量</td><td><code>grep -b "pattern" binary.dat</code></td></tr>
                <tr><td><code>-H</code></td><td>始终显示文件名</td><td><code>grep -H "pattern" file.txt</code></td></tr>
                <tr><td><code>-h</code></td><td>不显示文件名</td><td><code>grep -h "pattern" f1.txt f2.txt</code></td></tr>
                <tr><td><code>-T</code></td><td>Tab 对齐文件名和行号</td><td><code>grep -rT "pattern" src/</code></td></tr>
                <tr><td><code>-Z</code></td><td>输出 NUL 分隔的文件名</td><td><code>grep -rlZ "pattern" . | xargs -0 rm</code></td></tr>
            </table>

            <div class="code-block"><span class="comment"># 显示行号（代码搜索必备）</span>
grep -rn <span class="string">"def "</span> src/ --include=<span class="string">"*.py"</span>

<span class="comment"># 使用 -T 对齐输出</span>
grep -rnT <span class="string">"class"</span> src/
<span class="comment"># 输出示例：</span>
<span class="comment"># src/app.py:    10:class User:</span>
<span class="comment"># src/model.py:  25:class Admin(User):</span>

<span class="comment"># 使用 -Z 处理带空格的文件名</span>
grep -rlZ <span class="string">"ERROR"</span> logs/ | xargs -0 -I {} cp {} /backup/

<span class="comment"># 结合 cut 提取特定字段</span>
grep <span class="string">"pattern"</span> file.txt | cut -d: -f1,3

<span class="comment"># 使用 sed 进一步格式化输出</span>
grep -rn <span class="string">"TODO"</span> src/ | sed <span class="string">'s/^/[TODO] /'</span></div>

            <h3>5.4 标签分隔输出 (--label)</h3>
            <p>当从标准输入读取数据时，grep 默认显示 <code>(standard input)</code> 作为文件名。使用 <code>--label</code> 可以自定义名称：</p>
            <div class="code-block"><span class="comment"># 管道输入时自定义标签</span>
cat log.txt | grep --label=<span class="string">"分析日志"</span> -H <span class="string">"ERROR"</span>
<span class="comment"># 输出：分析日志:2026-05-08 ERROR something happened</span>

<span class="comment"># 在脚本中用于生成带标识的输出</span>
for f <span class="keyword">in</span> *.log; <span class="keyword">do</span>
    cat <span class="string">"$f"</span> | grep --label=<span class="string">"$f"</span> -H <span class="string">"ERROR"</span>
<span class="keyword">done</span></div>

            <h3>5.5 空行分隔符</h3>
            <p>使用 <code>--group-separator</code> 或 <code>--no-group-separator</code> 控制匹配组之间的分隔：</p>
            <div class="code-block"><span class="comment"># 默认行为（--group-separator=--）</span>
grep -A <span class="number">1</span> <span class="string">"error"</span> log.txt

<span class="comment"># 自定义分组分隔符</span>
grep --group-separator=<span class="string">"========"</span> -A <span class="number">1</span> <span class="string">"error"</span> log.txt

<span class="comment"># 不显示分隔符</span>
grep --no-group-separator -A <span class="number">1</span> <span class="string">"error"</span> log.txt</div>
        </div>

        <!-- ==================== 第六章 ==================== -->
        <div class="section" id="ch6">
            <h2>六、上下文控制（前后行显示）</h2>

            <h3>6.1 上下文选项</h3>
            <p>在分析日志或代码时，仅仅显示匹配行往往不够，我们还需要查看匹配行的上下文。grep 提供了三种上下文控制选项：</p>
            <table>
                <tr><th>选项</th><th>含义</th><th>示例</th><th>说明</th></tr>
                <tr><td><code>-A N</code></td><td>After（匹配后 N 行）</td><td><code>grep -A 3 "Exception" log.txt</code></td><td>显示匹配行及其后 3 行</td></tr>
                <tr><td><code>-B N</code></td><td>Before（匹配前 N 行）</td><td><code>grep -B 5 "ERROR" log.txt</code></td><td>显示匹配行及其前 5 行</td></tr>
                <tr><td><code>-C N</code></td><td>Context（前后各 N 行）</td><td><code>grep -C 2 "failed" log.txt</code></td><td>显示匹配行及其前后各 2 行</td></tr>
            </table>

            <div class="code-block"><span class="comment"># 查看异常堆栈的前后文（日志分析常用）</span>
grep -A <span class="number">15</span> -B <span class="number">5</span> <span class="string">"NullPointerException"</span> app.log

<span class="comment"># 查看函数定义及其周围代码</span>
grep -n -B <span class="number">2</span> -A <span class="number">20</span> <span class="string">"^def main"</span> app.py

<span class="comment"># 查看配置项及其前后说明</span>
grep -B <span class="number">3</span> -A <span class="number">1</span> <span class="string">"^server {"</span> nginx.conf

<span class="comment"># 查看测试失败详情</span>
grep -A <span class="number">10</span> <span class="string">"FAILED"</span> test_output.txt

<span class="comment"># 查看 commit 消息上下文（git log）</span>
git log --oneline | grep -B <span class="number">5</span> -A <span class="number">3</span> <span class="string">"fix bug"</span></div>

            <div class="output-block">$ grep -B 2 -A 3 "ERROR" app.log
2026-05-08 10:23:43 INFO Processing request #4521
2026-05-08 10:23:44 WARN Connection pool running low
2026-05-08 10:23:45 ERROR Database connection failed
2026-05-08 10:23:45 INFO Retrying in 5 seconds...
2026-05-08 10:23:46 ERROR Retry attempt 1 failed
2026-05-08 10:23:46 ERROR Retry attempt 2 failed
--
2026-05-08 10:24:01 INFO Processing request #4522
2026-05-08 10:24:02 INFO Request completed
2026-05-08 10:24:03 ERROR Disk space low

<span class="comment"># -- 分隔符用于分隔不同的匹配组</span></div>

            <h3>6.2 自定义分隔符</h3>
            <p>默认情况下，grep 用 <code>--</code> 分隔不同的匹配组。可以使用选项自定义：</p>
            <div class="code-block"><span class="comment"># 改变组间分隔符</span>
grep --group-separator=<span class="string">"========"</span> -A <span class="number">2</span> <span class="string">"ERROR"</span> log.txt

<span class="comment"># 完全去掉分隔符</span>
grep --no-group-separator -A <span class="number">2</span> <span class="string">"ERROR"</span> log.txt

<span class="comment"># 空行作为分隔符</span>
grep --group-separator=<span class="string">""</span> -A <span class="number">2</span> <span class="string">"ERROR"</span> log.txt</div>

            <h3>6.3 上下文的高级应用</h3>
            <div class="code-block"><span class="comment"># 查看数据库错误及其周围的 SQL 语句</span>
grep -B <span class="number">1</span> -A <span class="number">1</span> <span class="string">"SQLSTATE"</span> app.log | grep -v <span class="string">"^--$"</span>

<span class="comment"># 在代码中查找函数调用及其上下文</span>
grep -n -B <span class="number">2</span> -A <span class="number">2</span> <span class="string">"\.find\(\)"</span> *.js

<span class="comment"># 时间范围限定 + 上下文</span>
grep -A <span class="number">5</span> <span class="string">"2026-05-08 10:23:"</span> log.txt | grep -A <span class="number">5</span> <span class="string">"ERROR"</span>

<span class="comment"># 使用 awk 模拟灵活的上下文控制</span>
awk <span class="string">'/ERROR/ { for(i=NR-2;i<=NR+3;i++) if(i>0) print i": "$0 }'</span> log.txt

<span class="comment"># 在上下文中高亮匹配行</span>
grep --color=always -A <span class="number">3</span> <span class="string">"ERROR"</span> log.txt | less -R</div>

            <div class="concept">
                <h4>上下文控制使用场景</h4>
                <ul>
                    <li><strong>日志分析：</strong>查看错误发生前后的日志，快速定位根因</li>
                    <li><strong>代码审查：</strong>查看函数定义时同时查看其文档注释和实现</li>
                    <li><strong>配置审查：</strong>查看配置项时同时查看相关配置</li>
                    <li><strong>测试失败分析：</strong>查看测试失败行及其详细断言输出</li>
                </ul>
            </div>

            <div class="warning-box">
                <h4>性能提醒</h4>
                <p>在超大文件上使用 <code>-A</code>、<code>-B</code>、<code>-C</code> 时，grep 需要额外的内存来缓存上下文行。对于 GB 级别的日志文件，建议先通过 <code>tail</code>、<code>head</code> 或 <code>sed</code> 裁剪文件范围，再使用上下文搜索。</p>
            </div>
        </div>

        <!-- ==================== 第七章 ==================== -->
        <div class="section" id="ch7">
            <h2>七、二进制文件与压缩文件搜索</h2>

            <h3>7.1 二进制文件处理</h3>
            <p>grep 默认会将二进制文件视为不可搜索的，只输出"Binary file matches"的提示。可以通过以下选项控制：</p>
            <table>
                <tr><th>选项</th><th>功能</th><th>说明</th></tr>
                <tr><td><code>-a</code> / <code>--text</code></td><td>将二进制文件视为文本文件</td><td>强制 grep 处理二进制内容</td></tr>
                <tr><td><code>-U</code> / <code>--binary</code></td><td>不剥离 CR 字符</td><td>保持 Windows 风格的换行符</td></tr>
                <tr><td><code>-I</code></td><td>忽略二进制文件</td><td>跳过二进制文件（与 -a 相反）</td></tr>
            </table>

            <div class="code-block"><span class="comment"># 在二进制文件中搜索文本模式</span>
grep -a <span class="string">"string"</span> binary_file.bin

<span class="comment"># 搜索可执行文件中的字符串</span>
grep -a <span class="string">"version"</span> /usr/bin/grep

<span class="comment"># 搜索 PDF 文件中的文本内容</span>
grep -a <span class="string">"Copyright"</span> document.pdf

<span class="comment"># 结合 strings 命令更有效地搜索二进制文件</span>
strings binary_file.bin | grep <span class="string">"password"</span>

<span class="comment"># 在 core dump 中搜索</span>
strings core.dump | grep <span class="string">"error"</span>

<span class="comment"># 搜索数据库文件</span>
grep -a <span class="string">"user@example.com"</span> database.sqlite

<span class="comment"># 递归搜索时忽略二进制文件（默认行为）</span>
grep -rI <span class="string">"pattern"</span> .</div>

            <div class="tip-box">
                <h4>strings + grep 模式</h4>
                <p><code>strings</code> 命令可以提取二进制文件中的可读字符串，与 grep 组合使用是最有效的二进制文件搜索方式：</p>
                <ul>
                    <li>比直接 <code>grep -a</code> 更高效</li>
                    <li>可以设置最小字符串长度：<code>strings -n 10 binary</code></li>
                    <li>可以指定编码：<code>strings -e l binary</code>（大端编码）</li>
                </ul>
            </div>

            <h3>7.2 压缩文件搜索</h3>
            <p>grep 本身不支持直接搜索压缩文件，但可以通过 zcat、zgrep 等工具实现：</p>
            <div class="code-block"><span class="comment"># 使用 zgrep 搜索 gzip 压缩的文件</span>
zgrep <span class="string">"ERROR"</span> log.gz
zgrep <span class="string">"pattern"</span> *.gz

<span class="comment"># 使用 bzgrep 搜索 bzip2 压缩的文件</span>
bzgrep <span class="string">"pattern"</span> file.bz2

<span class="comment"># 使用 xzgrep 搜索 xz 压缩的文件</span>
xzgrep <span class="string">"pattern"</span> file.xz

<span class="comment"># 使用 lzgrep 搜索 lzma 压缩的文件</span>
lzgrep <span class="string">"pattern"</span> file.lzma

<span class="comment"># 使用 zcat 解压后通过管道传给 grep</span>
zcat log.gz | grep <span class="string">"ERROR"</span>

<span class="comment"># 搜索多个压缩文件</span>
for f <span class="keyword">in</span> *.gz; <span class="keyword">do</span>
    <span class="builtin">echo</span> <span class="string">"=== $f ==="</span>
    zgrep <span class="string">"ERROR"</span> <span class="string">"$f"</span>
<span class="keyword">done</span>

<span class="comment"># 搜索最近修改的压缩日志</span>
zgrep -l <span class="string">"Critical"</span> /var/log/*.gz | tail -5

<span class="comment"># 同时搜索常规日志和压缩归档</span>
<span class="comment"># 先搜索当前日志，再搜索归档</span>
grep <span class="string">"ERROR"</span> /var/log/syslog
zgrep <span class="string">"ERROR"</span> /var/log/syslog.*.gz</div>

            <div class="key-point">
                <strong>日常日志搜索实用模式：</strong>
                <p>在排查生产环境问题时，经常需要同时搜索当前日志和已轮转的压缩归档：</p>
                <div class="code-block" style="margin:10px 0 0;font-size:.85em;"><span class="comment"># 联合搜索当前日志和 gz 归档</span>
<span class="comment"># 查找最近30分钟内所有 ERROR</span>
grep <span class="string">"ERROR"</span> /var/log/app.log
zgrep <span class="string">"ERROR"</span> /var/log/app.log.*.gz

<span class="comment"># 一行命令搜索全部</span>
{ cat /var/log/app.log; zcat /var/log/app.log.*.gz; } | grep <span class="string">"ERROR"</span></div>
            </div>
        </div>

        <!-- ==================== 第八章 ==================== -->
        <div class="section" id="ch8">
            <h2>八、扩展 grep 家族（egrep、fgrep、rgrep）</h2>

            <h3>8.1 grep 家族概览</h3>
            <p>传统的 Unix 系统中包含了 grep 的多个变体。现代 GNU grep 已经将它们的核心功能通过选项整合到了 grep 命令中，但这些名称仍作为兼容性符号链接保留：</p>
            <table>
                <tr><th>命令</th><th>等价于</th><th>说明</th><th>当前状态</th></tr>
                <tr><td><code>grep</code></td><td>--</td><td>基本正则表达式搜索</td><td>标准命令</td></tr>
                <tr><td><code>egrep</code></td><td><code>grep -E</code></td><td>扩展正则表达式搜索</td><td>已废弃，用 grep -E 替代</td></tr>
                <tr><td><code>fgrep</code></td><td><code>grep -F</code></td><td>固定字符串搜索（Fast grep）</td><td>已废弃，用 grep -F 替代</td></tr>
                <tr><td><code>rgrep</code></td><td><code>grep -r</code></td><td>递归搜索</td><td>已废弃，用 grep -r 替代</td></tr>
            </table>

            <h3>8.2 fgrep / grep -F：固定字符串搜索</h3>
            <p><code>-F</code> 模式将搜索模式视为固定字符串（而非正则表达式），这在以下场景中尤为有用：</p>
            <div class="code-block"><span class="comment"># 搜索包含特殊字符的模式（无需转义）</span>
grep -F <span class="string">"(error.code == 500)"</span> app.log    <span class="comment"># 搜索字面字符串</span>
grep -F <span class="string">"/path/to/file[1].txt"</span> manifest.txt  <span class="comment"># 括号是字面字符</span>

<span class="comment"># 使用固定字符串搜索性能更高</span>
<span class="comment"># 当不需要正则时，优先使用 -F</span>
grep -F <span class="string">"import sys"</span> *.py

<span class="comment"># 结合 -f 从文件中读取大量固定模式</span>
grep -F -f keywords.txt documents.txt

<span class="comment"># 搜索日志中特定的错误代码</span>
grep -F <span class="string">"HTTP/1.1\" 500"</span> access.log

<span class="comment"># 搜索包含通配符字面量的内容</span>
grep -F <span class="string">"*.log"</span> .gitignore</div>

            <div class="concept">
                <h4>grep -F 的性能优势</h4>
                <p>当搜索纯字符串时，<code>-F</code> 使用 Aho-Corasick 算法（多模式匹配算法），比正则引擎快得多。对于大量固定字符串的匹配（如字典匹配），<code>-f</code> + <code>-F</code> 的组合性能可以比默认模式提升数倍到数十倍。在处理大规模文本（如日志分析、词典匹配）时，始终使用 <code>-F</code> 可以获得显著的性能提升。</p>
            </div>

            <h3>8.3 现代替代工具</h3>
            <p>随着文本搜索需求的发展，社区出现了一批现代替代工具，在某些场景下比 grep 更快或更方便：</p>
            <table>
                <tr><th>工具</th><th>特点</th><th>适用场景</th><th>示例</th></tr>
                <tr><td><code>ripgrep (rg)</code></td><td>Rust 编写，超快，自动忽略 .gitignore</td><td>大型代码库搜索</td><td><code>rg pattern src/</code></td></tr>
                <tr><td><code>the_silver_searcher (ag)</code></td><td>专注于代码搜索，速度快</td><td>代码搜索</td><td><code>ag pattern src/</code></td></tr>
                <tr><td><code>ack</code></td><td>Perl 编写，专为开发者设计</td><td>代码搜索，友好输出</td><td><code>ack pattern</code></td></tr>
                <tr><td><code>ugrep</code></td><td>兼容 grep，功能增强</td><td>需要更多特性的场景</td><td><code>ugrep pattern file</code></td></tr>
            </table>

            <div class="code-block"><span class="comment"># ripgrep 示例（强烈推荐）</span>
rg <span class="string">"pattern"</span>                     <span class="comment"># 自动递归，自动忽略 .gitignore</span>
rg -i <span class="string">"pattern"</span> src/              <span class="comment"># 忽略大小写</span>
rg -t py <span class="string">"import"</span>                 <span class="comment"># 只搜索 Python 文件</span>
rg -l <span class="string">"TODO"</span>                      <span class="comment"># 只显示文件名</span>
rg --sort path <span class="string">"pattern"</span>          <span class="comment"># 排序输出</span>
rg <span class="string">"pattern"</span> --glob <span class="string">'!*.min.js'</span>   <span class="comment"># 排除 minified 文件</span>

<span class="comment"># ag 示例</span>
ag <span class="string">"pattern"</span>                     <span class="comment"># 比 grep 更快的代码搜索</span>
ag --python <span class="string">"def class"</span>           <span class="comment"># 搜索 Python 文件</span>
ag -C <span class="number">3</span> <span class="string">"TODO"</span>                    <span class="comment"># 显示上下文</span></div>

            <div class="key-point">
                <strong>选型建议：</strong>
                <ul>
                    <li><strong>系统自带：</strong>grep 是最通用的选择，在所有 Unix 系统上可用</li>
                    <li><strong>代码搜索：</strong>ripgrep 是当前最快的代码搜索工具，功能完善，强烈推荐</li>
                    <li><strong>管道处理：</strong>在 Shell 管道链中使用 grep（兼容性最好）</li>
                    <li><strong>大量固定字符串：</strong>grep -F 使用 Aho-Corasick 算法，性能最优</li>
                    <li><strong>高级正则：</strong>grep -P 或 ripgrep 支持 PCRE</li>
                </ul>
            </div>
        </div>

        <!-- ==================== 第九章 ==================== -->
        <div class="section" id="ch9">
            <h2>九、性能优化与高级技巧</h2>

            <h3>9.1 性能调优原则</h3>
            <p>处理大型文件或海量文件时，性能是重要的考量因素。以下是 grep 性能优化的核心原则：</p>
            <table>
                <tr><th>原则</th><th>方法</th><th>效果</th></tr>
                <tr><td>缩小搜索范围</td><td>使用 <code>--include</code>/<code>--exclude</code>/<code>--exclude-dir</code> 缩小文件集</td><td>减少文件 I/O 开销</td></tr>
                <tr><td>使用固定字符串</td><td>不需要正则时使用 <code>-F</code></td><td>Aho-Corasick 算法比正则引擎快很多</td></tr>
                <tr><td>限制匹配数量</td><td>使用 <code>-m N</code> 限制输出行数</td><td>找到 N 个匹配后立即停止扫描</td></tr>
                <tr><td>使用 -l 尽早返回</td><td>用 <code>-l</code> 只检查文件是否有匹配</td><td>找到一个匹配后立即跳到下一个文件</td></tr>
                <tr><td>避免颜色开销</td><td>管道中使用 <code>--color=never</code></td><td>减少 ANSI 转义码生成</td></tr>
                <tr><td>合理使用 -q</td><td>只需要退出码时使用 <code>-q</code></td><td>找到首个匹配立即停止</td></tr>
            </table>

            <div class="code-block"><span class="comment"># 性能对比示例</span>
<span class="comment"># 慢：全目录未优化搜索</span>
grep -r <span class="string">"int main"</span> .                   <span class="comment"># 可能搜索 node_modules、.git 等</span>

<span class="comment"># 快：缩小范围并使用固定字符串</span>
grep -rF --include=<span class="string">"*.{c,cpp,h}"</span> --exclude-dir=build <span class="string">"int main"</span> .

<span class="comment"># 更快：找到 5 个匹配就停止</span>
grep -rFl -m 5 <span class="string">"int main"</span> --include=<span class="string">"*.c"</span> .

<span class="comment"># 最快：只检查是否存在（-q）</span>
grep -rqF <span class="string">"int main"</span> --include=<span class="string">"*.c"</span> .
<span class="builtin">echo</span> $?  <span class="comment"># 0 = 存在, 1 = 不存在</span></div>

            <h3>9.2 使用 LC_ALL 提升性能</h3>
            <p>设置 <code>LC_ALL=C</code> 可以显著提升 grep 在 ASCII 文件上的搜索性能：</p>
            <div class="code-block"><span class="comment"># 对比测试</span>
time grep <span class="string">"pattern"</span> large_file.txt
time LC_ALL=C grep <span class="string">"pattern"</span> large_file.txt

<span class="comment"># LC_ALL=C 的好处：</span>
<span class="comment"># 1. 跳过区域设置 (locale) 处理，直接进行字节比较</span>
<span class="comment"># 2. 对于纯 ASCII 文本，性能可提升 2-5 倍</span>
<span class="comment"># 3. POSIX 字符类行为更可预测</span>
<span class="comment"># 局限：不能正确处理 UTF-8 多字节字符</span>

<span class="comment"># 在脚本中临时使用 C locale</span>
LC_ALL=C grep -F <span class="string">"ERROR"</span> huge_log.txt

<span class="comment"># 创建别名方便使用</span>
alias cgrep=<span class="string">'LC_ALL=C grep --color=auto'</span></div>

            <div class="warning-box">
                <h4>LC_ALL=C 的局限</h4>
                <p><code>LC_ALL=C</code> 在搜索中文等多字节编码文本时可能产生错误结果，因为它会按字节而不是按字符处理。仅建议在确认搜索内容为纯 ASCII 时使用。对于 UTF-8 文本文件，保留默认区域设置。</p>
            </div>

            <h3>9.3 并行加速</h3>
            <p>在搜索大量小文件时，可以利用并行处理提升速度：</p>
            <div class="code-block"><span class="comment"># 使用 xargs -P 并行搜索</span>
<span class="comment"># 将文件列表分块并行处理</span>
find . -name <span class="string">"*.log"</span> | xargs -P <span class="number">4</span> grep -l <span class="string">"ERROR"</span>

<span class="comment"># 使用 GNU parallel</span>
find . -name <span class="string">"*.py"</span> | parallel -j <span class="number">8</span> grep -l <span class="string">"TODO"</span> {}

<span class="comment"># 将文件按大小分组处理</span>
<span class="comment"># 大文件用单进程，小文件用多进程</span>
find . -size +100M -name <span class="string">"*.log"</span> | xargs grep <span class="string">"ERROR"</span>
find . -size -100k -name <span class="string">"*.py"</span> | xargs -P 8 grep -l <span class="string">"class"</span></div>

            <h3>9.4 实用高级技巧</h3>
            <div class="code-block"><span class="comment"># 1. 行去重（匹配行去重）</span>
grep -rn <span class="string">"pattern"</span> . | awk -F: <span class="string">'!seen[$0]++'</span>  <span class="comment"># 去除完全重复的行</span>
grep -rn <span class="string">"pattern"</span> . | awk -F: <span class="string">'!seen[$1]++'</span>  <span class="comment"># 按文件名去重</span>

<span class="comment"># 2. 时间范围过滤 + grep</span>
awk <span class="string">'$0 >= "2026-05-08 10:00:00" && $0 <= "2026-05-08 11:00:00"'</span> app.log | grep <span class="string">"ERROR"</span>

<span class="comment"># 3. 统计匹配行百分比</span>
total=$(wc -l < log.txt)
matches=$(grep -c <span class="string">"ERROR"</span> log.txt)
<span class="builtin">echo</span> <span class="string">"错误率: $(( matches * 100 / total ))%"</span>

<span class="comment"># 4. 在文件中插入搜索结果作为标记</span>
sed -i <span class="string">"1i\# 最后搜索时间: $(date)"</span> results.txt

<span class="comment"># 5. 递归搜索但跳过超大文件</span>
find . -type f -size -10M | xargs grep <span class="string">"pattern"</span>

<span class="comment"># 6. 使用进程替换比较两个文件的不同匹配</span>
comm -3 <(grep -oE <span class="string">"[0-9]+"</span> file1.txt | sort -u) <(grep -oE <span class="string">"[0-9]+"</span> file2.txt | sort -u)

<span class="comment"># 7. 搜索并执行操作（找到匹配文件后备份）</span>
grep -rlZ <span class="string">"config_v1"</span> . | xargs -0 -I {} cp {} {}.bak

<span class="comment"># 8. 关键字频率统计（检查日志中最常见的错误类型）</span>
grep -oE <span class="string">"ERR_[A-Z_]+"</span> log.txt | sort | uniq -c | sort -rn</div>

            <div class="key-point">
                <strong>终极性能策略：</strong>结合所有优化手段
                <div class="code-block" style="margin:10px 0 0;font-size:.85em;"><span class="comment"># 大规模搜索的终极优化方案</span>
LC_ALL=C grep -rF \
    --include=<span class="string">"*.{c,cpp,h,hpp}"</span> \
    --exclude-dir={.git,node_modules,build,dist,vendor,.svn} \
    -m <span class="number">10</span> \
    <span class="string">"TODO"</span> \
    /path/to/project/
<span class="comment"># 解释：C locale + 固定字符串 + 文件类型过滤 + 排除目录 + 限制匹配数</span></div>
            </div>

            <h3>9.5 在 Shell 脚本中集成 grep</h3>
            <div class="code-block"><span class="comment">#!/usr/bin/env bash</span>
<span class="comment"># 实用监控脚本：检查日志中最近是否有错误</span>
set -euo pipefail

LOG_FILE=<span class="string">"/var/log/app/error.log"</span>
ALERT_EMAIL=<span class="string">"admin@example.com"</span>

<span class="comment"># 检查最近 5 分钟内是否有新的 ERROR</span>
recent_errors=$(grep -c <span class="string">"$(date -d '-5 min' '+%Y-%m-%d %H:%M')"</span> <span class="string">"$LOG_FILE"</span> 2>/dev/null || true)

<span class="keyword">if</span> [ <span class="string">"$recent_errors"</span> -gt <span class="number">0</span> ]; <span class="keyword">then</span>
    <span class="builtin">echo</span> <span class="string">"最近 5 分钟发现 $recent_errors 个错误，发送告警..."</span>
    grep <span class="string">"$(date -d '-5 min' '+%Y-%m-%d %H:%M')"</span> <span class="string">"$LOG_FILE"</span> \
        | mail -s <span class="string">"应用错误告警"</span> <span class="string">"$ALERT_EMAIL"</span>
<span class="keyword">else</span>
    <span class="builtin">echo</span> <span class="string">"系统正常"</span>
<span class="keyword">fi</span></div>

            <div class="code-block"><span class="comment">#!/usr/bin/env bash</span>
<span class="comment"># 批量替换代码中特定模式的文件</span>
set -euo pipefail

<span class="comment"># 找到所有包含旧 API 调用的文件</span>
files=$(grep -rl <span class="string">"old_api_call("</span> --include=<span class="string">"*.py"</span> src/)
<span class="keyword">if</span> [ -n <span class="string">"$files"</span> ]; <span class="keyword">then</span>
    <span class="builtin">echo</span> <span class="string">"需要更新的文件:"</span>
    <span class="builtin">echo</span> <span class="string">"$files"</span>
    <span class="builtin">echo</span> <span class="string">"$files"</span> | while IFS= read -r f; <span class="keyword">do</span>
        sed -i <span class="string">'s/old_api_call(/new_api_call(/g'</span> <span class="string">"$f"</span>
        <span class="builtin">echo</span> <span class="string">"已更新: $f"</span>
    <span class="keyword">done</span>
<span class="keyword">else</span>
    <span class="builtin">echo</span> <span class="string">"没有文件需要更新"</span>
<span class="keyword">fi</span></div>
        </div>

        <!-- ==================== 第十章 ==================== -->
        <div class="section" id="ch10">
            <h2>十、与 Claude Code 结合使用</h2>

            <h3>10.1 Claude Code 中 grep 的使用场景</h3>
            <p>Claude Code 作为一个命令行 AI 编程助手，grep 是其最常用的文本搜索工具之一。在日常交互中，Claude Code 通过内部 Grep 工具或 Bash 调用 grep 来完成各种任务。</p>
            <table>
                <tr><th>场景</th><th>Claude Code 命令</th><th>实际执行的 grep 命令</th></tr>
                <tr><td>搜索函数定义</td><td>搜索包含特定模式的文件</td><td><code>grep -rn "def function_name" --include="*.py" .</code></td></tr>
                <tr><td>查找 TODO 注释</td><td>项目中有哪些 TODO</td><td><code>grep -rn "TODO\|FIXME\|HACK" --exclude-dir=node_modules .</code></td></tr>
                <tr><td>代码引用分析</td><td>这个函数在哪里被调用</td><td><code>grep -rn "someFunction(" --include="*.{js,ts}" src/</code></td></tr>
                <tr><td>日志分析</td><td>最近的错误有哪些</td><td><code>grep -i "error\|exception\|fail" /var/log/app.log</code></td></tr>
                <tr><td>配置检查</td><td>检查配置项</td><td><code>grep -v "^\s*#\|^\s*$" config.conf</code></td></tr>
                <tr><td>版本号提取</td><td>当前版本号</td><td><code>grep -oP '"version":\s*"\K[^"]+' package.json</code></td></tr>
            </table>

            <h3>10.2 高效搜索提示</h3>
            <p>以下是一些在 Claude Code 中使用 grep 进行高效搜索的提示模板：</p>
            <div class="code-block"><span class="comment"># 场景 1：搜索特定函数的所有定义和调用</span>
<span class="comment"># 提示词：搜索项目中所有使用了 "calculateTotal" 的地方</span>
grep -rn <span class="string">"calculateTotal"</span> --include=<span class="string">"*.{js,ts,jsx,tsx}"</span> src/

<span class="comment"># 场景 2：查找配置项的真实来源</span>
<span class="comment"># 提示词：找出 "api_base_url" 在哪里被定义和覆盖</span>
grep -rn <span class="string">"api_base_url"</span> --include=<span class="string">"*.{json,yaml,yml,env,conf}"</span> .

<span class="comment"># 场景 3：测试覆盖率分析</span>
<span class="comment"># 提示词：找出哪些组件还没有对应的测试文件</span>
for f <span class="keyword">in</span> src/components/*.tsx; <span class="keyword">do</span>
    base=$(basename <span class="string">"$f"</span> .tsx)
    <span class="keyword">if</span> ! ls tests/*<span class="string">"$base"</span>* >/dev/null <span class="number">2</span>>&<span class="number">1</span>; <span class="keyword">then</span>
        <span class="builtin">echo</span> <span class="string">"缺少测试: $base"</span>
    <span class="keyword">fi</span>
<span class="keyword">done</span>

<span class="comment"># 场景 4：查找被废弃的 API</span>
<span class="comment"># 提示词：项目中是否还在使用旧的 API 端点</span>
grep -rn <span class="string">"/api/v1/"</span> --include=<span class="string">"*.{js,ts,py,java}"</span> .

<span class="comment"># 场景 5：检查硬编码值</span>
<span class="comment"># 提示词：找出代码中硬编码的数据库连接字符串</span>
grep -rnE <span class="string">"(localhost|127\.0\.0\.1).*(3306|5432|27017)"</span> --include=<span class="string">"*.{py,js,ts,java,go}"</span> .</div>

            <h3>10.3 在 Claude Code 工作流中使用 grep</h3>
            <div class="code-block"><span class="comment"># 1. 理解项目结构的起点</span>
<span class="comment"># 先了解项目有哪些主要文件和目录</span>
ls -la
grep -rn <span class="string">"import\|require\|from"</span> --include=<span class="string">"*.{js,ts,py}"</span> . | head -30

<span class="comment"># 2. 代码重构前的分析</span>
<span class="comment"># 确认函数的所有调用位置</span>
grep -rn <span class="string">"deprecatedFunction("</span> --include=<span class="string">"*.{js,ts}"</span> .
grep -rn <span class="string">"deprecatedFunction("</span> --include=<span class="string">"*.test.{js,ts}"</span> .

<span class="comment"># 3. 验证修改是否完全</span>
<span class="comment"># 在重构后确认所有旧引用都已更新</span>
grep -rn <span class="string">"oldClassName"</span> --include=<span class="string">"*.{js,ts,jsx,tsx}"</span> .
<span class="comment"># 如果输出为空，说明重构完成</span>

<span class="comment"># 4. 合并冲突解决帮助</span>
grep -rn <span class="string">"<<<<<<< HEAD\|=======\|>>>>>>>"</span> . --include=<span class="string">"*.{js,ts,py,java}"</span>
<span class="comment"># 查找所有未解决的合并冲突</span>

<span class="comment"># 5. 安全检查</span>
grep -rn <span class="string">"password\s*=\s*['\"][^'\"]+['\"]"</span> --include=<span class="string">"*.{py,js,ts,yml,yaml,json}"</span> .
<span class="comment"># 查找可能的硬编码密码</span>

<span class="comment"># 6. 导入语句规范化检查</span>
grep -rn <span class="string">"from.*import.*(\*|all)"</span> --include=<span class="string">"*.py"</span> .
<span class="comment"># 查找通配符导入（不良实践）</span></div>

            <div class="tip-box">
                <h4>与 Claude Code 交互的最佳实践</h4>
                <ul>
                    <li><strong>具体化搜索模式：</strong>提供尽可能精确的模式以减少无关结果</li>
                    <li><strong>指定文件类型：</strong>使用 <code>--include</code> 限定搜索范围</li>
                    <li><strong>排除生成目录：</strong>始终排除 <code>node_modules</code>、<code>dist</code>、<code>build</code> 等</li>
                    <li><strong>组合上下文查看：</strong>使用 <code>-A</code>/<code>-B</code>/<code>-C</code> 查看匹配周围代码</li>
                    <li><strong>善用 -l：</strong>先找到涉及的文件，再深入查看具体内容</li>
                </ul>
            </div>

            <h3>10.4 Grep 工具与 Bash grep 的协同</h3>
            <p>Claude Code 内置的 Grep 工具和通过 Bash 运行的 grep 命令各有优势：</p>
            <table>
                <tr><th>特性</th><th>Claude Code Grep 工具</th><th>Bash grep</th></tr>
                <tr><td>语法</td><td>自然语言描述</td><td>精确的 Shell 命令</td></tr>
                <tr><td>灵活性</td><td>按文件类型/模式搜索</td><td>完整的 grep 选项支持</td></tr>
                <tr><td>正则支持</td><td>正则表达式</td><td>BRE/ERE/PCRE 全部支持</td></tr>
                <tr><td>复杂管道</td><td>有限</td><td>完全支持（awk, sort, uniq 等）</td></tr>
                <tr><td>上下文控制</td><td>基础</td><td>完整的 -A/-B/-C 支持</td></tr>
                <tr><td>性能优化</td><td>自动处理</td><td>手动控制（LC_ALL, -F, 并行等）</td></tr>
            </table>

            <div class="concept">
                <h4>最佳策略</h4>
                <p><strong>简单搜索</strong>（如查找某个函数名）使用 Claude Code 内置的 Grep 工具，通过自然语言描述即可。<strong>复杂搜索</strong>（如需要正则、输出处理、性能优化）使用 Bash 工具直接执行 grep 命令，可以获得更大灵活性和精确控制。</p>
            </div>
        </div>

        <!-- ==================== 第十一章 ==================== -->
        <div class="section" id="ch11">
            <h2>十一、常见问题与排错</h2>

            <h3>11.1 常见错误及解决方法</h3>
            <table>
                <tr><th>问题</th><th>现象</th><th>原因</th><th>解决方法</th></tr>
                <tr><td>正则不匹配</td><td>明明文件中包含模式却搜索不到</td><td>特殊字符未转义或使用了错误的模式</td><td>使用 <code>-E</code> 扩展正则，或 <code>-F</code> 固定字符串测试</td></tr>
                <tr><td>搜索速度极慢</td><td>搜索大型文件耗时很长</td><td>区域设置导致性能下降，或模式写成了灾难性回溯</td><td>设置 <code>LC_ALL=C</code>；简化正则避免回溯</td></tr>
                <tr><td>意外匹配</td><td>匹配到了不期望的内容</td><td>未使用 <code>-w</code> 单词边界，或正则写得太宽泛</td><td>添加 <code>-w</code>；使用更精确的模式</td></tr>
                <tr><td>文件名包含空格</td><td>xargs 报错或文件名被截断</td><td>文件名中的空格被当作分隔符</td><td>使用 <code>-print0</code> + <code>xargs -0</code></td></tr>
                <tr><td>二进制文件干扰</td><td>输出 "Binary file matches"</td><td>grep 默认跳过二进制文件</td><td>使用 <code>-I</code> 忽略，或 <code>-a</code> 强制搜索</td></tr>
                <tr><td>.gitignore 文件被搜索</td><td>搜索了不需要的目录</td><td>grep 不能识别 .gitignore</td><td>使用 <code>git grep</code> 或 <code>--exclude-dir</code></td></tr>
                <tr><td>记忆模式不正确</td><td>捕获组未能正确工作</td><td>在 BRE 模式下未转义 <code>()</code></td><td>使用 <code>-E</code> 启用 ERE</td></tr>
                <tr><td>跨行搜索失败</td><td>无法匹配跨行的模式</td><td>grep 默认按行匹配</td><td>使用 <code>pcregrep -M</code> 或 <code>grep -Pz</code></td></tr>
            </table>

            <h3>11.2 正则表达式排错</h3>
            <div class="code-block"><span class="comment"># 步骤 1：用固定字符串确认内容存在</span>
grep -F <span class="string">"exact_string"</span> file.txt
<span class="comment"># 如果 -F 能找到但正则找不到，说明正则表达式写错了</span>

<span class="comment"># 步骤 2：使用 -o 查看实际匹配的内容</span>
grep -oE <span class="string">"部分.+模式"</span> file.txt
<span class="comment"># 通过只输出匹配部分来调试</span>

<span class="comment"># 步骤 3：逐步简化正则</span>
grep -E <span class="string">"pattern"</span> file.txt     <span class="comment"># 完整模式</span>
grep -E <span class="string">"pat"</span> file.txt         <span class="comment"># 简化到最小可匹配单位</span>
grep -E <span class="string">"p.*n"</span> file.txt       <span class="comment"># 逐步增加复杂度</span>

<span class="comment"># 步骤 4：检查特殊字符是否需要转义</span>
<span class="comment"># 在 ERE 中，以下字符是元字符：. * + ? { } ( ) [ ] ^ $ | \</span>
<span class="comment"># 如果想搜索这些字面字符，需要转义</span>
grep -F <span class="string">"file[1].txt"</span> manifest   <span class="comment"># 简单方法：使用 -F</span>
grep -E <span class="string">"file\[1\]\.txt"</span> manifest <span class="comment"># 正则方法：转义</span>

<span class="comment"># 步骤 5：使用 -P 测试是否 PCRE 支持的问题</span>
grep -P <span class="string">"\d{3}-\d{4}"</span> file.txt   <span class="comment"># 如果 -P 能匹配但 -E 不能</span>
grep -E <span class="string">"[0-9]{3}-[0-9]{4}"</span> file.txt  <span class="comment"># 检查 ERE 语法</span></div>

            <h3>11.3 灾难性回溯</h3>
            <p>某些正则表达式模式会导致灾难性回溯（Catastrophic Backtracking），使 grep 性能急剧下降：</p>
            <div class="code-block"><span class="comment"># 危险模式示例（避免使用）</span>
<span class="comment"># 问题模式：嵌套的量词</span>
grep -E <span class="string">"(a+)+b"</span> file.txt       <span class="comment"># 嵌套 +，灾难性回溯</span>
grep -E <span class="string">"(.+)*"</span> file.txt         <span class="comment"># .+ 外嵌套 *，灾难性回溯</span>
grep -E <span class="string">"(a|aa)+b"</span> file.txt      <span class="comment"># 分支 + 量词嵌套</span>
grep -E <span class="string">"a*b*c*d*e*f*"</span> file.txt   <span class="comment"># 过多可选量词相邻</span>

<span class="comment"># 安全替代方案</span>
grep -E <span class="string">"a+b"</span> file.txt             <span class="comment"># 去掉不必要的嵌套</span>
grep -E <span class="string">"a{1,}b"</span> file.txt           <span class="comment"># 使用 {1,} 替代 +</span>
grep -F <span class="string">"specific_string"</span> file.txt  <span class="comment"># 不需要正则时用固定字符串</span></div>

            <h3>11.4 跨平台兼容性问题</h3>
            <div class="code-block"><span class="comment"># macOS 与 Linux grep 的差异处理</span>

<span class="comment"># macOS 默认是 BSD grep，部分选项不同</span>
<span class="comment"># 1. -r 的行为</span>
grep -r <span class="string">"pattern"</span> .    <span class="comment"># Linux: 递归搜索; macOS: 同 -r</span>

<span class="comment"># 2. -P 的可用性</span>
<span class="comment"># Linux GNU grep: 支持 -P</span>
<span class="comment"># macOS BSD grep: 不支持 -P</span>
<span class="comment"># 解决方案：在 macOS 上 brew install grep 安装 GNU grep</span>

<span class="comment"># 3. -o 的行为差异</span>
<span class="comment"># 当使用 -o 时，某些老版本对每个匹配输出一行</span>
<span class="comment"># 现代版本在当前行上输出所有匹配</span>

<span class="comment"># 4. 字符范围</span>
<span class="comment"># Linux: [a-z] 受区域设置影响</span>
<span class="comment"># 推荐始终使用 POSIX 字符类</span>
grep -E <span class="string">"[[:lower:]]"</span> file.txt  <span class="comment"># 跨平台安全</span></div>

            <div class="key-point">
                <strong>跨平台兼容性清单：</strong>
                <ul>
                    <li>使用 <code>-E</code> 而非 <code>egrep</code>（egrep 已废弃）</li>
                    <li>使用 <code>-F</code> 而非 <code>fgrep</code>（fgrep 已废弃）</li>
                    <li>使用 POSIX 字符类代替 <code>\d</code>、<code>\w</code> 等简写</li>
                    <li>macOS 上通过 Homebrew 安装 GNU grep 获得一致体验</li>
                    <li>在脚本中通过 <code>uname</code> 检测操作系统，差异化处理</li>
                </ul>
            </div>
        </div>

        <!-- ==================== 第十二章 ==================== -->
        <div class="section" id="ch12">
            <h2>十二、核心总结</h2>

            <div class="takeaway">
                <h3>grep 学习路线图</h3>
                <p>掌握 grep 是一个从基础到高级的渐进过程：</p>
                <div class="flow-chart">
                    <span class="step">基本搜索</span>
                    <span class="arrow">→</span>
                    <span class="step alt">常用选项</span>
                    <span class="arrow">→</span>
                    <span class="step test">正则表达式</span>
                    <span class="arrow">→</span>
                    <span class="step">递归搜索</span>
                    <span class="arrow">→</span>
                    <span class="step alt">上下文控制</span>
                    <span class="arrow">→</span>
                    <span class="step test">输出格式化</span>
                    <span class="arrow">→</span>
                    <span class="step loop">脚本集成</span>
                    <span class="arrow">→</span>
                    <span class="step">性能优化</span>
                </div>
            </div>

            <h3>12.1 grep 速查表</h3>
            <table>
                <tr><th>场景</th><th>命令</th><th>说明</th></tr>
                <tr><td>基本搜索</td><td><code>grep "pattern" file</code></td><td>在文件中搜索模式</td></tr>
                <tr><td>忽略大小写</td><td><code>grep -i "pattern" file</code></td><td>不区分大小写搜索</td></tr>
                <tr><td>反向匹配</td><td><code>grep -v "pattern" file</code></td><td>显示不匹配的行</td></tr>
                <tr><td>显示行号</td><td><code>grep -n "pattern" file</code></td><td>同时输出行号</td></tr>
                <tr><td>递归搜索</td><td><code>grep -r "pattern" .</code></td><td>递归搜索当前目录</td></tr>
                <tr><td>只输出匹配部分</td><td><code>grep -o "pattern" file</code></td><td>只输出匹配的文本</td></tr>
                <tr><td>只显示文件名</td><td><code>grep -l "pattern" *.txt</code></td><td>只输出包含匹配的文件名</td></tr>
                <tr><td>统计匹配数</td><td><code>grep -c "pattern" file</code></td><td>输出匹配行数</td></tr>
                <tr><td>上下文显示</td><td><code>grep -C 3 "pattern" file</code></td><td>前后各3行</td></tr>
                <tr><td>固定字符串</td><td><code>grep -F "pattern" file</code></td><td>不解释正则元字符</td></tr>
                <tr><td>扩展正则</td><td><code>grep -E "pattern" file</code></td><td>使用扩展正则表达式</td></tr>
                <tr><td>限制匹配数</td><td><code>grep -m 5 "pattern" file</code></td><td>最多输出5个匹配</td></tr>
                <tr><td>静默模式</td><td><code>grep -q "pattern" file</code></td><td>只检查退出码</td></tr>
                <tr><td>文件过滤</td><td><code>grep -r --include="*.py" pattern .</code></td><td>只搜索 Python 文件</td></tr>
                <tr><td>排除目录</td><td><code>grep -r --exclude-dir=.git pattern .</code></td><td>排除 .git 目录</td></tr>
            </table>

            <h3>12.2 黄金三原则</h3>

            <div class="key-point">
                <strong>原则一：精确优先，性能至上</strong>
                <p>搜索前先明确要匹配的是什么：需要正则吗？可以固定字符串吗？需要什么文件类型？明确的搜索意图 = 更精确的结果 + 更快的速度。尽可能使用 <code>--include</code>、<code>--exclude-dir</code>、<code>-F</code> 缩小范围。</p>
            </div>

            <div class="key-point">
                <strong>原则二：组合是力量之源</strong>
                <p>grep 单独使用时只是一个搜索工具，与 find、xargs、awk、sed、sort、uniq 等工具组合时，才真正释放全部潜力。单 grep 不够时，想想能用管道加什么：<code>grep pattern | sort | uniq -c | sort -rn</code> 这行组合能完成最复杂的文本分析任务。</p>
            </div>

            <div class="key-point">
                <strong>原则三：调试正则从简到繁</strong>
                <p>当正则表达式不匹配时，不要立即怀疑输入数据。先用 <code>grep -F</code> 确认目标字符串存在，然后从最简单的模式开始一步步增加复杂度。使用 <code>-o</code> 查看实际匹配的内容，用排除法找出问题所在。</p>
            </div>

            <h3>12.3 五条必知使用模式</h3>
            <div class="code-block"><span class="comment"># 模式 1：日志分析 -- 找出错误最多的模块</span>
grep -oE <span class="string">"\[([A-Z]+)\]"</span> app.log | sort | uniq -c | sort -rn

<span class="comment"># 模式 2：代码审计 -- 查找所有硬编码配置</span>
grep -rnE <span class="string">"(password|secret|api_key|token)\s*[:=]\s*['\"][^'\"]+['\"]</span><span class="string">" --include="*.{py,js,ts,yaml,json}" .

</span><span class="comment"># 模式 3：文件批量操作 -- 找到所有有 TODO 的文件并统计</span>
grep -rl <span class="string">"TODO"</span> --include=<span class="string">"*.py"</span> . | tee todo_files.txt | wc -l

<span class="comment"># 模式 4：时间范围日志提取 -- 结合 awk</span>
awk <span class="string">'$0 >= "10:00:00" && $0 <= "11:00:00"'</span> app.log | grep -E <span class="string">"ERROR|FATAL"</span>

<span class="comment"># 模式 5：大文件高效搜索 -- 先分段再搜索</span>
<span class="comment"># 用 split 将大文件分块，并行搜索</span>
split -l 100000 large.log chunk_ && ls chunk_* | xargs -P 4 grep -l <span class="string">"ERROR"</span></div>

            <h3>12.4 推荐资源</h3>
            <table>
                <tr><th>资源</th><th>类型</th><th>说明</th></tr>
                <tr><td><code>man grep</code></td><td>手册</td><td>grep 的官方文档，最权威的参考</td></tr>
                <tr><td><code>info grep</code></td><td>手册</td><td>更详细的 GNU grep 文档</td></tr>
                <tr><td><a href="https://www.gnu.org/software/grep/manual/" target="_blank">GNU grep 在线手册</a></td><td>网站</td><td>GNU grep 完整在线文档</td></tr>
                <tr><td><a href="https://regex101.com/" target="_blank">regex101.com</a></td><td>工具</td><td>在线正则表达式测试（支持 PCRE）</td></tr>
                <tr><td><a href="https://www.regular-expressions.info/" target="_blank">Regular-Expressions.info</a></td><td>网站</td><td>正则表达式权威教程</td></tr>
                <tr><td><a href="https://github.com/BurntSushi/ripgrep" target="_blank">ripgrep (rg)</a></td><td>工具</td><td>grep 的 Rust 实现，速度极快</td></tr>
                <tr><td><a href="https://www.shellcheck.net/" target="_blank">ShellCheck</a></td><td>工具</td><td>Shell 脚本静态分析，包括 grep 用法检查</td></tr>
            </table>

            <div class="takeaway">
                <h3>最终寄语</h3>
                <p>grep 是 Unix 工具箱中最基础也最强大的工具之一。它简洁、专注、高效，是每一位开发者都应该掌握的命令行利器。花时间学习和熟练掌握 grep，会在日常开发中为你节省大量时间。</p>
                <p style="margin-top:10px;color:#7f8c8d;font-style:italic;">grep 不仅是搜索工具，更是一种思维方式 -- 从海量信息中精确提取所需内容的艺术。掌握 grep，你就掌握了数据海洋中的指南针。</p>
            </div>

            <p style="text-align:center;margin-top:20px;color:#7f8c8d;">10005</p>
        </div>

        <footer>
            <p>本笔记根据 GNU grep 官方文档及实际使用经验整理总结</p>
            <p><strong>本学习笔记为本人学习资料，不得转载</strong></p>
            <p><strong>免责声明：</strong>本学习笔记只供学习使用，具体操作请以官方文档为准。本文中涉及的命令请在实际环境中谨慎使用，特别是包含 <code>rm</code>、<code>sed -i</code> 等可能修改数据的操作时，请先确认命令的预期效果。</p>
        </footer>
    </div>

    <script>
        document.addEventListener('DOMContentLoaded', function () {
            const quotes = document.querySelectorAll('.quote');
            quotes.forEach(quote => {
                quote.style.cursor = 'pointer';
                quote.title = '点击复制内容';
                quote.addEventListener('click', function () {
                    const text = this.querySelector('p').innerText;
                    navigator.clipboard.writeText(text).then(() => {
                        const original = this.innerHTML;
                        this.innerHTML = '<p>✓ 已复制到剪贴板</p>';
                        setTimeout(() => {
                            this.innerHTML = original;
                        }, 1500);
                    });
                });
            });

            const boxes = document.querySelectorAll('.key-point, .tip-box, .concept');
            boxes.forEach(box => {
                box.style.transition = 'transform 0.2s, box-shadow 0.2s';
                box.addEventListener('mouseenter', function () {
                    this.style.transform = 'translateY(-2px)';
                    this.style.boxShadow = '0 5px 15px rgba(0,0,0,0.1)';
                });
                box.addEventListener('mouseleave', function () {
                    this.style.transform = 'translateY(0)';
                    this.style.boxShadow = 'none';
                });
            });
        });
    </script>
    <script src="/js/baidu.js"></script>
</body>
</html>