Python 文件系统：pathlib 模块的使用

Python 的 os.path 模块虽然经典，但处理路径时字符串拼接的繁琐和跨平台兼容性问题常让人头疼。pathlib 模块采用面向对象的设计，将路径视为对象而非字符串，让代码更简洁、更安全。以下是使用 pathlib 高效管理文件系统的实操指南。

一、创建与解析路径对象

pathlib 的核心是 Path 类，它将路径封装为对象，通过属性和方法直接操作路径，无需手动拼接字符串。

导入模块并创建路径对象。
使用 from pathlib import Path 导入类。创建对象时，使用 / 运算符直接拼接路径，系统会自动处理不同操作系统下的分隔符问题。
```
from pathlib import Path

# 创建当前目录对象
current_dir = Path('.')

# 拼接路径 (自动适配 Windows 的 \ 或 Linux 的 /)
file_path = current_dir / 'subdir' / 'data.txt'
```

获取路径的核心属性。
路径对象提供了 .name、.suffix、.parent 等属性，直接调用即可获取所需信息，无需再写复杂的字符串切片代码。

属性	含义	示例结果
`.name`	文件名（含后缀）	`data.txt`
`.stem`	文件名（不含后缀）	`data`
`.suffix`	文件后缀	`.txt`
`.parent`	父级目录对象	`当前路径/subdir`
`.anchor`	路径的根目录	`/` 或 `C:\`

转换路径格式。
如果需要将路径对象转换为字符串（例如传给不支持 Path 对象的旧函数），调用 str() 函数进行转换。若只需原生路径字符串，使用 .as_posix() 方法输出正斜杠格式。

二、文件与目录的检查与创建

在操作文件前，必须确认其存在性并正确创建层级结构。

检查路径是否存在。
调用 .exists() 方法判断文件或目录是否存在。若需区分文件类型，使用 .is_file() 或 .is_dir()。
创建目录结构。
传统的 os.mkdir 无法自动创建多级缺失目录，而 pathlib 可以轻松解决。调用 .mkdir(parents=True, exist_ok=True) 方法。
- parents=True：自动创建父级目录，类似 Linux 的 mkdir -p。
- exist_ok=True：如果目录已存在，不报错直接跳过。
```
target_path = Path('output') / 'logs' / '2023'

# 安全创建多级目录
target_path.mkdir(parents=True, exist_ok=True)
```

三、文件读写操作

pathlib 最便捷的功能之一是直接在路径对象上调用文件读写方法，无需显式打开和关闭文件句柄。

读取文件内容。
调用 .read_text(encoding='utf-8') 方法一次性读取全部文本内容，系统自动处理文件打开与关闭。
```
file_path = Path('config.json')

# 直接读取文本
content = file_path.read_text(encoding='utf-8')
```
写入文件内容。
调用 .write_text(data, encoding='utf-8') 方法写入数据。这会覆盖原有内容，并自动关闭文件。
```
new_path = Path('notes.txt')

# 直接写入文本
new_path.write_text('这是新写入的内容。', encoding='utf-8')
```

追加文件内容。
若需追加内容，需使用 .open('a') 方法以追加模式打开，再进行写入。

# 以追加模式写入
with new_path.open('a', encoding='utf-8') as f:
    f.write('\n这是追加的一行。')

四、目录遍历与文件筛选

查找特定文件是常见需求，pathlib 提供了强大的生成器方法，节省内存且逻辑清晰。

遍历当前目录下所有内容。
使用 .iterdir() 方法获取目录下的所有文件和子目录对象。
```
for item in Path('.').iterdir():
    print(item.name)
```
递归查找 特定文件。
使用 .rglob(pattern) 方法进行递归查找。参数支持通配符 *。这与 glob 模块功能一致，但返回的是 Path 对象。
- 查找所有 .txt 文件：Path('.').rglob('*.txt')
- 查找所有名为 data 的文件（任意后缀）：Path('.').rglob('data.*')

五、文件移动与删除

pathlib 同样支持文件系统级别的移动、重命名和删除操作。

重命名 或移动文件。
调用 .rename(target) 方法。如果目标路径在其他目录下，则表现为移动；如果在同目录下改名，则表现为重命名。
```
old_path = Path('old_name.txt')
new_path = Path('new_name.txt')

# 重命名文件
old_path.rename(new_path)
```
删除文件或目录。
- 删除文件或空目录：调用 .unlink() (删除文件) 或 .rmdir() (删除空目录)。
- 删除非空目录：pathlib 自身不直接支持递归删除非空目录，需结合 shutil 模块。
```
import shutil

dir_to_delete = Path('temp_folder')

if dir_to_delete.exists():
    # 递归删除非空目录
    shutil.rmtree(dir_to_delete)
```

六、操作流程总结

利用 pathlib 处理文件系统任务的标准流程如下：

graph TD A["创建 Path 对象"] --> B{"检查是否存在?"} B -- "exists()" --> C{"是文件还是目录?"} C -- "is_file()" --> D["读写文件: read_text/write_text"] C -- "is_dir()" --> E["操作目录: mkdir/iterdir"] B -- "not exists" --> F["创建所需目录: mkdir(parents=True)"] F --> E

掌握 pathlib 后，代码中大量冗余的 os.path.join 和 open 语句将被简洁的链式调用取代，显著提升开发效率。

文章目录

一、创建与解析路径对象

二、文件与目录的检查与创建

三、文件读写操作

四、目录遍历与文件筛选

五、文件移动与删除

六、操作流程总结

评论 (0)

文章目录

Python 文件系统：pathlib 模块的使用

一、创建与解析路径对象

二、文件与目录的检查与创建

三、文件读写操作

四、目录遍历与文件筛选

五、文件移动与删除

六、操作流程总结

评论 (0)

扫一扫，手机查看