python程序17:写一个读取文件夹目录下所有文件名的程序

有时候当一个文件夹内的文件过多,导致自己很难分类和提取所有文件的文件名。比如我这个文件:

全都是计算机方面的书籍,总共1637个项目,65G大小。要是手动提取,不知道会到猴年马月。

既然需求想好了,那么我们可以借助python写一段代码实现一个程序,方便自己提取文件名到excel里。

我们可以看出,文件名是有好多,书名号,引号,空格,中文等组成的,如果将这些特殊符号处理会出现报错,那么我的想法是将所有的特殊字符和空格删除掉只保留文件名导出到excel里。

那么首先还是需要pip install pandas,简单介绍一下pandas

pandas 是一个基于 NumPy 的 Python 库,它提供了丰富的数据结构和数据分析工具,使得数据处理变得更加简单和高效。pandas 的两个主要数据结构是 Series 和 DataFrame,它们可以处理各种类型的数据,包括时间序列、表格型数据、混合数据等。同时,pandas 还提供了强大的数据处理和分析功能,包括数据清洗、数据聚合、数据重塑、时间序列分析等。

附上源码:

import os
import re
import pandas as pd

# 指定文件夹路径
folder_path = r'D:\alidownload\books'

# 获取文件夹下所有文件名
file_names = os.listdir(folder_path)

# 删除所有特殊字符和空格,只保留文件名
file_names = [re.sub(r'[^\w\d]+', '', name.split('.')[0]) for name in file_names]

# 创建 Pandas DataFrame
df = pd.DataFrame({"File Name": file_names})

# 将结果导出到 Excel 文件中
df.to_excel("book_names.xlsx", index=False)

测试一下,发现可以实现xlsx生成。打开它看一下:

一共有1638个条目,几行代码解决,准确无误,效率极高,是不是很神奇。感兴趣的同学可以试一下啊。另外需要计算机类书籍的同学,可以私信联系我。

发表回复