Python中列出目录中的文件的五种方法小结
1. 引言
文件和目录相关操作是软件工程师必备的基本技能。
我不是说将一个文件复制到windows文件资源管理器上的另一个文件夹中。
我是说使用代码来进行自动化批量处理操作。
今天,我们将深入探讨一个具体问题:
如何根据需要列出特定目录下的所有文件名?
我将介绍5种用python实现的方法。不同的方法适用于不同的使用场景。
2. 使用os.listdir()
使用Python中的os模块下的方法listdir()是一个不错的选择,样例如下:
>>> import os
>>> os.listdir()
上面的代码将打印当前路径下所有文件和目录的名称。
如果我们想基于特定路径来打印结果,只需传递给函数os.listdir() 相应的参数,举例如下:
>>> os.listdir(myPath)
如果我们只想打印所有文件不包含目录,那么我们可以使用os.path.isfile() 来进行相应的过滤,如下:
>>> import os
>>> files = [f for f in os.listdir() if os.path.isfile(f)]
当然,对于目录,同样可以使用函数os.path.isdir() 进行过滤,代码如下:
import os
files = [f for f in os.listdir() if os.path.isdir(f)]
如果我们只需要特定类型的文件怎么办?
完全不用担心。Python为复杂场景提供了更多选择。
3. 使用os.walk()
os模块中还有另一个方法 os.walk() 。顾名思义,它可以一层一层地“遍历”目录树。当我们调用os.walk() 函数时,它将返回一个生成器。此时每次调用next() 方法生成下一个值时,它都会进入到一个layer ,结果是一个包含3个项的元组:(dirpath、dirname、filename) 。
举例,如果要获取第二层中所有文件夹的名称,代码如下所示:
from os import walk
f = []
layer = 1
w = walk("/Users/zhao")
for (dirpath, dirnames, filenames) in w:
if layer == 2:
f.extend(dirnames)
break
layer += 1
4. 在Glob模块中使用正则表达式
有时我们不想获取所有文件的名称,而是希望精确获取特定类型文件的名称。
由于glob模块能够添加用于搜索的正则表达式,因此它将是我们进行此类操作的首选。
>>> import glob
>>> glob.glob("/sys/*.log")
上面的代码将列出以log 结尾的文件名。
5. 使用pathlib
从Python 3.4开始,有一个名为pathlib 的模块也很有用。
借助列表生成式的技巧,我们只需使用一行代码即可生成当前路径的所有文件名:
import pathlib
files = [f for f in pathlib.Path().iterdir() if f.is_file()]
令人奇怪的是,Path() 还附带了glob() 函数。(无需在Python文件顶部显式导入glob模块)
import pathlib
files = [f for f in pathlib.Path().glob("/sys/*.log")]
6. 使用os.scandir()
经典的os.listdir() 函数很直观,但对于包含大量文件的大型目录来说效率并不高。因此,Python 3.5引入了一个新的功能类似的函数os.scandir() 。
是的,有的同学可能已经猜到了。此函数将返回一个生成器,并不是所有名称的列表。在某些情况下,我们并不需要同时获取所有名称,此时会更有效。
>>> a=os.scandir()
>>> next(a)
<DirEntry 'test1.py'>
>>> next(a)
<DirEntry 'test2.py'>
7. 总结
本文重点介绍了在Python中如何列出目录中的文件的五种方法,并针对每种方法给出了相应的代码样例。
到此这篇关于Python中列出目录中的文件的五种方法小结的文章就介绍到这了,更多相关Python 列出目录文件内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
相关文章