Linux中怎么查找、删除重复文件

2023-04-17 01:29:00 删除查找重复

在Linux中查找和删除重复文件是一项非常重要的任务，因为重复文件会消耗磁盘空间，影响系统性能。有几种方法可以在Linux中查找和删除重复文件，下面将介绍一些最常用的方法。

第一种方法是使用find命令。find命令可以查找指定目录中的重复文件，并将文件名称输出到标准输出。例如，要查找/home目录下的重复文件，可以使用以下命令：

find /home -name "*" -type f -exec cksum {} \; | sort | uniq -d

上面的命令将查找/home目录下的所有文件，并使用cksum命令计算文件的校验和，然后将结果排序，最后使用uniq命令查找重复的文件。

第二种方法是使用fdupes命令。fdupes命令是一个用于查找重复文件的实用程序，可以查找指定目录中的重复文件，并将文件名称输出到标准输出。例如，要查找/home目录下的重复文件，可以使用以下命令：

fdupes -r /home

第三种方法是使用rmlint。rmlint是一个用于查找和删除重复文件的实用程序，可以查找指定目录中的重复文件，并将文件名称输出到标准输出。例如，要查找/home目录下的重复文件，可以使用以下命令：

rmlint -d /home

另外，rmlint还可以自动删除重复文件，例如，要自动删除/home目录下的重复文件，可以使用以下命令：

rmlint -d --remove /home

此外，还可以使用Python脚本来查找和删除重复文件。例如，可以使用以下Python脚本来查找/home目录下的重复文件：

#!/usr/bin/env python

import os
import hashlib

# Create a dictionary of files
files = {}

# Traverse the directory
for root, dirs, filenames in os.walk("/home"):
    for filename in filenames:
        # Get the absolute path of the file
        path = os.path.abspath(os.path.join(root, filename))
        # Calculate the MD5 hash of the file
        with open(path, 'rb') as f:
            files[path] = hashlib.md5(f.read()).hexdigest()

# Find duplicate files
duplicates = []
for path, md5 in files.items():
    if md5 in files and files[md5] != path:
        duplicates.append((path, files[md5]))

# Print the duplicate files
for duplicate in duplicates:
    print("Duplicate file: %s and %s" % duplicate)

上面的Python脚本将在/home目录下查找重复文件，并将文件名称输出到标准输出。

总之，在Linux中查找和删除重复文件是一项非常重要的任务，可以使用find命令、fdupes命令、rmlint命令或Python脚本来查找和删除重复文件。

相关文章