python3压缩和解压文件案例总结

2023-02-15 09:02:25 压缩 案例 解压

Python3压缩和解压文件

1、tar压缩和解压

import tarfile
from pathlib import PurePath
path = PurePath(".") / "test"

zip_path = path / "123.tar.gz"
file_path = path / "123.txt"

# 压缩
# w:gz 写入代表gz压缩,还有其他用法
with tarfile.open(zip_path, "w:gz") as tar:
    tar.add(file_path, arcname=file_path.name)

# 解压
with tarfile.open(zip_path, "r:gz") as tar:
    tar.extractall(path / "1123")

2、7z压缩和解压

import py7zr  # 需要先安装:pip install py7zr
import os
from pathlib import Path

path = Path(".") / "test"
zip_path = path / "123.7z"
file_path = path / "123.txt"

# 压缩
with py7zr.SevenZipFile(zip_path, 'w') as z:
    z.writeall(file_path, arcname=os.path.basename(file_path))

# 解压
with py7zr.SevenZipFile(zip_path, mode='r') as z:
    z.extractall()

3、zip写入压缩和解压

from zipfile import ZipFile
from pathlib import PurePath

path = PurePath(".") / "test"

zip_path = path / "123.zip"
file_path = path / "123.txt"

# 这里的mode, w是写入,r是读取, a是追加
# write写入的是文件的路径
with ZipFile(zip_path, "w") as f:
    f.write(file_path)  # 注意这里写入的文件的路径会和file_path保持一致
    # 建议用下面这一步
    f.write(file_path, arcname=file_path.name)  # file_path.name等同于os.path.basename

# 解压文件
with ZipFile(zip_path, "r") as f:
    print(f.namelist())  # 打印压缩包里的文件
    f.extractall('out_path')  # out_path解压位置

4、gzip写入压缩和解压

import gzip
# 写
filepath = f"file.txt.gz"
content = "Hello World"
with gzip.open(filepath, 'wt') as f:
    f.write(content)

# 读
with gzip.open(filepath, 'rt') as f:
    content_read = f.read()
print(content_read)

扩展:Python3用代码实现压缩与解压

一、说明

压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。

但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。

二、zip文件压缩和解压缩实现

import os
import zipfile


# 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中
def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
    # 压缩文件最后需要close,为了方便我们直接用with
    with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
        # 压缩文件
        for tmp_file in zip_file_list:
            zip_obj.write(tmp_file)
        # 压缩目录
        for tmp_dir in zip_dir_list:
            # zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。
            for root, dirs, files in os.walk(tmp_dir):
                # 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉
                zip_obj.write(root)
                for tmp_file in files:
                    # 拼接文件完整目录,不然只用文件名代码找不到文件
                    tmp_file_path = os.path.join(root, tmp_file)
                    zip_obj.write(tmp_file_path)

# 函数功能是遍历压缩文件中的所有文件
def my_traversal_zip_function(zip_file_name):
    with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
        # 返回结果是一个ZipInfo列表
        # 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo
        all_file_list = zip_obj.infolist()
        for tmp_file in all_file_list:
            print(tmp_file.filename)
            # 还可以在不解压的情况下直接读取文件的内容
            # 可以通过ZipInfo.is_dir()来区分是文件还是目录
            # if not tmp_file.is_dir():
            #     with zip_obj.open(tmp_file) as zip_fd:
            #         print(zip_fd.read())

# 函数的功能是将压缩文件直接解压
def my_unzip_function(zip_file_name, path="."):
    with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
        zip_obj.extractall(path=path)

if __name__ == "__main__":
    zip_file_name = "test_zip.zip"
    # 自己在测试时要先自行创建好要压缩的文件和目录
    zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
    zip_dir_list = ["test_tar_dir"]
    my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
    my_traversal_zip_function(zip_file_name)
    # my_unzip_function(zip_file_name, path=".")

三、tar文件的压缩与解压缩实现

除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz等格式文件的压缩与解压缩实现。

'''
学习中遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程pdf电子书!
'''
import os
import tarfile


# 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中
def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
    # 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持"r:gz"等扩展形式
    # 压缩文件最后需要close,为了方便我们直接用with
    with tarfile.open(tar_file_name, model) as tar_obj:
        # 压缩文件
        for tmp_file in tar_file_list:
            tar_obj.add(tmp_file)
        # 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压
        for tmp_dir in tar_dir_list:
            tar_obj.add(tmp_dir)


# 函数功能是遍历压缩文件中的所有文件
def my_traversal_tar_function(tar_file_name, model="r"):
    with tarfile.open(tar_file_name, model) as tar_obj:
        # 返回结果是一个TarInfo列表
        all_file_list = tar_obj.getmembers()
        for tmp_file in all_file_list:
            print(tmp_file.name)
            # 还可以在不解压的情况下直接读取文件的内容
            # 可以通过TarInfo.isdir()来区分是文件还是目录
            # if not tmp_file.isdir():
            #     # 相当于zip的open,并不会把文件给解压出来
            #     tar_fd = tar_obj.extractfile(tmp_file)
            #     print(tar_fd.read())

# 函数的功能是将压缩文件直接解压
def my_untar_function(tar_file_name, path=".", model="r"):
    with tarfile.open(tar_file_name, model) as tar_obj:
        tar_obj.extractall(path=path)

if __name__ == "__main__":
    # 自己在测试时要先自行创建好要压缩的文件和目录
    tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
    tar_dir_list = ["test_tar_dir"]
    tar_file_name = "test_tar.tar"
    # 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如"r:gz"
    # 特别的,如果是读取文件,可以使用"r:*"来指示尝试以任意格式读取
    open_model = "w"
    # open_model = "w:gz"
    my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
    open_model = "r"
    # open_model = "r:*"
    my_traversal_tar_function(tar_file_name, model=open_model)
    # open_model = "r:*"
    # my_untar_function(tar_file_name, path=".", model=open_model)

到此这篇关于python3压缩和解压文件案例总结的文章就介绍到这了,更多相关python压缩和解压文件内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

相关文章