python读取word图片

2023-03-12 00:00:00 python 读取 图片

Python可以使用第三方库python-docx来读取Word文档中的图片。

首先,需要安装python-docx库。可以使用pip命令进行安装:

pip install python-docx

接下来,可以使用下面的代码读取Word文档中的图片:

import docx

# 打开Word文档
doc = docx.Document('document.docx')

# 遍历文档中的所有段落
for para in doc.paragraphs:
    # 遍历段落中的所有Run
    for run in para.runs:
        # 判断Run是否包含图片
        if run._element.xml.startswith('<w:drawing'):
            # 获取图片的二进制数据
            image_bytes = run.inline.graphic.graphicData.pic.blip.blob
            # 保存图片
            with open('image.png', 'wb') as f:
                f.write(image_bytes)

上面的代码首先使用docx库打开Word文档,然后遍历文档中的所有段落和Run,判断每个Run是否包含图片。如果Run包含图片,则获取图片的二进制数据,并将其保存为PNG格式的文件。注意,上面的代码只能读取文本中嵌入的图片,如果Word文档中的图片是作为文档的一部分,而不是嵌入在文本中,上述方法就无法读取。

相关文章