从标签下载所有电子邮件为pdf格式(Gmail)

2022-04-14 00:00:00 python python-3.x download pdf gmail-api

问题描述

我想从Gmail下载100多封电子邮件作为pdf。通过Gmail中的打印选项手动下载所有这些文件太长了。

此python脚本检索所选标签中的电子邮件。我怎样才能将这封电子邮件转换成pdf。

# source  = https://developers.google.com/gmail/api/quickstart/python?authuser=2

from __future__ import print_function
import pickle
import os.path
from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request



SCOPES = ['https://www.googleapis.com/auth/gmail.readonly']

def main():
    creds = None

    if os.path.exists('token.pickle'):
        with open('token.pickle', 'rb') as token:
            creds = pickle.load(token)
    # If there are no (valid) credentials available, let the user log in.
    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file(
                'credentials.json', SCOPES)
            creds = flow.run_local_server()
        # Save the credentials for the next run
        with open('token.pickle', 'wb') as token:
            pickle.dump(creds, token)

    service = build('gmail', 'v1', credentials=creds)

    # Call the Gmail API 

    response= service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=None, maxResults=None, includeSpamTrash=None).execute()
    all_message_in_label = []
    if 'messages' in response:
        all_message_in_label.extend(response['messages'])

    while 'nextPageToken' in response:
      page_token = response['nextPageToken']
      response = service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=page_token, maxResults=None, includeSpamTrash=None).execute()
      all_message_in_label.extend(response['messages'])


    if not all_message_in_label:
        print('No email LM found.')
    else:
        # get message from Id listed in all_message_in_label
        for emails in all_message_in_label: 
            message= service.users().messages().get(userId="me", id=emails["id"], format="raw", metadataHeaders=None).execute()



if __name__ == '__main__':
    main()

解决方案

我对您的问题做了一些挖掘,找到了一些可能有用的链接:

将您的邮件转换为.eml格式this链接。

.eml转换为.pdf这些链接:

eml2pdf是一个将eml文件转换为pdf文件的python GitHub项目,但我不确定它是否工作。您可以查看它是否正常工作。

eml-to-pdf是GitHub的另一个项目,看似较差,但仍在发挥作用。它是用Java脚本编写的。

并且有pyPdf可用于生成pdf文件。不过,您可能需要自己转换电子邮件并格式化它们。

有关消息对象格式的详细信息,请参阅Gmail API python文档get方法。

和here是一篇博客文章,它使用不同的方法实现了您想要的功能,但我不能完全确定它是否仍然有效。

我希望它能有所帮助。祝你好运。

相关文章