从标签下载所有电子邮件为pdf格式(Gmail)
问题描述
我想从Gmail下载100多封电子邮件作为pdf。通过Gmail中的打印选项手动下载所有这些文件太长了。
此python脚本检索所选标签中的电子邮件。我怎样才能将这封电子邮件转换成pdf。
# source = https://developers.google.com/gmail/api/quickstart/python?authuser=2
from __future__ import print_function
import pickle
import os.path
from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request
SCOPES = ['https://www.googleapis.com/auth/gmail.readonly']
def main():
creds = None
if os.path.exists('token.pickle'):
with open('token.pickle', 'rb') as token:
creds = pickle.load(token)
# If there are no (valid) credentials available, let the user log in.
if not creds or not creds.valid:
if creds and creds.expired and creds.refresh_token:
creds.refresh(Request())
else:
flow = InstalledAppFlow.from_client_secrets_file(
'credentials.json', SCOPES)
creds = flow.run_local_server()
# Save the credentials for the next run
with open('token.pickle', 'wb') as token:
pickle.dump(creds, token)
service = build('gmail', 'v1', credentials=creds)
# Call the Gmail API
response= service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=None, maxResults=None, includeSpamTrash=None).execute()
all_message_in_label = []
if 'messages' in response:
all_message_in_label.extend(response['messages'])
while 'nextPageToken' in response:
page_token = response['nextPageToken']
response = service.users().messages().list(userId="me", labelIds="Label_53", q=None, pageToken=page_token, maxResults=None, includeSpamTrash=None).execute()
all_message_in_label.extend(response['messages'])
if not all_message_in_label:
print('No email LM found.')
else:
# get message from Id listed in all_message_in_label
for emails in all_message_in_label:
message= service.users().messages().get(userId="me", id=emails["id"], format="raw", metadataHeaders=None).execute()
if __name__ == '__main__':
main()
解决方案
我对您的问题做了一些挖掘,找到了一些可能有用的链接:
将您的邮件转换为.eml
格式this链接。
从.eml
转换为.pdf
这些链接:
eml2pdf是一个将eml
文件转换为pdf
文件的python GitHub项目,但我不确定它是否工作。您可以查看它是否正常工作。
eml-to-pdf是GitHub的另一个项目,看似较差,但仍在发挥作用。它是用Java脚本编写的。
并且有pyPdf可用于生成pdf
文件。不过,您可能需要自己转换电子邮件并格式化它们。
有关消息对象格式的详细信息,请参阅Gmail API python文档get方法。
和here是一篇博客文章,它使用不同的方法实现了您想要的功能,但我不能完全确定它是否仍然有效。
我希望它能有所帮助。祝你好运。
相关文章