将 pandas 数据帧从本地机器上传到Google Cloud Bucket

问题描述

我想直接从本地机器上传 pandas 数据框到Google云存储,所以我不在云函数中。我使用write-a-pandas-dataframe-to-google-cloud-storage-or-bigquery尝试了不同的方法。但我无法保存。

注意:我只能使用google.cloud包

下面是我尝试的代码

from google.cloud import storage
import pandas as pd
input_dict = [{'Name': 'A', 'Id': 100}, {'Name': 'B', 'Id': 110}, {'Name': 'C', 'Id': 120}]
df = pd.DataFrame(input_dict)

尝试:1

destination = f'gs://bucket_name/test.csv'
df.to_csv(destination)

尝试:2

storage_client = storage.Client(project='project')
bucket = storage_client.get_bucket('bucket_name')
gs_file = bucket.blob('test.csv')
df.to_csv(gs_file)

我正在显示以下错误

对于选项1:没有这样的文件或目录:‘gs://bucket_name/test.csv’

选项2:‘blob’对象没有‘Close’属性

谢谢,

Raghunath。


解决方案

from google.cloud import storage
import os
from io import StringIO # if going with no saving csv file

# say where your private key to google cloud exists
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'path/to/your-google-cloud-private-key.json'

df = pd.DataFrame([{'Name': 'A', 'Id': 100}, {'Name': 'B', 'Id': 110}])

先将其写入您计算机上的CSV文件,然后上传:

df.to_csv('local_file.csv')
gcs.get_bucket('BUCKET_NAME').blob('FILE_NAME.csv').upload_from_filename('local_file.csv', content_type='text/csv')

如果不想创建临时CSV文件,请使用StringIO:

f = StringIO()
df.to_csv(f)
f.seek(0)
gcs.get_bucket('BUCKET_NAME').blob('FILE_NAME.csv').upload_from_file(f, content_type='text/csv')

相关文章