【Python代替Excel】4:数据的清洗

2020-06-23 00:00:00 数据 合并 格式 空格 去除

准备工作:下载示例数据,提取码:tkqn 数据例子

数据预览

经过了数据读取、数据预览,接下来是要开始清洗数据了。今天涉及的清洗步骤有:格式修改、去除空格、替换、分列、合并。

  • 字符串格式→日期格式

数据的Time列看似日期格式,但实际上是字符串格式。

#导入库
import datetime
import pandas as pd
#读取数据
amazon_data = pd.read_excel(r'D:\data\python\amazon-fine-foods\amazon_data.xlsx',sheetname='data')
price = pd.read_excel(r'D:\data\python\amazon-fine-foods\amazon_data.xlsx',sheetname='price')

#数据清洗

#字符串转日期
amazon_data.loc[:,'日期date'] = amazon_data['Time'].apply(lambda x: datetime.datetime.strptime(x,'%Y/%m/%d %H:%M')) 

相关文章