【Python代替Excel】2:数据的读取

2020-06-23 00:00:00 数据 程序 多个 文件 读取

之前写过两篇用Python代替Excel的文章,然后就一直没再写。

想起我刚学Python的时候,也是走过许多弯路的。从Python语法呀、环境呀那些学,学得头大,而且一边学一边忘。经历了几年的工作,也对Python常用的模块和语法有了了解,所以打算写一个系列,手把手教大家用Python处理数据,现学现用。会写得比较详细哈,如果有点基础的人,可能会觉得废话。

适用人群:编程0基础,且想往数据分析发展的。

温馨提示:我不是专业的编程出身,所以编的程序可能在性能方面、消耗内存方面没考虑那么多,但是对于初级入门来说,肯定是妥妥的,而且能解决工作中大部分的数据处理需求哈。

数据的读取

上一篇文章,介绍了如何安装anaconda,如果你是0基础,强烈建议你先花两分钟看一下上一篇文章哦,数据分析与Python:【手把手教你Python数分】1:Python与Anaconda

安装完成之后,你的Python之路就开启了大门。哈哈~

  • 准备工作

童鞋们,作为数据分析师,咱们的个程序,可不是“hello world”哈,而是读取Excel文件。

准备工作:下载示例数据,提取码:tkqn

数据例子

数据介绍:这份数据是在网上下载的亚马逊食品评论数据,为了方便后续学习,我自己添加了一些数据。这份数据没有实际价值,仅供学习~

data表:包括了产品ID、用户ID、时间(我随机生成的)、评分等。

price表:产品ID、价格(随机生成)。

  • 我的个Python程序

下载好数据之后,存放到某个文件夹。

好,打开anaconda中的Spyder!

点击新建,出现新的代码框,可以在里面编写个程序。

咱们今天的目的,是为了用Python读取amazon_data那个文档。

import pandas as pd   #pandas是数据处理模块,import是导入,as pd是命名别名

amazon_data = pd.read_excel(r'D:\data\python\amazon-fine-foods\amazon_data.xlsx',sheetname='data')

相关文章