【Python代替Excel】3:数据的预览
之前已经讲到anaconda的安装,如何读取Excel数据。
今天要学习读取了Excel数据之后,在Python里如何预览。当然print(amazon_data)可以查看数据,但是如果想知道data的其他信息,可以从下面的方法来看。
- 查看列名:amazon_data.columns
- 查看行数列数:amazon_data.shape
- 查看前5行/后5行数据: amazon_data.head(5)、amazon_data.tail(5)
- 查看每列的数据格式:amazon_data.d*
- 数据的索引:
列的索引:amazon_data['Id']或者amazon_data.loc[:, 'Id'] 数据ID列
行的索引:amazon_data.loc[0, :] 读取第1行(Python的索引从0开始)
某行某列:amazon_data.loc[2, 'Id'] ID列的第3个
- 数据描述:amazon_data.describe()
包含了每一列的个数、均值、方差、小值、大值、分位数。如果查看某一列的,可以加上列的索引:amazon_data['Id'].describe()
- 数据信息:http://amazon_data.info()
包含了每一列的个数、有无空值、数据格式、内存大小
- 语法讲解及延伸
大家要多注意数据的索引这部分,因为后续分析、处理数据,会经常使用到。如果查看某列数据,用amazon_data['Id']是可以的。但是如果要修改这列,好使用amazon_data.loc[:,'Id']这种写法。
当然还有 amazon_data.iloc[ ] ,这是根据物理位置索引。比如第3行第5列,可以写 amazon_data.iloc[ 2, 4 ],注意索引都是从0开始的。
多行多列,可用 amazon_data.iloc[ 2:8, 1:3]
这里涉及到切片,比如 2:8,从2开始,但是到7结束。同样 1:3,从1开始,到2结束。
自己多动手操作一下。
相关文章