【Python代替Excel】3:数据的预览

2020-06-23 00:00:00 索引 数据 专区 查看 行数

之前已经讲到anaconda的安装,如何读取Excel数据。

今天要学习读取了Excel数据之后,在Python里如何预览。当然print(amazon_data)可以查看数据,但是如果想知道data的其他信息,可以从下面的方法来看。

  • 查看列名:amazon_data.columns
  • 查看行数列数:amazon_data.shape
  • 查看前5行/后5行数据: amazon_data.head(5)、amazon_data.tail(5)
前5行数据
后5行数据
  • 查看每列的数据格式:amazon_data.d*
  • 数据的索引

列的索引:amazon_data['Id']或者amazon_data.loc[:, 'Id'] 数据ID列

行的索引:amazon_data.loc[0, :] 读取第1行(Python的索引从0开始)

某行某列:amazon_data.loc[2, 'Id'] ID列的第3个

  • 数据描述:amazon_data.describe()

包含了每一列的个数、均值、方差、小值、大值、分位数。如果查看某一列的,可以加上列的索引:amazon_data['Id'].describe()

  • 数据信息amazon_data.info()

包含了每一列的个数、有无空值、数据格式、内存大小

  • 语法讲解及延伸

大家要多注意数据的索引这部分,因为后续分析、处理数据,会经常使用到。如果查看某列数据,用amazon_data['Id']是可以的。但是如果要修改这列,好使用amazon_data.loc[:,'Id']这种写法。

当然还有 amazon_data.iloc[ ] ,这是根据物理位置索引。比如第3行第5列,可以写 amazon_data.iloc[ 2, 4 ],注意索引都是从0开始的。

多行多列,可用 amazon_data.iloc[ 2:8, 1:3]

这里涉及到切片,比如 2:8,从2开始,但是到7结束。同样 1:3,从1开始,到2结束。

自己多动手操作一下。

相关文章