Pandas中使用read_excel()函数读取Excel文件

2023-02-23 00:00:00 pandas read

在Pandas中,可以使用read_excel()函数读取Excel文件,并将其转换为DataFrame对象。以下是一些常见的参数:

io: 指定要读取的Excel文件名或文件路径。
sheet_name: 指定要读取的工作表名称或索引号。默认是读取第一个工作表。
header: 指定作为列名的行号,默认为0,表示第一行作为列名。
index_col: 指定作为行索引的列名或列号,默认为None,表示使用默认的行号索引。
usecols: 指定要读取的列,可以是列名列表或列号列表。默认是读取所有列。
dtype: 指定每列的数据类型,可以是字典或者类型名。默认是自动推断每列的数据类型。
na_values: 指定NaN值的表示方式,可以是字符串列表或字典。默认是NaN、NA、#N/A、#N/A N/A等。
skiprows: 指定要跳过的行数,可以是整数或行号列表。默认为0,表示不跳过任何行。
nrows: 指定要读取的行数。默认为None,表示读取所有行。
skipfooter: 指定要跳过的末尾行数。默认为0,表示不跳过任何行。
engine: 指定使用的解析引擎,可以是'openpyxl'、'xlrd'、'xlsxwriter'或者'pyxlsb'。默认是'openpyxl',表示使用Openpyxl解析引擎。
以下是一个示例代码:

import pandas as pd

# 读取Excel文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0, index_col=None, usecols=None)

# 打印DataFrame对象
print(df)

在这个示例中,我们使用read_excel()函数读取了一个名为"data.xlsx"的Excel文件,指定要读取的工作表名称、列名行、不使用行索引和默认的列。最后,打印读取到的DataFrame对象。

相关文章