一、简介
xlrd/xlwt
主要是针对Office 2003或更早版本的XLS文件格式
缺点:不支持XLSX文件格式
OpenPyXL
能读能写能修改
缺点:不支持XLS
Microsoft excel api
强大无极限
缺点:速度慢
二、基本用法
首先介绍下Excel的一些基本概念,Workbook相当于是一个文件,WorkSheet就是文件里面的每个具体的表,比如新建Excel文件里面的“Sheet1”,一个Workbook里面有一个或多个WorkSheet。
2.1操作Workbook对象
获取Workbook对象的方法有两种,一种是创建一个新的,一种是导入一个已经存在的。
2.1.1获取Workbook对象
方法1:创建Workbook
# 导入模块
from openpyxl import Workbook
# 创建一个Workbook
wb = Workbook() // 默认生成一个名为'Sheet'的WorkSheet
方法2:导入Workbook
# 导入模块
from openpyxl import load_workbook
# 导入一个Workbook
wb = load_workbook(filename='test.xlsx')
2.1.2Workbook属性
sheetnames: 返回所有WorkSheet的名字列表,类型为list
worksheets: 返回所有WorkSheet的列表,类型为list
active: 返回当前默认选中的WorkSheet
2.1.3Workbook方法
get_sheet_names(): 同sheetnames
get_active_sheet(): 同active属性
get_sheet_by_name(name): 根据名称获取WorkSheet
remove(worksheet): 删除一个WorkSheet,注意是WorkSheet对象,不是名字
save(filename): 保存到文件,记住有写入操作记得保存。
2.2操作WorkSheet
2.2.1获取WorkSheet对象
# 获取默认打开的(active)的WorkSheet
ws1 = wb.active
# 创建一个WorkSheet
ws2 = wb.create_sheet() # 可传title和index两个参数,不传生成的WorkSheet名在'Sheet'后面递增加数字
# 通过名称获取WorkSheet
ws3=wb['Sheet1']
2.2.2WorkSheet属性
rows: 返回所有有效数据行,有数据时类型为generator,无数据时为tuple
columns: 返回所有有效数据列,类型同rows
max_column: 有效数据最大列
max_row: 有效数据最大行
min_column: 有效数据最小列,起始为1
min_row: 有效数据最大行,起始为1
values: 返回所有单元格的值的列表,类型为tuple
title: WorkSheet的名称
2.2.3WorkSheet方法
cell(coordinate=None, row=None, column=None, value=None): 获取指定单元格或设置单元格的值,具体使用在cell下面介绍
2.3操作Cell
2.3.1获取Cell对象
# 使用WorkSheet的Cell方法
c1 = ws.cell('A1')
c2 = ws.cell(row=1, column=1) # 获取A1单元格
# 通过坐标获取Cell
c3 = ws['A1']
# 获取多个
c3 = ws['A1:E5'] # 返回多行数据,类型为tuple
2.3.2设置Cell的值
# 直接使用WorkSheet的cell方法设置
ws.cell(row=1, column=1, value=10)
# 设置Cell对象value属性
c1 = ws.cell('A1')
c1.value = 100
2.3.3Cell属性
column: 所在列,起始为1
row: 所在行,起始为1
coordinate: 所在坐标,如'A1'
parent: 所属的WorkSheet
value: 单元格的值
2.3.4Cell方法
offset(row=0, column=0): 偏移
三、使用实例
#! /usr/bin/env python3
# -*- coding:utf-8 -*-
# Author : mayi
# Blog : Http://www.cnblogs.com/mayi0312/
# Date : 2019/04/25
# Name : my_excel_model
# Software : PyCharm
# Note : 功能:使用openpyxl模块处理Excel文件
import os
from openpyxl import load_workbook
from openpyxl import Workbook
def getExcelConOpenpyxl(file_name, book_name=None, data_type="list", index=1):
"""
利用openpyxl模块获取Excel表中的内容
:param file_name: Excel表文件名
:param book_name: Sheet表名
:param data_type: 列表中存储每行内容的方式(list或dict),默认为列表
:param index: sheet的序号或者名字,默认处理第一个sheet
:return: Excel表中的内容
"""
# 打开一个xlsx文件
wb = load_workbook(file_name)
# 打开指定的sheet
# sheet = wb.get_sheet_by_name("名单")
# sheet = wb["名单"]
if not book_name:
sheet = wb.active
else:
sheet = wb.get_sheet_by_name(book_name)
# 用于存储Excel表内容的列表
excel_con_list = []
# 获取所有内容
line_list = sheet.rows
# 第一行为表头
field_list = next(line_list)
for line in line_list:
if data_type == "dict":
# 字典
temp_line_dict = {}
for i, cell in enumerate(line):
cell_key = field_list[i].value
cell_value = cell.value
temp_line_dict[cell_key] = cell_value
excel_con_list.append(temp_line_dict)
else:
# 列表
temp_line_list = []
for i, cell in enumerate(line):
cell_key = field_list[i].value
cell_value = cell.value
temp_line_list.append([cell_key, cell_value])
excel_con_list.append(temp_line_list)
# 关闭文档
wb.close()
return excel_con_list
def setExcelConOpenpyxl(file_name, con_list, field_list=None, book_name=None, model=None):
"""
利用openpyxl模块将列表中的内容存储至Excel表中
:param file_name: Excel表文件名
:param con_list: 需要保存的列表信息
:param field_list: 表头内容
:param book_name: Sheet表名称
:param model: 模板文件名(默认没有模板)
:return: None
"""
if model:
# 如果有模板文件,则打开模板工作簿
wb = load_workbook(model)
else:
# 否则,新建一个Excel工作簿
wb = Workbook()
# 激活工作表
sheet = wb.active
if not book_name:
sheet.title = book_name
if field_list:
# 如果有设置表头的话
# 列数
n_col = len(field_list)
for i_col in range(n_col):
sheet.cell(row=1, column=i_col + 1, value=field_list[i_col])
# 行数
n_row = len(con_list)
for i in range(n_row):
# 列数
n_col = len(con_list[i])
for j in range(n_col):
sheet.cell(row=2 + i, column=j + 1, value=con_list[i][j])
if not os.path.exists(os.path.dirname(file_name)):
# 如果文件所在目录不存在,则创建
os.makedirs(os.path.dirname(file_name))
# 文档另存为
wb.save(file_name)
# 关闭文档
wb.close()
# 入口函数
if __name__ == '__main__':
filename = "test.xlsx"
con_list = getExcelConOpenpyxl(filename)
print(con_list)
filename = os.path.abspath("test_w.xlsx")
field_list = ["序号", "姓名", "性别", "年龄"]
con_list = [
[1, "张三", "男", "20"],
[2, "李四", "女", "21"],
[3, "王五", "男", "19"],
[4, "麻六", "女", "24"],
[5, "田七", "男", "23"],
]
setExcelConOpenpyxl(filename, con_list, field_list, book_name="名单")
注意:
·Cell的row和column都是从1开始的
·文件操作完记得调用Workbook的save()方法
·最好记得调用Workbook的close()方法