Python酷库之旅-第三方库openpyxl

在数据分析和处理的过程中,Excel文件往往是我们常见的数据存储格式之一。而在Python中,处理Excel文件的一个非常流行和强大的库便是openpyxl。使用openpyxl,我们可以方便地读取、操作和创建Excel文件,尤其是.xlsx格式的文件。本文将带你了解openpyxl的基本用法,并通过一些示例来展示它的强大功能。

安装openpyxl

首先,你需要确保已经安装了openpyxl库。可以通过以下命令进行安装:

pip install openpyxl

创建Excel文件

下面是一个简单的示例,演示如何使用openpyxl创建一个新的Excel文件,并在其中写入一些数据。

import openpyxl

# 创建一个新的工作簿
wb = openpyxl.Workbook()

# 选择活动的工作表
ws = wb.active
ws.title = '数据表'

# 向单元格写入数据
ws['A1'] = '姓名'
ws['B1'] = '年龄'
ws['C1'] = '城市'

data = [
    ('张三', 25, '北京'),
    ('李四', 30, '上海'),
    ('王五', 28, '广州')
]

for row in data:
    ws.append(row)

# 保存到文件
wb.save('示例.xlsx')

在上面的代码中,我们首先引入了openpyxl库,并创建了一个新的工作簿。接着,我们获取了活动的工作表,并设置了标题。通过直接指定单元格的方式,我们向单元格中写入了表头和数据。最后,我们使用save()方法将工作簿保存为一个名为“示例.xlsx”的文件。

读取Excel文件

如果我们想要读取刚才创建的Excel文件中的数据,可以使用以下代码:

import openpyxl

# 打开已有的Excel文件
wb = openpyxl.load_workbook('示例.xlsx')

# 选择指定的工作表
ws = wb['数据表']

# 读取数据
for row in ws.iter_rows(min_row=2, values_only=True):
    print(row)

在这个示例中,我们使用load_workbook()方法打开了之前创建的Excel文件。然后,选择了“数据表”工作表。通过iter_rows()方法,我们可以遍历指定范围的行,min_row=2表示从第二行开始读取(跳过表头),values_only=True表示只获取单元格的值。执行时,将输出所有人员的信息。

修改Excel文件

除了创建和读取,openpyxl还可以方便地修改已有的Excel文件。例如,我们可以给“张三”的年龄加一岁,并将文件保存:

import openpyxl

# 打开已有的Excel文件
wb = openpyxl.load_workbook('示例.xlsx')
ws = wb['数据表']

# 修改张三的年龄
for row in ws.iter_rows(min_row=2):
    if row[0].value == '张三':
        row[1].value += 1  # 年龄加1

# 保存修改
wb.save('示例_modified.xlsx')

在这段代码中,我们仍然先打开了Excel文件,接着遍历所有的行,查找“张三”并将其年龄加1。最后,通过save()方法保存为一个新的文件“示例_modified.xlsx”。

总结

openpyxl是一个强大的工具,它使得在Python中处理Excel文件变得简单和高效。通过本文的示例,你可以初步掌握创建、读取和修改Excel文件的基本操作。随着对openpyxl越来越深入的了解,你将能够利用这个库实现更复杂的数据分析和处理任务。在数据分析日益重要的今天,掌握这样的工具将极大地提高你的工作效率。

点赞(0) 打赏

微信小程序

微信扫一扫体验

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部