Python 利用pandas处理CSV文件（DataFrame的基础用法）

59 阅读 0 评论 0 点赞

Python 是数据科学和数据分析领域中非常受欢迎的编程语言，其中 Pandas 是一个强大的数据处理库。本文将介绍使用 Pandas 处理 CSV 文件的基本用法，包括如何读取、修改和保存数据，以帮助您在数据分析中更高效地使用 Pandas。

什么是 Pandas？

Pandas 是一个用于数据操作和分析的开源库，提供了数据结构和操作工具。它的核心数据结构是 DataFrame，类似于 Excel 表格或数据库表格，能够方便地存储和处理表格数据。

首先，安装 Pandas

如果还没有安装 Pandas，可以使用 pip 进行安装：

pip install pandas

读取 CSV 文件

使用 Pandas 读取 CSV 文件非常简单，通常使用 read_csv() 函数。假设我们有一个名为 data.csv 的文件，内容如下：

Name,Age,Gender
Alice,30,F
Bob,25,M
Charlie,35,M

我们可以使用以下代码读取该文件：

import pandas as pd

# 读取 CSV 文件
df = pd.read_csv('data.csv')

# 输出数据框内容
print(df)

输出结果将是：

      Name  Age Gender
0    Alice   30      F
1      Bob   25      M
2  Charlie   35      M

基本操作

选择列

可以通过列名选择特定列：

# 选择 Name 列
names = df['Name']
print(names)

选择行

可以使用行索引进行选择。例如，选择第一行：

# 选择第一行
first_row = df.iloc[0]
print(first_row)

过滤数据

可以根据条件过滤数据。例如，选择年龄大于30的人：

# 过滤年龄大于30的行
filtered_df = df[df['Age'] > 30]
print(filtered_df)

添加新列

可以轻松地添加新列。例如，添加一列 Age after 5 years：

df['Age after 5 years'] = df['Age'] + 5
print(df)

修改现有列

可以直接对现有列进行修改。例如，将年龄加1：

df['Age'] = df['Age'] + 1
print(df)

删除列或行

可以使用 drop() 方法删除某一列或行。例如，删除 Gender 列：

df = df.drop(columns=['Gender'])
print(df)

数据排序

可以对 DataFrame 进行排序，例如按年龄排序：

sorted_df = df.sort_values(by='Age')
print(sorted_df)

保存到 CSV 文件

处理完数据后，您可能需要将结果保存到新的 CSV 文件。可以使用 to_csv() 方法：

df.to_csv('modified_data.csv', index=False)

总结

Pandas 是用于数据操作的强大工具，特别是在处理 CSV 文件时。通过使用 DataFrame，您可以轻松地读取、过滤、修改数据，并将结果保存回 CSV 文件。本文中介绍了 Pandas 的一些基础用法，掌握这些基本操作后，您将能高效地进行数据分析。希望这篇文章对您使用 Pandas 处理 CSV 文件有所帮助！

点赞(0) 打赏

本文分类：后端
本文标签：Pandas python Python pandas 开发语言
浏览次数：59 次浏览
发布日期：2024-09-23 08:36:49
本文链接：http://makehui.com/houduan/730.html

上一篇 > [python]如何正确的安装pytorch?(详细)
下一篇 > Python教程：一文了解Python的深拷贝与浅拷贝