Python酷库之旅-第三方库Pandas(068)

67 阅读 0 评论 0 点赞

Python酷库之旅 - 第三方库Pandas

在数据分析和处理的领域，Python凭借其强大的库生态系统脱颖而出。而在众多数据处理库中，Pandas无疑是最为热门和实用的工具之一。Pandas提供了高性能、易于使用的数据结构和数据分析工具，特别适合用于处理表格数据。

一、Pandas简介

Pandas是一个开源的Python数据分析库，它为数据处理提供了两种基本的数据结构：Series和DataFrame。Series是一种类似于一维数组的对象，它可以存储任何数据类型。DataFrame是一个二维的表格结构，类似于电子表格或SQL表，具有行索引和列名。这样的数据结构使得数据的存储、处理和分析变得非常简单。

二、安装Pandas

在使用Pandas之前，需要确保已经安装了该库。可以通过以下命令来安装：

pip install pandas

三、基本用法示例

1. 创建Series和DataFrame

import pandas as pd

# 创建Series
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print("Series:\n", s)

# 创建DataFrame
data_dict = {
    '姓名': ['张三', '李四', '王五'],
    '年龄': [23, 25, 22],
    '城市': ['北京', '上海', '广州']
}
df = pd.DataFrame(data_dict)
print("\nDataFrame:\n", df)

2. 数据读取

Pandas支持多种格式的数据读取，包括CSV、Excel、SQL等。最常用的是CSV格式。使用read_csv函数方便地读取CSV文件：

# 从CSV文件读取数据
df_from_csv = pd.read_csv('data.csv')
print("\n从CSV文件读取的数据:\n", df_from_csv)

3. 数据处理

Pandas提供了丰富的数据处理功能。例如，数据的筛选、排序、合并等。

筛选数据

# 筛选年龄大于23的人
filtered_df = df[df['年龄'] > 23]
print("\n年龄大于23的人:\n", filtered_df)

排序数据

# 按年龄排序
sorted_df = df.sort_values(by='年龄')
print("\n按年龄排序:\n", sorted_df)

合并数据

假设我们有另一个DataFrame，包含一些员工的薪资信息，我们可以使用merge函数来合并这两个DataFrame。

# 创建另外一个DataFrame
salary_data = {
    '姓名': ['张三', '李四', '王五'],
    '薪资': [7000, 8000, 6000]
}
salary_df = pd.DataFrame(salary_data)

# 合并两个DataFrame
merged_df = pd.merge(df, salary_df, on='姓名')
print("\n合并后的DataFrame:\n", merged_df)

4. 数据分析

Pandas还提供了许多内置的统计函数，比如mean、sum、count等，可用于快速分析数据。

# 计算平均年龄
average_age = df['年龄'].mean()
print("\n平均年龄:", average_age)

# 计算不同城市的人员数量
city_counts = df['城市'].value_counts()
print("\n各城市人员数量:\n", city_counts)

四、总结

Pandas凭借其强大的数据处理和分析能力，成为数据科学和分析领域的热门工具。无论是在数据清洗、数据分析，还是在数据可视化的前期准备中，Pandas都展现出其不可或缺的价值。掌握Pandas，可以大大提升我们的数据处理效率，使我们能够更专注于数据分析本身。希望通过本文的介绍，能够激发你深入学习Pandas的兴趣，让我们在数据的海洋中遨游。

点赞(0) 打赏

本文分类：后端
本文标签：标准库及第三方库开发语言 python excel 学习与成长 Myelsa的Python酷库之旅 pandas 人工智能
浏览次数：67 次浏览
发布日期：2024-09-27 10:10:14
本文链接：http://makehui.com/houduan/1828.html

上一篇 > Python 降级
下一篇 > ollama如何保持模型加载在内存（显存）中或立即卸载