初识 Pandas
# 什么是 Pandas
Pandas 是一个开源的,BSD 许可的库,为 Python 编程语言提供高性能,易于使用的数据结构和数据分析工具。
利用 Python 进行数据分析的首选库,它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。
# 和 NumPy 的区别
Pandas 是专门为处理表格和混杂数据设计的。而 NumPy 更适合处理统一的数值数组数据。
# 数据结构介绍
Pandas 中的主要数据结构有两个:Series
和DataFrame
- 其中 Series 是一种类似于一维数组(Python 中的 list)的对象,由一组数据和一组索引(下标)两部分组成。Series 可以保存任何数据类型。
- DataFrame 是一个二维的表格型数据结构,可以把它想象成是一个 Excel 表格来理解,既有行索引,也有列索引。其中每列可以是不同的值类型。
除了 Series 和 DataFrame,Index 也是比较常见的数据结构,虽然没有前两者那么重要,但也是必不可少的。
上次更新: 2023/11/01, 03:11:44