Pandas Series：数据分析的基础

Pandas Series 是 Python 数据分析中不可或缺的工具，它提供了一种高效、灵活的数据操作方式。通过掌握 Series 的基本用法，用户可以轻松地进行数据访问、数据清洗和数据转换等任务。无论是处理大型数据集还是进行复杂的数据分析，Pandas Series 都是一个强大的工具。

xyq2024

430人浏览 · 2024-09-20 06:04:40

xyq2024 · 2024-09-20 06:04:40 发布

Pandas Series：数据分析的基础

Pandas Series 是 Python 数据分析库 Pandas 的核心数据结构之一，它为 Python 用户提供了一种高效、灵活的数据操作方式。Series 可以看作是一种一维的数组型对象，它能够保存任何类型的数据（整数、字符串、浮点数、Python 对象等）。在数据分析、数据清洗和数据转换等任务中，Pandas Series 发挥着至关重要的作用。

Series 的创建

创建一个 Series 对象非常简单，只需要将一个列表、数组或其他可迭代对象传递给 Series 构造函数即可。Pandas 会自动为数据分配索引，你也可以自定义索引。

import pandas as pd

# 创建一个简单的 Series 对象
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
print(series)

输出：

0    1
1    2
2    3
3    4
4    5
dtype: int64

在这个例子中，data 是一个包含整数的列表，Pandas 创建了一个 Series 对象，并自动为每个元素分配了一个从 0 开始的整数索引。

索引和切片

Series 对象的一个重要特性是它支持索引和切片操作，这使得数据访问和操作变得非常方便。你可以使用整数索引、自定义索引或布尔索引来访问和修改数据。

# 使用整数索引
print(series[0])

# 使用自定义索引
series = pd.Series(data, index=['a', 'b', 'c', 'd', 'e'])
print(series['a'])

# 使用切片
print(series['a':'c'])

输出：

1
1
a    1
b    2
c    3
dtype: int64

基本操作

Series 支持多种基本操作，如算术运算、比较运算等。这些操作通常会按照索引对齐数据进行。

# 算术运算
series2 = pd.Series([10, 20, 30, 40, 50])
print(series + series2)

# 比较运算
print(series > 2)

输出：

a     11
b     22
c     33
d     44
e     55
dtype: int64

a    False
b     True
c     True
d     True
e     True
dtype: bool

数据对齐

当进行算术运算或比较运算时，Pandas 会自动对齐不同索引的数据。

series3 = pd.Series([10, 20, 30], index=['a', 'b', 'f'])
print(series + series3)

输出：

a    11.0
b    22.0
c     NaN
d     NaN
e     NaN
f     NaN
dtype: float64

在这个例子中，series 和 series3 在索引 'a' 和 'b' 上有共同的数据，因此在这些索引上进行了加法运算。在其他索引上，由于数据不匹配，结果为 NaN（Not a Number）。

总结

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区，基于昇腾的部署教程来了

继一周前模型开源发布后，千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型，也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式，在智能体编程方面达到了旗舰级表现，全面超越前代开源旗舰 Qwen3.5-397B-A17B（总参数397B / 激活参数17B的MoE模型）。作为稠密架构，它无需MoE路由即可部署，是开发者在实用、可广泛部署规模