Pandas使用fillna函数填充缺省值

2023-02-24 00:00:00 函数 填充 缺省

在pandas中,可以使用fillna()函数填充DataFrame或Series中的缺失值。这个函数可以用不同的方法来填充缺失值,例如用一个固定的值、前一个或后一个非缺失值、均值、中位数等。以下是几个常见的示例:

用固定值填充缺失值:

import pandas as pd

# 创建一个Series对象
s = pd.Series([1, 2, None, 4])

# 用固定值3填充缺失值
s = s.fillna(3)

print(s)

这个示例中,我们创建了一个包含缺失值的Series对象。然后,我们使用fillna()方法将缺失值填充为3。输出结果为:

0    1.0
1    2.0
2    3.0
3    4.0
dtype: float64

用前一个非缺失值填充缺失值:

import pandas as pd

# 创建一个Series对象
s = pd.Series([1, 2, None, 4])

# 用前一个非缺失值填充缺失值
s = s.fillna(method='ffill')

print(s)

这个示例中,我们使用fillna()方法和method='ffill'参数将缺失值填充为前一个非缺失值。输出结果为:

0    1.0
1    2.0
2    2.0
3    4.0
dtype: float64

用均值填充缺失值:

import pandas as pd

# 创建一个Series对象
s = pd.Series([1, 2, None, 4])

# 用均值填充缺失值
s = s.fillna(s.mean())

print(s)

这个示例中,我们使用fillna()方法和s.mean()函数将缺失值填充为均值。输出结果为:

0    1.000000
1    2.000000
2    2.333333
3    4.000000
dtype: float64

这些示例演示了如何使用fillna()函数填充DataFrame或Series中的缺失值。fillna()函数还可以用其他方法来填充缺失值,例如用后一个非缺失值、中位数、插值等。您可以根据需要选择不同的方法。

相关文章