Pandas使用fillna函数填充缺省值
在pandas中,可以使用fillna()函数填充DataFrame或Series中的缺失值。这个函数可以用不同的方法来填充缺失值,例如用一个固定的值、前一个或后一个非缺失值、均值、中位数等。以下是几个常见的示例:
用固定值填充缺失值:
import pandas as pd # 创建一个Series对象 s = pd.Series([1, 2, None, 4]) # 用固定值3填充缺失值 s = s.fillna(3) print(s)
这个示例中,我们创建了一个包含缺失值的Series对象。然后,我们使用fillna()方法将缺失值填充为3。输出结果为:
0 1.0 1 2.0 2 3.0 3 4.0 dtype: float64
用前一个非缺失值填充缺失值:
import pandas as pd # 创建一个Series对象 s = pd.Series([1, 2, None, 4]) # 用前一个非缺失值填充缺失值 s = s.fillna(method='ffill') print(s)
这个示例中,我们使用fillna()方法和method='ffill'参数将缺失值填充为前一个非缺失值。输出结果为:
0 1.0 1 2.0 2 2.0 3 4.0 dtype: float64
用均值填充缺失值:
import pandas as pd # 创建一个Series对象 s = pd.Series([1, 2, None, 4]) # 用均值填充缺失值 s = s.fillna(s.mean()) print(s)
这个示例中,我们使用fillna()方法和s.mean()函数将缺失值填充为均值。输出结果为:
0 1.000000 1 2.000000 2 2.333333 3 4.000000 dtype: float64
这些示例演示了如何使用fillna()函数填充DataFrame或Series中的缺失值。fillna()函数还可以用其他方法来填充缺失值,例如用后一个非缺失值、中位数、插值等。您可以根据需要选择不同的方法。
相关文章