Pandas计算DataFrame对象之间的相关性
pandas.corrwith()是一个用于计算DataFrame对象之间相关性的函数,它可以计算两个DataFrame对象之间的列相关性,也可以计算一个DataFrame对象中的列与另一个Series对象之间的相关性。
函数语法为:
pandas.DataFrame.corrwith(other, axis=0, drop=False, method='pearson')
其中,参数含义如下:
- other:另一个DataFrame对象或Series对象
- axis:计算相关性的轴,0表示按列计算,1表示按行计算
- drop:如果为True,则将缺失值所在的行或列删除,否则保留
- method:计算相关性的方法,包括'pearson'、'kendall'和'spearman'
例如,假设有两个DataFrame对象df1和df2,我们可以使用corrwith()函数计算它们之间的列相关性:
import pandas as pd df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) df2 = pd.DataFrame({'A': [2, 4, 6], 'B': [8, 10, 12], 'C': [14, 16, 18]}) corr = df1.corrwith(df2) print(corr)
输出结果为:
A 1.0 B 1.0 C 1.0 dtype: float64
这表示df1的每一列与df2的对应列之间的相关性均为1,即完全正相关。
相关文章