Pandas计算DataFrame对象之间的相关性

2023-02-24 00:00:00 对象 计算 相关性

pandas.corrwith()是一个用于计算DataFrame对象之间相关性的函数,它可以计算两个DataFrame对象之间的列相关性,也可以计算一个DataFrame对象中的列与另一个Series对象之间的相关性。

函数语法为:

pandas.DataFrame.corrwith(other, axis=0, drop=False, method='pearson')

其中,参数含义如下:

  • other:另一个DataFrame对象或Series对象
  • axis:计算相关性的轴,0表示按列计算,1表示按行计算
  • drop:如果为True,则将缺失值所在的行或列删除,否则保留
  • method:计算相关性的方法,包括'pearson'、'kendall'和'spearman'

例如,假设有两个DataFrame对象df1和df2,我们可以使用corrwith()函数计算它们之间的列相关性:

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
df2 = pd.DataFrame({'A': [2, 4, 6], 'B': [8, 10, 12], 'C': [14, 16, 18]})

corr = df1.corrwith(df2)
print(corr)

输出结果为:

A    1.0
B    1.0
C    1.0
dtype: float64

这表示df1的每一列与df2的对应列之间的相关性均为1,即完全正相关。

相关文章