如何在Pandas中连接包含List(Series)的两列

问题描述

我想把 pandas 的两根柱子连接起来。每列由1x4元素的浮点列表组成。我想合并两列,这样输出就是一个1x8的向量。下面显示了数据帧的一个片段

ue,bs
"[1.27932459e-01 7.83234197e-02 3.24789420e-02 4.34971932e-01]","[2.97806183e-01 2.32453145e-01 3.10236304e-01 1.69975788e-02]"
"[0.05627587 0.4113416  0.02160842 0.20420576]","[1.64862491e-01 1.35556330e-01 2.59050065e-02 1.42498115e-02]"

要连接两列,我执行以下操作:

df['ue_bs'] = zip(df_join['ue'], df_join['bs'])

由此,我获得了一个新列‘ue_bs’,其中包含df['ue_bs']第一行的以下内容:

(array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01]),
 array([2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02]))
但是,它们仍然是两个数组。为了将它们合并,我进行了如下操作:

a = df['ue_bs'][0]
np.concatenate((a[0], a[1]), axis=0)

然后,我得到了

array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01,
   2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02])

我在想,有没有一种巧妙的方法可以在单行代码中做到这一点,而不是必须遍历df['ue_bs']并执行np.concatenate()


解决方案

要在Python中连接两个列表,最简单的方法是使用+。在 pandas 中连接列时也是如此。您只需执行以下操作:

df['ue_bs'] = df['ue'] + df['bs']

如果列类型为Numpy数组,可以在连接前先将其转换为普通python列表:

df['ue_bs'] = df['ue'].apply(lambda x: x.tolist()) + df['bs'].apply(lambda x: x.tolist())

相关文章