如何在Pandas中连接包含List(Series)的两列
问题描述
我想把 pandas 的两根柱子连接起来。每列由1x4元素的浮点列表组成。我想合并两列,这样输出就是一个1x8的向量。下面显示了数据帧的一个片段
ue,bs
"[1.27932459e-01 7.83234197e-02 3.24789420e-02 4.34971932e-01]","[2.97806183e-01 2.32453145e-01 3.10236304e-01 1.69975788e-02]"
"[0.05627587 0.4113416 0.02160842 0.20420576]","[1.64862491e-01 1.35556330e-01 2.59050065e-02 1.42498115e-02]"
要连接两列,我执行以下操作:
df['ue_bs'] = zip(df_join['ue'], df_join['bs'])
由此,我获得了一个新列‘ue_bs’,其中包含df['ue_bs']
第一行的以下内容:
(array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01]),
array([2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02]))
但是,它们仍然是两个数组。为了将它们合并,我进行了如下操作:
a = df['ue_bs'][0]
np.concatenate((a[0], a[1]), axis=0)
然后,我得到了
array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01,
2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02])
我在想,有没有一种巧妙的方法可以在单行代码中做到这一点,而不是必须遍历df['ue_bs']
并执行np.concatenate()
?
解决方案
要在Python中连接两个列表,最简单的方法是使用+
。在 pandas 中连接列时也是如此。您只需执行以下操作:
df['ue_bs'] = df['ue'] + df['bs']
如果列类型为Numpy数组,可以在连接前先将其转换为普通python列表:
df['ue_bs'] = df['ue'].apply(lambda x: x.tolist()) + df['bs'].apply(lambda x: x.tolist())
相关文章