pandas 合并列以创建具有逗号分隔值的新列

2022-04-01 00:00:00 python pandas merge multiple-columns comma

问题描述

我的数据框有四列颜色。我想将它们合并到一个名为"Colors"的列中,并使用逗号分隔值。

例如,我正在尝试合并到一个颜色列中,如下所示:

ID  Black Red  Blue  Green  Colors   
120 NaN   red  NaN   green  red, green  
121 black Nan  blue  NaN    black, blue

我的代码是:

df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x), axis=1)
但是ID 120的输出是: 、红色、、绿色

ID 121的输出为: 黑色,蓝色,

找到我的问题了! 在前面的代码中,我将"None"替换为"",而不是NaN。进行更改后,再加上插入[x.notull()]的反馈,它就可以工作了!

df['Black'].replace('None', np.nan, inplace=True)
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis=1)

解决方案

您只需处理NAN

df['Colors'] = df[['Black', 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis = 1)

    ID      Black   Red Blue    Green   Colors
0   120     NaN     red NaN     green   red, green
1   121     black   NaN blue    NaN     black, blue

相关文章