pandas 合并列以创建具有逗号分隔值的新列
问题描述
我的数据框有四列颜色。我想将它们合并到一个名为"Colors"的列中,并使用逗号分隔值。
例如,我正在尝试合并到一个颜色列中,如下所示:
ID Black Red Blue Green Colors
120 NaN red NaN green red, green
121 black Nan blue NaN black, blue
我的代码是:
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x), axis=1)
但是ID 120的输出是:
、红色、、绿色
ID 121的输出为: 黑色,蓝色,
找到我的问题了! 在前面的代码中,我将"None"替换为"",而不是NaN。进行更改后,再加上插入[x.notull()]的反馈,它就可以工作了!
df['Black'].replace('None', np.nan, inplace=True)
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis=1)
解决方案
您只需处理NAN
df['Colors'] = df[['Black', 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis = 1)
ID Black Red Blue Green Colors
0 120 NaN red NaN green red, green
1 121 black NaN blue NaN black, blue
相关文章