Python pandas 根据标题值匹配VLOOKUP列
问题描述
我有以下数据帧DF:
Customer_ID | 2015 | 2016 |2017 | Year_joined_mailing
ABC 5 6 10 2015
BCD 6 7 3 2016
DEF 10 4 5 2017
GHI 8 7 10 2016
我要查找客户在加入邮件列表时的价值,并将其保存在新列中。
输出将为:
Customer_ID | 2015 | 2016 |2017 | Year_joined_mailing | Purchases_1st_year
ABC 5 6 10 2015 5
BCD 6 7 3 2016 7
DEF 10 4 5 2017 5
GHI 8 9 10 2016 9
我为python中的Match VLOOKUP找到了一些解决方案,但没有一个可以使用其他列的标题。
解决方案
弃用通知:
lookup
为deprecated in v1.2.0
使用pd.DataFrame.lookup
请记住,我假设Customer_ID
是索引。
df.lookup(df.index, df.Year_joined_mailing)
array([5, 7, 5, 7])
df.assign(
Purchases_1st_year=df.lookup(df.index, df.Year_joined_mailing)
)
2015 2016 2017 Year_joined_mailing Purchases_1st_year
Customer_ID
ABC 5 6 10 2015 5
BCD 6 7 3 2016 7
DEF 10 4 5 2017 5
GHI 8 7 10 2016 7
但是,在比较列名中可能的字符串和第一年列中的整数时必须小心.
确保遵守类型比较的核心选项。
df.assign(
Purchases_1st_year=df.rename(columns=str).lookup(
df.index, df.Year_joined_mailing.astype(str)
)
)
2015 2016 2017 Year_joined_mailing Purchases_1st_year
Customer_ID
ABC 5 6 10 2015 5
BCD 6 7 3 2016 7
DEF 10 4 5 2017 5
GHI 8 7 10 2016 7
相关文章