Python pandas 根据标题值匹配VLOOKUP列

2022-02-27 00:00:00 python pandas lookup match

问题描述

我有以下数据帧DF:

Customer_ID | 2015 | 2016 |2017 | Year_joined_mailing
ABC            5      6     10     2015
BCD            6      7     3      2016        
DEF            10     4     5      2017
GHI            8      7     10     2016

我要查找客户在加入邮件列表时的价值,并将其保存在新列中。

输出将为:

Customer_ID | 2015 | 2016 |2017 | Year_joined_mailing | Purchases_1st_year
ABC            5      6     10     2015                       5
BCD            6      7     3      2016                       7       
DEF            10     4     5      2017                       5
GHI            8      9     10     2016                       9

我为python中的Match VLOOKUP找到了一些解决方案,但没有一个可以使用其他列的标题。


解决方案

弃用通知:lookup为deprecated in v1.2.0

使用pd.DataFrame.lookup
请记住,我假设Customer_ID是索引。

df.lookup(df.index, df.Year_joined_mailing)

array([5, 7, 5, 7])

df.assign(
    Purchases_1st_year=df.lookup(df.index, df.Year_joined_mailing)
)

             2015  2016  2017  Year_joined_mailing  Purchases_1st_year
Customer_ID                                                           
ABC             5     6    10                 2015                   5
BCD             6     7     3                 2016                   7
DEF            10     4     5                 2017                   5
GHI             8     7    10                 2016                   7

但是,在比较列名中可能的字符串和第一年列中的整数时必须小心.

确保遵守类型比较的核心选项。

df.assign(
    Purchases_1st_year=df.rename(columns=str).lookup(
        df.index, df.Year_joined_mailing.astype(str)
    )
)

             2015  2016  2017  Year_joined_mailing  Purchases_1st_year
Customer_ID                                                           
ABC             5     6    10                 2015                   5
BCD             6     7     3                 2016                   7
DEF            10     4     5                 2017                   5
GHI             8     7    10                 2016                   7

相关文章