如何为转置数据创建新列

2022-03-03 00:00:00 python pandas pivot-table

问题描述

我正在尝试使用PANDA数据帧将一行转置为新列。访问ID是唯一标识符。我使用了df.voft和df.melt，但是df.melt似乎做了相反的事情。我是Python的新手，我尝试过它，但我完全迷失了方向。有什么建议吗？

当前输入：

访问ID	DX代码	保险	主要或次要
1	123	安泰	主要
1	234	亲和力	二级
2	456	VNS	二级
2	789	联邦医疗保险	主要

所需输出：

访问ID	DX代码	DX代码2	主要	次要
1	123	234	安泰	亲和力
2	456	789	联邦医疗保险	VNS

import pandas as pd

df = pd.read_excel(r'C:UsersTEST.xlsx', sheet_name = 'Sheet1')

# pivot = df.pivot(index='Visit ID', columns='DX Code', values = 'DX ID')
# print(pivot)

# melt = df.melt(value_name='DX Code', var_name='DX Code2')
# print(melt)

解决方案

可以使用merge：

out = pd.merge(df[df['Primary or Secondary'] == 'Primary'],
               df[df['Primary or Secondary'] == 'Secondary'],
               on='Visit ID', suffixes=('', '2'))

睡觉正在重新格式化：

out = out[['Visit ID', 'DX Code', 'DX Code2', 'Insurance', 'Insurance2']] 
          .rename(columns={'Insurance': 'Primary', 'Insurance2': 'Secondary'})

>>> df
   Visit ID  DX Code  DX Code2   Primary Secondary
0         1      123       234     Aetna  Affinity
1         2      789       456  Medicare       VNS

相关文章