如何为转置数据创建新列

2022-03-03 00:00:00 python pandas pivot-table

问题描述

我正在尝试使用PANDA数据帧将一行转置为新列。访问ID是唯一标识符。我使用了df.voft和df.melt,但是df.melt似乎做了相反的事情。我是Python的新手,我尝试过它,但我完全迷失了方向。 有什么建议吗?

当前输入:

访问ID DX代码 保险 主要或次要
1 123 安泰 主要
1 234 亲和力 二级
2 456 VNS 二级
2 789 联邦医疗保险 主要

所需输出:

访问ID DX代码 DX代码2 主要 次要
1 123 234 安泰 亲和力
2 456 789 联邦医疗保险 VNS
import pandas as pd

df = pd.read_excel(r'C:UsersTEST.xlsx', sheet_name = 'Sheet1')

# pivot = df.pivot(index='Visit ID', columns='DX Code', values = 'DX ID')
# print(pivot)

# melt = df.melt(value_name='DX Code', var_name='DX Code2')
# print(melt)

解决方案

可以使用merge

out = pd.merge(df[df['Primary or Secondary'] == 'Primary'],
               df[df['Primary or Secondary'] == 'Secondary'],
               on='Visit ID', suffixes=('', '2'))

睡觉正在重新格式化:

out = out[['Visit ID', 'DX Code', 'DX Code2', 'Insurance', 'Insurance2']] 
          .rename(columns={'Insurance': 'Primary', 'Insurance2': 'Secondary'})
>>> df
   Visit ID  DX Code  DX Code2   Primary Secondary
0         1      123       234     Aetna  Affinity
1         2      789       456  Medicare       VNS

相关文章