如何为转置数据创建新列
问题描述
我正在尝试使用PANDA数据帧将一行转置为新列。访问ID是唯一标识符。我使用了df.voft和df.melt,但是df.melt似乎做了相反的事情。我是Python的新手,我尝试过它,但我完全迷失了方向。 有什么建议吗?
当前输入:
访问ID | DX代码 | 保险 | 主要或次要 |
---|---|---|---|
1 | 123 | 安泰 | 主要 |
1 | 234 | 亲和力 | 二级 |
2 | 456 | VNS | 二级 |
2 | 789 | 联邦医疗保险 | 主要 |
所需输出:
访问ID | DX代码 | DX代码2 | 主要 | 次要 |
---|---|---|---|---|
1 | 123 | 234 | 安泰 | 亲和力 |
2 | 456 | 789 | 联邦医疗保险 | VNS |
import pandas as pd
df = pd.read_excel(r'C:UsersTEST.xlsx', sheet_name = 'Sheet1')
# pivot = df.pivot(index='Visit ID', columns='DX Code', values = 'DX ID')
# print(pivot)
# melt = df.melt(value_name='DX Code', var_name='DX Code2')
# print(melt)
解决方案
可以使用merge
:
out = pd.merge(df[df['Primary or Secondary'] == 'Primary'],
df[df['Primary or Secondary'] == 'Secondary'],
on='Visit ID', suffixes=('', '2'))
睡觉正在重新格式化:
out = out[['Visit ID', 'DX Code', 'DX Code2', 'Insurance', 'Insurance2']]
.rename(columns={'Insurance': 'Primary', 'Insurance2': 'Secondary'})
>>> df
Visit ID DX Code DX Code2 Primary Secondary
0 1 123 234 Aetna Affinity
1 2 789 456 Medicare VNS
相关文章