如何根据python中的通用ID值将2列的垂直pandas表转换为水平表
问题描述
df1 = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
'bar': ['A', 'B', 'C', 'A', 'B', 'C']})
富 | 酒吧 | |
---|---|---|
0 | 一个 | 一个 |
1 | 一个 | B |
2 | 一个 | C |
3 | 两个 | 一个 |
4 | 两个 | B |
5 | 两个 | C |
我想把它转换成
富 | val1 | val2 | val3 |
---|---|---|---|
一个 | 一个 | B | C |
两个 | 一个 | B | C |
我试过的代码是:
pd.pivot_table(df1,index='foo',aggfunc=['first'])
但上面的代码只返回第一个值
But the above code is returning only the first value
解决方案
我们可以用 groupby cumcount
并将其用作枢轴列,然后 add_prefix
到数值和 reset_index
返回 'foo' 值到列:
We can enumerate groups with groupby cumcount
and use those as the pivot columns then add_prefix
to the numerical values and reset_index
to return the 'foo' values to the columns:
new_df = (
df1.pivot_table(index='foo',
columns=df1.groupby('foo').cumcount() + 1,
values='bar',
aggfunc='first')
.add_prefix('val')
.reset_index()
)
foo val1 val2 val3
0 one A B C
1 two A B C
看看 df1.groupby('foo').cumcount() + 1
如何制作列:
foo columns
0 one 1 # First instance of "one"
1 one 2 # Second instance of "one"
2 one 3 # Third instance of "one"
3 two 1
4 two 2
5 two 3
生成上述DataFrame的代码:
Code to generate the above DataFrame:
demo_df = pd.DataFrame({
'foo': df1['foo'],
'columns': df1.groupby('foo').cumcount() + 1
})
相关文章