如果dataframe中的行以关键字开头,请将其与上面的行连接起来
问题描述
我有一个类似于here的问题,但我一直无法解答。
我有一个结构如下的DataFrame:
0 inner join xx
1 on xx
2 and xx
3 and yy
4 and aa
5 inner join zz
我尝试将以‘and’开头的行追加到前一行,结果如下所示:
0 inner join xx
1 on xx and xx and yy and aa
2 inner join zz
稍后,我将对"on"关键字执行相同的操作。
这是我到目前为止拥有的代码。它可以工作,但只能追加一次。留给我额外的‘and’关键字:
for row in df:
s = df['join'].shift(-1)
m = s.str.startswith('and', na=False)
df.loc[m, 'join'] += (' ' + s[m])
解决方案
可以使用groupby
+apply
:
(df.groupby((~df['join'].str.startswith('and ')).cumsum())
['join'].apply(' '.join)
)
输出:
join
1 inner join xx
2 on xx and xx and yy and aa
3 inner join zz
Name: join, dtype: object
相关文章