Python3:我如何根据条件拆分列表?
问题描述
关于如何将列表拆分成大小相等的块,我找到了很多答案,但我有一个不同的问题
我的数据格式如下。
> header1
line1
line2
...
> header2
line4
line5
...
并且我要将行分组到它们各自的标题下。
获取标头很容易。headers = [x for x in lines if x.startswith('>')]
但该技巧不适用于后续行,因为无法知道每个标题下有哪些行。
理想情况下,我希望列表的格式类似于[[line1, line2], [line4, line5]...]
我有一个使用While循环的有效解决方案,但它看起来很难看。如何使用列表理解或现有库完成此操作?
解决方案
将itertools.groupby
与自定义密钥函数一起使用,该函数在每次看到新标题时都会更改。在此函数中,我们递增ctr
。
from itertools import groupby
lis = ['>a', 'b', 'c', '>d', 'e', '>f', '>g']
def group_by_header(lis: list):
def header_counter(x: str):
if x.startswith('>'):
header_counter.ctr += 1
return header_counter.ctr
header_counter.ctr = 0
return groupby(lis, key=header_counter)
print([list(l) for k, l in group_by_header(lis)])
# [['>a', 'b', 'c'], ['>d', 'e'], ['>f'], ['>g']]
相关文章