Python3:我如何根据条件拆分列表?

2022-03-12 00:00:00 python python-3.x list-comprehension

问题描述

关于如何将列表拆分成大小相等的块,我找到了很多答案,但我有一个不同的问题

我的数据格式如下。

> header1
line1
line2
...
> header2
line4
line5
...

并且我要将行分组到它们各自的标题下。

获取标头很容易。headers = [x for x in lines if x.startswith('>')]

但该技巧不适用于后续行,因为无法知道每个标题下有哪些行。

理想情况下,我希望列表的格式类似于[[line1, line2], [line4, line5]...]

我有一个使用While循环的有效解决方案,但它看起来很难看。如何使用列表理解或现有库完成此操作?


解决方案

itertools.groupby与自定义密钥函数一起使用,该函数在每次看到新标题时都会更改。在此函数中,我们递增ctr

from itertools import groupby

lis = ['>a', 'b', 'c', '>d', 'e', '>f', '>g']

def group_by_header(lis: list):
    def header_counter(x: str):
        if x.startswith('>'):
            header_counter.ctr += 1
        return header_counter.ctr
    header_counter.ctr = 0

    return groupby(lis, key=header_counter)

print([list(l) for k, l in group_by_header(lis)])
# [['>a', 'b', 'c'], ['>d', 'e'], ['>f'], ['>g']]

相关文章