为什么在这种情况下词典查找速度不快?

2022-04-23 00:00:00 python list dictionary lookup

问题描述

我最近询问了the fastest way to create powers of ten,结果发现最快的方法实际上有点像sneaky workaround,您首先创建所有可能的值,然后在需要的时候简单地查找它们。

在解决方案中,list被用作查找表,然而,我刚刚了解到dictsshould be much faster当涉及到查找操作时(另请参见here)。但当我尝试使用dict作为查找表时,过程实际上较慢:

n = 200
 18 ns   18 ns   18 ns  f[n]  # list
 22 ns   22 ns   22 ns  g[n]  # dict

n = -200
 18 ns   18 ns   18 ns  f[n]  # list
 29 ns   29 ns   29 ns  g[n]  # dict

为什么?这是否与keys是整数而不是字符串有关?(我猜sets在这种情况下不能使用?)

以下是我运行的代码:

from timeit import repeat


solutions = [
    'f[n]  # list',
    'g[n]  # dict',
]

for n in 200, -200:
    print(f'n = {n}')
    setup = f'''
n = {n}
f = [10.0 ** i for i in [*range(309), *range(-323, 0)]]
g = {{i: 10.0 ** i for i in range(-323, 309)}}
'''
    for solution in solutions:
        try:
            ts = sorted(repeat(solution, setup, repeat=50))[:3]
        except OverflowError:
            ts = [None] * 3
        print(
            *('%3d ns ' % (t * 1e3) if t else ' error ' for t in ts), solution
        )
    print()

解决方案

collection[key_or_index]对于listdict都是O(1)。不同的是key_or_value in collection的性能。

我的列表中十的<[2-9]次方是多少?x列表中的x是10的次方吗?

列表的索引速度略快,因为字典需要计算其键的哈希,并检查冲突。


混淆是因为";lookup";既可以引用索引操作,也可以根据上下文检查是否存在。


这里概述了如何在列表和词典中执行相同的操作:

列表 词典
索引 lst[i] dct[key]
检查是否存在键/索引 -len(lst) <= i < len(lst) key in dct
检查值是否存在 value in lst value in dct.values()
循环遍历值 for value in lst for value in dct.values()
循环遍历键/索引 for i in range(len(lst)) for key in dct
同时循环 for i, value in enumerate(lst) for key, value in dct.items()

相关文章