在python中numpy.sum的性能好不好

2023-06-15 14:03:09 python 性能好不好

今天小编给大家分享一下在python中numpy.sum的性能好不好的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

首先我们应该知道np.sum是用C语言写的矢量计算，应用场景为规模较大的numpy数组求和。

代码：

import numpy as np
import time

data_0 = []
data_1 = []
for _ in range(1000000):
    tmp = np.random.randint(100, size=(6,))
    data_0.append(tmp)
    data_1.append(tmp.tolist())


a_time = time.time()
for d in data_0:
    x=np.sum(d)
b_time = time.time()
print(b_time-a_time)


a_time = time.time()
for a,b,c,d,e,f in data_1:
    x=a+b+c+d+e+f
b_time = time.time()
print(b_time-a_time)

从上面的代码中我们可以知道，第一个运算是使用numpy.sum对长度为6的numpy数组求和；第二个运算是使用python原生的加和运算。

运算结果：

在python中numpy.sum的性能好不好

结果分析：

从上面的结果可以看到，在对小规模数组求和时，numpy.sum求和计算的性能是没有python原生计算性能高的，而且这个差距还很大，在上面的结果中相差了10多倍。由此我们可以知道，在对小规模数组求和时，使用python原生加和运算的性能要优于numpy.sum的。

========================================

numpy.sum的性能只有对较大规模数组求和才有很好体现，为此我们再加一个测试，对数组长度为10000的数组求和。

代码：

import numpy as np
import time

data_0 = []
data_1 = []
for _ in range(100000):
    tmp = np.random.randint(100, size=(10000,))
    data_0.append(tmp)
    data_1.append(tmp.tolist())


a_time = time.time()
for d in data_0:
    x=np.sum(d)
b_time = time.time()
print(b_time-a_time)


a_time = time.time()
for data in data_1:
    s = 0
    for d in data:
        s += d 
b_time = time.time()
print(b_time-a_time)

运行结果：

在python中numpy.sum的性能好不好

结果分析：

通过上面的测试，可以知道在对规模为10000的数组求和时，numpy.sum的性能是python原生的63倍；而在上面对长度为6的数组求和时，python原生的性能是numpy.sum的20倍。这个结果更加证明了numpy.sum只适合对大规模数组求和的情况，否则它的性能会原差于python原生。

相关文章