python程序默认执行与多线程

2023-01-31 02:01:24 执行 多线程 默认

1程序执行流程
有类似脚本程序或编程经验的同学都知道,程序默认是自上而下,从左到右的按顺序执行,也叫串行执行;而多线程类似于并行执行,即A模块(函数)执行时B也执行不需要等A执行完再执行,这里请区别对待并发执行(同一时间执行);以上是简单概念性描述,

2什么是线程与进程?
线程操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务
本节不讨论进程.以下主要说明线程的应用.进程,以及进程与线程,有兴趣可以参考这里

3python中的线程
以下引用廖雪峰博客python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。后面通过示例说明这一点.

     GIL是Python解释器设计的历史遗留问题,通常我们用的解释器是官方实现的CPython,要真正利用多核,除非重写一个不带GIL的解释器。

所以,在Python中,可以使用多线程,但不要指望能有效利用多核。如果一定要通过多线程利用多核,那只能通过C扩展来实现,不过这样就失去了Python简单易用的特点。
不过,也不用过于担心,Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响.

以下示例均在python3.5.2中完成

1、默认执行流程

import time

def Foo():
    sleep(2)
    print("I am Foo.")

def Bar():
    sleep(3)
    print("I am Bar.")

if __name__ == "__main__":
    start = time.time()  #程序执行开始时间
    Foo()
    Bar()
    end = time.time()
    print("程序执行完使用 %s" %(end - start))

执行结果:
python程序默认执行与多线程
可以看出,程序从上而下的调用了Foo函数休眠2秒再执行Bar函数休眠3秒,最后执行完成共使用大约5秒多一点时间.这说明 Foo执行完才执行Bar.

2、线程执行
在讨论线程时,先问一个问题,自上而下的串行执行可以满足条件,为啥要多线程并行去执行?想像一个场景,我们在看一部电影时,要是默认串行执行,先放图像 再放电影中的声音,能接受吗?

def Movie_music(func):
    print(threading.current_thread())
    for i in range(2):
        print("Begin  listening to %s . %s" %(func,ctime()))
        sleep(2)
        print("End listening %s" % ctime())

def Movie_grap(func):
    print(threading.current_thread())
    for i in range(2):
        print("Begin watching at the %s! %s" %(func,ctime()))
        sleep(3)
        print("End watching %s" %ctime())

threads= []
t1 = threading.Thread(target=Movie_music,args=(u"七里香.mtv",))
threads.append(t1)
t2 = threading.Thread(target=Movie_grap,args=(u"七里香.mtv",))
threads.append(t2)

if __name__ == "__main__":
    for t in threads:

        t.start()
    t.join()          
    print("MTV播放结束: %s" %ctime())   

执行结果:
python程序默认执行与多线程
所谓的多线程并不是同一时刻而是在很多的时间内进行了切换,而人的感观只要超过1/12之秒基本等同于同一时间,从上面的started 140049239336704 可以看出纳秒级别,时间上基本是同一秒,所以这首MTV中的音乐和图像 让我感觉 是同时发生的.这就是多线程的好处.如果换成串行播放,那一个五分钟的MTV可能就要10分钟播放完,先放声音或先放图像.

    由于python解释器执行代码时,有一个GIL锁:Global Interpreter Lock的限制,多线程在Python中只能交替执行,即使100个线程跑在拥有100核CPU上,也只能用到1个核。其他核无法在多线程情况下使用.

计算密集型操作之串行

import time
def add(n):
    sum = 0
    for i in range(int(n)):
        sum+=i
    print(sum)
    print("finshed.")

if __name__ == "__main__":
    start = time.time()
    add(100000000)
    add(10000000)
    end = time.time()
    print(end - start)

运行结果:
python程序默认执行与多线程

计算密集型操作之多线程并行执行

def add(n):
    sum = 0
    for i in range(int(n)):
        sum+=i
    print(sum)
    print("finshed.")

if __name__ == "__main__":
    start = time.time()
     t1 = threading.Thread(target=add,args=(100000000,))  #计算密集型
     t1.start()

     t2 = threading.Thread(target=add, args=(10000000,))
    t2.start()

     t1.join()
     t2.join()

    end = time.time()
    print(end - start)

运行结果:
python程序默认执行与多线程

可以看出无论是串行执行还是多线程并行执行,计算结果一样,但花费的时间多线程并没有少于串行执行,反而略多,在python2.x上差距会更多,而上面的例子是io密集型多线程明显要优于串行.
所以对于IO密集型情况使用多线程比较合适,而对于计算密集型由于python GIL的限制不能真正使用多核,无法提高cpu计算效率,不宜使用多线程.可以采用多进程多线程方式 .

相关文章