Python并发编程之线程中的信息隔离(五)
大家好,并发编程
进入第五篇。
上班天,大家应该比较忙吧。小明也是呢,所以今天的内容也很少。只要几分钟就能学完。
昨天我们说,线程与线程之间要通过消息通信来控制程序的执行。
讲完了消息通信,今天就来探讨下线程里的信息隔离
是如何做到的。
大家注意:信息隔离
,这并不是官方命名的名词,也不是网上广为流传的名词。是我为了方便理解而自创的,大家知道就好咯。
本文目录
- 初步认识信息隔离
- 信息隔离的意义何在
. 初步认识信息隔离
什么是信息隔离
?
比如说,咱有两个线程,线程A里的变量,和线程B里的变量值不能共享。这就是信息隔离
。
你可能要说,那变量名取不一样不就好啦?
是的,如果所有的线程都不是由一个class实例化出来的同一个对象,确实是可以。这个问题我们暂且挂着,后面我再说明。
那么,如何实现信息隔离
呢?
在Python中,其提供了threading.local
这个类,可以很方便的控制变量的隔离,即使是同一个变量,在不同的线程中,其值也是不能共享的。
用代码来看下
来看看输出结果
从输出来看,我们可以知道,local
实际是一个字典型
的对象,其内部可以以key-value
的形式存入你要做信息隔离的变量。local实例可以是全局
的,只有一个。因为你在给local存入或访问变量时,它会根据当前的线程的不同从不同的存储空间
存入或获取。
基于此,我们可以得出以下三点结论:
- 主线程中的变量,不会因为其是全局变量,而被子线程获取到;
- 主线程也不能获取到子线程中的变量;
- 子线程与子线程之间的变量也不能互相访问。
所以如果想在当前线程保存一个全局值,并且各自线程(包括主线程)互不干扰,使用local类吧。
. 信息隔离的意义何在
细心的你,一定已经发现了,上面那个例子,即使我们不用threading.local
来做信息隔离,两个线程self.getName()
本身就是隔离的,没有任何关系的。因为这两个线程是由一个class实例出的两个不同的实例对象。自然是可以不用做隔离,因为其本身就是隔离的。
但是,现实开发中。不可排除有多个线程,是由一个class实例出的同一个实例对象而实现的。
譬如,现在新手特别喜欢的爬虫项目。通常都是先给爬虫一个主页,然后获取主页下的所有链接,对这个链接再进行遍历,一直往下,直到把所有的链接都爬完,获取到我们所需的内容。
由于单线程的爬取效率实在是太低了,我们考虑使用多线程来工作。先使用socket
和www.sina.con.cn
建立一个TCP连接。然后在这个连接的基础上,对主页上的每个链接(我们这里只举news.sina.com.cn
和blog.sina.com.cn
这两个子链接做例子)创建一个线程,这样效率就高多了。
友情提醒:
以下代码,若要理解,可能需要你了解下socket的网络编程相关内容。我在前几天的文章中有发布一篇相关的文章,没有基础的同学可以先去看看那篇文章。
输出结果
Got 765 bytes
Got 513469 bytes
相关文章