python线程池（threadpool

2023-01-31 02:01:52 python threadpool 线程

最近碰到个问题，需要telnet登录上千台机器去取主机名；其中有用户名密码交互部分，有需要延迟的部分，大概一次登录一次到处理完要10s，1000台机器串行处理就需要1000×10s，差不多三个小时，这是很难受的事情；

之前用thread的start_new_thread方法也可以实现，但是线程数量不好控制，没找到相关的控制线程数量的锁；

找了下关于python的线程池，找到threadpool这么一个模块，可以满足我的需求，见：

Http://chrisarndt.de/projects/threadpool/

我下的是版本1.2.2：

http://chrisarndt.de/projects/threadpool/download/threadpool-1.2.2.tar.bz2

放到当前目录或者Python模块库都行，用法很简单，见：

    Basic usage::  
      
        >>> pool = ThreadPool(poolsize)  
        >>> requests = makeRequests(some_callable, list_of_args, callback)  
        >>> [pool.putRequest(req) for req in requests]  
        >>> pool.wait()

第一行定义了一个线程池，表示最多可以创建poolsize这么多线程；

第二行是调用makeRequests创建了要开启多线程的函数，以及函数相关参数和回调函数，其中回调函数可以不写，default是无，也就是说makeRequests只需要2个参数就可以运行；

第三行用法比较奇怪，是将所有要运行多线程的请求扔进线程池，[pool.putRequest(req) for req in requests]等同于：

    for req in requests:  
        pool.putRequest(req)

第四行是等待所有的线程完成工作后退出；

下面看下我的代码，使用线程池前后代码对比，不使用线程池：

    import telnetlib  
    import time  
      
    #执行比较耗时的函数，需要开启多线程  
    def myTelnet(L):  
        tn = telnetlib.Telnet(L[0])  
        time.sleep(2)  
        ...  
        idx = tn.expect(["Username:", "login:"], timeout=5)  
        ...  
        time.sleep(3)  
        x = tn.read_very_eager()  
        tn.close()  
        ...  
        return  
      
    #模拟255个ip，需要逐个登录的函数  
    def myIpPool(ipPrefix):  
        List=[]  
        for i in range(1, 255):  
            List.append("%s.%d" % (ipPrefix, i))  
        return List  
      
    #串行运行telnet登录  
    L=myIpPool("200.200.200")  
    for i in range(len(L)):  
        myTelnet(L[i])

如果myTelnet每次执行要10s，那么255次myTelnet就需要2550s，大概是40分钟；

用多线程的情况：

    import telnetlib  
    import time  
    import threadpool  
      
    #执行比较耗时的函数，需要开启多线程  
    def myTelnet(L):  
        tn = telnetlib.Telnet(L[0])  
        time.sleep(2)  
        ...  
        idx = tn.expect(["Username:", "login:"], timeout=5)  
        ...  
        time.sleep(3)  
        x = tn.read_very_eager()  
        tn.close()  
        ...  
        return  
      
    #模拟255个ip，需要逐个登录的函数  
    def myIpPool(ipPrefix):  
        List=[]  
        for i in range(1, 255):  
            List.append("%s.%d" % (ipPrefix, i))  
        return List  
      
          
    #使用多线程执行telnet函数  
    pool = threadpool.ThreadPool(10)  
    requests = threadpool.makeRequests(myTelnet, L)  
    [pool.putRequest(req) for req in requests]  
    pool.wait()  
    output.close()

开始是个线程，理论上应该快10倍，实际可能没这么快，我将myTelnet函数改成只的sleep 10秒，什么也不干，测了下执行完需要260s，几乎是10倍的速度；改成如下：

    pool = threadpool.ThreadPool(30)

90s执行完毕，说明线程池还是很有用的东西

相关文章