在Python上限制每秒的HTTP请求数
问题描述
我已经编写了一个脚本,它从文件中获取URL并同时向所有URL发送HTTP请求。我现在想限制每秒的HTTP请求数和每个接口的带宽(eth0
、eth1
等)。)在一次治疗中。有什么办法可以在Python上实现这一点吗?
解决方案
您可以使用信号量对象,它是标准Python库的一部分: python doc
或者,如果您想要直接使用线程,可以使用Wait([Timeout])。
没有与Python捆绑在一起的库可以在以太网或其他网络接口上工作。您最多只能使用套接字。
根据您的答复,我有以下建议。请注意active_count。仅用于测试您的脚本是否只运行两个线程。在本例中,它们将是三个,因为第一个是您的脚本,然后您有两个URL请求。
import time
import requests
import threading
# Limit the number of threads.
pool = threading.BoundedSemaphore(2)
def worker(u):
# Request passed URL.
r = requests.get(u)
print r.status_code
# Release lock for other threads.
pool.release()
# Show the number of active threads.
print threading.active_count()
def req():
# Get URLs from a text file, remove white space.
urls = [url.strip() for url in open('urllist.txt')]
for u in urls:
# Thread pool.
# Blocks other threads (more than the set limit).
pool.acquire(blocking=True)
# Create a new thread.
# Pass each URL (i.e. u parameter) to the worker function.
t = threading.Thread(target=worker, args=(u, ))
# Start the newly create thread.
t.start()
req()
相关文章