Python 伪装 User-Agent:如何使用 fake_useragent 库生成随机 User-Agent?
要在 Python 中伪装 User-Agent,可以使用 fake_useragent 库。该库允许您生成随机 User-Agent 字符串,以便您可以在爬取网站时更容易地避免被检测和封锁。
以下是使用 fake_useragent 库生成随机 User-Agent 的步骤:
- 安装 fake_useragent 库:
pip install fake_useragent
- 导入 fake_useragent 库:
from fake_useragent import UserAgent
- 创建 UserAgent 对象:
ua = UserAgent()
- 使用 UserAgent 对象生成随机 User-Agent 字符串:
user_agent = ua.random
完整代码示例:
from fake_useragent import UserAgent ua = UserAgent() user_agent = ua.random print(user_agent)
输出:
Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:81.0) Gecko/20100101 Firefox/81.0
您可以在需要设置 User-Agent 的爬虫代码中使用此生成的字符串,以模拟不同的浏览器和操作系统。例如:
import requests from fake_useragent import UserAgent ua = UserAgent() headers = {'User-Agent': ua.random} url = 'https://pidancode.com' response = requests.get(url, headers=headers)
此代码使用 requests 库向 pidancode.com 发送了一个 GET 请求,并使用随机生成的 User-Agent 字符串作为请求头。这将使请求看起来像来自随机浏览器和操作系统。
相关文章