在Python中查找最终重定向的URL

2022-04-14 00:00:00 python python-3.x python-requests urllib

问题描述

import requests

def extractlink():
    with open('extractlink.txt', 'r') as g:
        print("opened extractlink.txt for reading")
        contents = g.read()
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
        r = requests.get(contents, headers=headers)
        print(("Links to " + r.url))
        time.sleep (2)

目前，r.url只是链接到‘Extetlink.txt’中的URL

我希望修复此脚本，以找到最终重定向的URL并打印结果。问题似乎出在对URL的请求中，尽管尝试了许多替代方案和故障排除步骤，但我的问题似乎没有像其他人一样得到解决。

调试时，r.history读取为[]，r.status_code读取为403，即使链接在浏览器中重定向为302。有什么想法吗？

(提取链接.txt只是一个一行文件，带有指向http://butterup.teechip.icu/的链接，请谨慎输入垃圾网站)

Http

推荐答案状态代码403表示您无权查看该终结点。这意味着要么您需要登录，要么您可能会丢失一些标题。您可以从昆虫元素的网络选项卡中查看浏览器使用的标头。请尝试使用与浏览器相同的标题。

相关文章