在Python中查找最终重定向的URL
问题描述
import requests
def extractlink():
with open('extractlink.txt', 'r') as g:
print("opened extractlink.txt for reading")
contents = g.read()
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
r = requests.get(contents, headers=headers)
print(("Links to " + r.url))
time.sleep (2)
目前,r.url只是链接到‘Extetlink.txt’中的URL
我希望修复此脚本,以找到最终重定向的URL并打印结果。问题似乎出在对URL的请求中,尽管尝试了许多替代方案和故障排除步骤,但我的问题似乎没有像其他人一样得到解决。
调试时,r.history
读取为[]
,r.status_code
读取为403
,即使链接在浏览器中重定向为302。
有什么想法吗?
(提取链接.txt只是一个一行文件,带有指向http://butterup.teechip.icu/
的链接,请谨慎输入垃圾网站)
Http
推荐答案状态代码403表示您无权查看该终结点。 这意味着要么您需要登录,要么您可能会丢失一些标题。 您可以从昆虫元素的网络选项卡中查看浏览器使用的标头。请尝试使用与浏览器相同的标题。
相关文章