使用Python发送带有片段标识符的GET请求

2022-02-22 00:00:00 python url get html

我正在尝试使用包含片段标识符的REQUESTS模块发送GET请求。我有以下代码:

url = 'http://steamcommunity.com/market/search?appid=730#p20_quantity_desc'
page = requests.get(url, headers=headers)

但是,我最终总是得到基页(http://steamcommunity.com/market/search?appid=730),而不是带有片段标识符的页(#p20_quanitity_description似乎没有发送)。

urllib2也不适用于我的代码:

req = urllib2.Request(url, headers={ 'User-Agent': 'Mozilla/5.0' })
page = urllib2.urlopen(req).read().decode('UTF-8', 'ignore')

如何发送GET请求并在URL中包含#p20_Quanitity_Description?


解决方案

锚(p20_quantity_desc)对服务器毫无意义。页面上有一些Javascript改变了基于该锚点的结果的排序顺序,但这是客户端的。Requests/urllib将看到带或不带锚点的同一页面响应。

尝试在页面上禁用Javascript,您就会明白我的意思。

您想要做的是向页面正在使用的API端点发出请求。这里有个例子:

http://steamcommunity.com/market/search/render/?query=&start=0&count=10&search_descriptions=0&sort_column=quantity&sort_dir=asc&appid=730
注意sort_column参数吗?这是您可以更改的值,以决定结果的顺序。使用像lxml这样的库来解析results_html字段,然后执行PRESTO,就完成了。

相关文章