python 抓取的网页默认是bytes

2023-01-31 02:01:52 网页 默认 抓取

python 抓取的网页默认是bytes的,要转码.

查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.

req = urllib.request.Request(url=myurl,headers = myheaders)
data = urllib.request.urlopen(req).read()
print(data.decode("UTF-8"))

这样就正常显示中文了

相关文章