Python通过urllib抓取网站站点地图xml文件

2022-03-11 00:00:00 抓取 地图 站点

python通过给定的url抓取远程xml文件,这段代码演示了如何抓取皮蛋编程网站的站点地图文件sitemap.xml

"""
作者:皮蛋编程(https://www.pidancode.com)
创建日期:2022/3/18
修改日期:2022/3/18
功能描述:Python通过urllib抓取网站站点地图xml文件
"""

import urllib.request


def get_xml(remote_addr):
    remote_file = urllib.request.urlopen(remote_addr)
    remote_data = remote_file.read()
    remote_file.close()
    return remote_data


print(get_xml('https://www.pidancode.com/sitemap.xml'))

以上代码在Python3.9环境下测试通过

相关文章