python获取指定网页上的所有超级链接
这段python代码通过urllib.request抓取网页,然后通过简单的正则表达式分析网页上的全部url地址
""" 皮蛋编程(https://www.pidancode.com) 创建日期:2022/4/24 功能描述:python获取指定网页上的所有超级链接 """ import urllib.request import re url = 'https://www.pidancode.com' # 链接到url website = urllib.request.urlopen(url) # 读取html代码 html = str(website.read()) # 使用re.findall 正则获取所有链接 links = re.findall('"((http|ftp)s?://.*?)"', html) print(links)
相关文章