python获取指定网页上的所有超级链接

2022-04-26 00:00:00 指定 获取 超级链接

这段python代码通过urllib.request抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

"""
皮蛋编程(https://www.pidancode.com)
创建日期:2022/4/24
功能描述:python获取指定网页上的所有超级链接
"""
import urllib.request
import re

url = 'https://www.pidancode.com'
# 链接到url
website = urllib.request.urlopen(url)
# 读取html代码
html = str(website.read())
# 使用re.findall 正则获取所有链接
links = re.findall('"((http|ftp)s?://.*?)"', html)
print(links)

相关文章