python通过BeautifulSoup获取网页上的所有超级链接

2022-04-27 00:00:00 网页 获取 超级链接

通过BeautifulSoup我们很容易的分析网页上的html信息,这段python代码用于输出网页上的所有超级链接

"""
皮蛋编程(https://www.pidancode.com)
创建日期:2022/4/21
功能描述:Python通过BeautifulSoup模块获取网页上的所有链接
"""

from bs4 import BeautifulSoup
import urllib.request
url = urllib.request.urlopen("https://www.pidancode.com")
content = url.read()
soup = BeautifulSoup(content, 'lxml')
links = [link['href'] for link in soup.findAll("a")]
print(links)

相关文章