用R语言抓取网页图片——从此高效存图告别手工时代

2020-06-16 00:00:00 获取 图片 地址 定位 结构

今天这个标题实在是有点言过其实了,对于R的爬虫知识,我只是领会了一点儿皮毛。

主要看不懂正则表达式,特别是那种一个括号里要匹配多种类型文本的语句,特像火星文,估计短期很难搞懂了。

再加上对于HTML结构没啥感觉,在目标定位上很苦恼。

但是相对于文本信息而言,图片在html中的地址比较好获取,这里仅以图片抓取为例,会Python爬虫的大神还求轻喷~

今天要爬取的是一个多图的知乎网页,是一个外拍的帖子,里面介绍了巨多各种外拍技巧,很实用的干货。

library(rvest)
library(downloader)
library(stringr)
library(dplyr)

相关文章