shenyi
管理员
管理员
  • UID1
  • 粉丝45
  • 关注0
  • 发帖数842
阅读:2376回复:0

go简易爬虫:解析分类页、点击翻页、遍历所有页码的思路

楼主#
更多 发布于:2019-11-22 15:43
 本课程是  目前正在连载的 大型混合实战的 配套爬虫课 (非独立课程)
 由于我们的目标网站很多地方都是JS渲染的,因此 我们使用go+colly+无头浏览器 来配合抓取。本课程主要展示套路。
本周更新三课时,主要是演示下如何解析分类页
第10讲:分析分类页(1):清除干扰模态框
这节课开始我们来解析分类页。我们的目标是要取出分类页中所有的课程数据

第11讲:分析分类页(2): 点击下一页获取分页内容免费试听,无需登录
前面几课时我们都是获取的第一页内容。今天我们尝试通过chromedp来点击下一页获取课程数据

第12讲:分析分类页(3): 点击所有页码的处理方法
今天我们要完成的是使用上节课知识点,进行改造,并抓取所有页码的数据
会讲故事的程序员
游客

返回顶部