go简易爬虫:解析分类页、点击翻页、遍历所有页码的思路

楼主^#

更多发布于：2019-11-22 15:43

爬虫 golang colly chromedp

本课程是目前正在连载的大型混合实战的配套爬虫课 (非独立课程)
由于我们的目标网站很多地方都是JS渲染的，因此我们使用go+colly+无头浏览器来配合抓取。本课程主要展示套路。
本周更新三课时，主要是演示下如何解析分类页
第10讲:分析分类页(1):清除干扰模态框
这节课开始我们来解析分类页。我们的目标是要取出分类页中所有的课程数据

第11讲:分析分类页(2): 点击下一页获取分页内容（免费试听，无需登录）
前面几课时我们都是获取的第一页内容。今天我们尝试通过chromedp来点击下一页获取课程数据

第12讲:分析分类页(3): 点击所有页码的处理方法
今天我们要完成的是使用上节课知识点，进行改造，并抓取所有页码的数据

喜欢0

会讲故事的程序员

发帖回复

« 返回列表

您需要登录后才可以回帖，登录或者注册

返回顶部

go简易爬虫:解析分类页、点击翻页、遍历所有页码的思路

最新喜欢：