shenyi
管理员
管理员
  • UID1
  • 粉丝45
  • 关注0
  • 发帖数842
阅读:2447回复:0

go简易爬虫更新:利用协程抓取分类页所有课程链接入库

楼主#
更多 发布于:2019-11-29 15:59
go+colly简易爬虫(实战配套课程)

 本课程是实战专栏的配套课程,非独立爬虫课。目的是为我们实战课程准备较多的、逼真的测试数据。


前面几课时 我们快速的学习了colly简单实用、chromedp无头浏览器的操作。并分析了网易云课堂的分类页面
这几课时我们来尝试抓取若干分类页的课程

第13讲:分析分类页(4): 抓取分页第一页所有课程链接入库 (免费试听,无需登录)
我们尝试来抓取第一页的课程链接,并保存到数据库中


第14讲:分析分类页(5): 抓取单个分类所有页码课程链接入库
上节课我们只抓取了第一页,这节课我们来抓取一页上所有页码


第15讲:分析分类页(6): 使用协程抓取指定分类页的课程链接
为了演示效果,我们今天实现根据指定分类抓取所有课程链接入库
会讲故事的程序员
游客

返回顶部