不器小窝 不器小窝
首页
随笔
  • GoLang
  • 前端

    • Vue
    • VuePress
  • 开发工具
  • 系统工具
读吧
  • ToDb (opens new window)
  • goKit (opens new window)
  • 友情链接
  • 免费信息
  • 时间线
  • 关于
GitHub (opens new window)

不器

知行合一
首页
随笔
  • GoLang
  • 前端

    • Vue
    • VuePress
  • 开发工具
  • 系统工具
读吧
  • ToDb (opens new window)
  • goKit (opens new window)
  • 友情链接
  • 免费信息
  • 时间线
  • 关于
GitHub (opens new window)
  • GoLang

    • GoLang 安装
    • Go经验
    • 错误集合
    • 基础库

    • 第三方库

      • colly
        • colly库简介
        • 项目地址
        • 安装
        • 引用
        • 源码解读
          • 支持类型
      • gjson
      • cron
      • sjson
    • Fyne

    • Wails

    • GoFrame

  • Dart

  • Markdown

  • 语言
  • GoLang
  • 第三方库
不器
2022-06-07
目录

colly

# colly库简介

Colly是一个用于构建Web scraper的Golang框架。使用Colly,您可以构建各种复杂的Web scraper,从简单的scraper到处理数百万个Web页面的复杂异步网站爬虫。 Colly提供用于执行网络请求和处理所接收内容的 API(例如,与 HTML 文档的 DOM 树交互)。

# 项目地址

gocolly/colly: Elegant Scraper and Crawler Framework for Golang (github.com) (opens new window)

# 安装

官网上说使用go get -u github.com/gocolly/colly但坑爹的是这玩意下载的版本是1.2.0

亲测应该使用go get -u github.com/gocolly/colly/v2

# 引用

github.com/gocolly/colly/v2

还是那样子,按官网来的话得到的是1.2.0的版本

以上坑爹的经验时间来自于2022/02/22版本号为2.1.0,至于未来是否改变自行测试

# 源码解读

# 支持类型

  • OnRequest 请求执行前调用
  • OnResponse 响应返回之后调用
  • OnHTML 监听执行selector
  • OnXML 监听执行selector
  • OnHTMLDetach 取消监听,参数为selector字符串
  • OnXMLDetach 取消监听,参数为selector字符串
  • OnScraped 完成抓取后执行,完成所有工作后执行
  • OnError 错误回调
  • Visit 正式启动访问
#GoLang#第三方库#colly
更新时间: 2023/2/10 09:50:10
path
gjson

← path gjson→

最近更新
01
Vue-pure-Admin基础
03-16
02
WebStorm工具使用手册
03-15
03
Windows
03-12
更多文章>
Theme by Vdoing | Copyright © 2022-2023 不器 | 小窝
sitemap icon by Icons8
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式