WebCollector:二次开发的JAVA爬虫框架(内核)

WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。

相关的项目 - 更多比较

381 7.2k 1.7k

J jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
 
10.0 2.5
  12天前
122 861 464

G Gather Platform 数据抓取平台是一套基于Webmagic内核的,具有Web任务配置和任务管理界面的数据采集与搜索平台.
 
3.0 0.0
  2年前
17 381 103

J jerryWebSpider是一个java爬虫实例集合,基于springboot构建,目前内含对tuwan网妹子图的爬虫。
 
1.7 0.2
  1月前