WebCollector:二次开发的JAVA爬虫框架(内核)

WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。

相关的项目 - 更多比较

307 3.4k 1.7k

C crawler4j是Java实现的开源网络爬虫。提供了简单易用的接口,可以在几分钟内创建一个多线程网络爬虫。
 
10.0 1.7999999999999998
  1月前
119 818 439

G Gather Platform 数据抓取平台是一套基于Webmagic内核的,具有Web任务配置和任务管理界面的数据采集与搜索平台.
 
2.8000000000000003 0.0
  1年前
15 315 82

J jerryWebSpider是一个java爬虫实例集合,基于springboot构建,目前内含对tuwan网妹子图的爬虫。
 
1.7999999999999998 4.3
  昨天