Wild Spider
0.0.3
2023-12-15
介绍
通过使用多个选项卡并行加载到浏览器中来抓取网页
注意:使用的选项卡越多,将使用更多的计算机资源(CPU、内存),并且每个页面都会花费一点磁盘来保存内容(在 IndexedDb 中,可从扩展 -> 检查视图:后台页面访问)。
“蜘蛛”是这样工作的:
1) 以当前 url 作为起点,并在新选项卡中再次加载。
2)该页面加载后,获取该页面上的所有链接。
3)获取页面上的所有链接,包括相对url。
4) 在所有使用的选项卡中并行打开提取的链接(默认为 3 个,在 eventPage 中设置)。
5) 重复2-4
所有源代码位于:https://github.com/nobodxbodon/ChromeCrawlerWildSpider
查看更多
收起
评分
1
共 1 位用户参与评分
使用人数
43+
插件大小
121KB
版本号
0.0.3
所属类别
生产工具
提供方
Xuan Wu
支持语言
美国英语)
更新时间
2023-12-15 19:03:18
ID
aanpchnfojihjddlocpgoekffmjkhbbe