iDatica – бесплатный парсинг данных
截图:
简介:
iDatica 是一个免费的网站解析器,可以自动从网站收集任何数据并将其保存到文件中。使用 iDatica 的解析器,您可以收集竞争对手的价格、潜在客户生成联系人、产品评论、图像链接等等。
可能性:
• 使用现成的数据收集模板;
• 分页解析目录——自动跳转到下一页;
• 解析产品名片和个人网址;
• 解析页面上的特定区域;
• 表格列的可定制视图;
• 预览收集的数据及其数量;
• 能够使用xPath 和CSS 样式;
• 可定制的页面转换速度;
• 能够在csv 中设置所需的分隔符;
• 查看进程日志。
有关解析器功能的更多信息:
模板 - 具有现成的解析设置的文件。您可以下载现成的设置并快速开始从所需站点收集数据,而无需任何事先配置。您可以将设置保存为模板。
使用分页解析目录 - 程序能够独立转到目录中的下一页,您只需要从第一页开始解析。
解析产品卡片和个人 url - 使用此选项,您可以跟踪所需的产品列表。
表格列的可定制视图 - 该程序允许您添加所需的列数并删除不需要的列。
预览所收集的数据及其数量 - 一种可让您快速评估解析设置正确性的工具。当您单击相应的按钮时,程序将显示它在您所在的页面上找到的数据及其编号。
能够使用 xPath 和 CSS - 您可以使用 xPath 查询语言和 CSS 选择器绑定到页面上的数据。如果您不熟悉 xPath 功能,请在信息部分查找我们的教程,您将在几分钟内了解基础知识,甚至能够在复杂站点上设置数据收集。
自定义页面转换速度 - 此选项允许您设置切换到新页面后开始解析的时间,这使您可以避免因频繁访问而被站点阻止,并有时间加载新页面。
在 csv 中设置所需分隔符的功能是一个方便的选项,允许您选择所需字符作为分隔符。
查看日志 - 一个信息字段,显示每个步骤、当前正在进行的页面解析、收集的元素数量等。
注意力!遵循目标站点有关自动数据收集的政策。