企业🤖AI Agent构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
**首先采集器有浏览器插件采集,内置浏览器采集,批量采集三种,可根据需求选择不同的采集方式 其次采集是根据提供的产品链接去采集,该链接被分为两种情况,分别是产品详情页链接,产品列表页链接,两种链接情况如下:**<br> **产品详情页链接:所谓产品详情页链接即单个产品展示页面的链接地址,如下图所示** ![](https://img.kancloud.cn/0b/9a/0b9a93063a349b0dfeed23f947c55af5_1909x952.png)<br> **产品列表页链接:所谓产品列表页链接即多个产品展示页面的链接地址,如下图所示** ![](https://img.kancloud.cn/eb/4e/eb4eff7eb6528cf326930776c74514ec_1795x1020.png)<br> **一:浏览器插件采集** 使用浏览器插件采集,首先需在本地浏览器上安装插件(已安装可跳过),推荐使用谷歌浏览器安装插件使用,其他常用浏览器如360等均可安装插件使用,安装插件及采集步骤如下(以谷歌浏览器为例):<br> **(一)安装插件**<br> 1.如下图所示首先打开本地浏览器,找到扩展程序,找到后点击即可进入步骤2 ![](https://img.kancloud.cn/ce/3c/ce3c4efecc6cc8d4ea30508ee81cf720_1477x595.png)<br> 2.如下图进入扩展程序界面后,点击加载已解压的扩展程序即可进入步骤3 ![](https://img.kancloud.cn/d8/c4/d8c4d8c80bd247ce8aaa415a177b177a_1920x395.png)<br> 3.如下图在弹出界面中选择软件文件夹目录,随后选中Plugin文件夹,选中后点击选择文件夹按钮即可完成安装,若出现步骤4中图片展示即为安装成功,若未安装成功请删除重新安装 ![](https://img.kancloud.cn/bc/83/bc835ae91f6355b23067c043199d9dd3_1920x737.png)<br> 4.如下图即为安装成功 ![](https://img.kancloud.cn/df/6f/df6fa996f2a85c18f78ab67736f875f3_1920x456.png)<br> **(二)安装插件后采集**<br> 1.如下图,点击产品采集器按钮,随后进入步骤2 ![](https://img.kancloud.cn/d5/14/d514c7247a432090c0aa69b7d1b12995_1706x420.png)<br> 2.如下图在弹出界面中选择浏览器插件采集,随后点击勾选启用外部浏览器插件,若右上角提示“启动监听插件成功”字样,则直接进入步骤4开始采集,若提示“请以管理员身份运行[HttpListener.bat]脚本后重试”字样,则进入步骤3 ![](https://img.kancloud.cn/c3/1d/c31dc4f08a28ff17e7c0846bce5f48b4_1263x646.png)<br> 3.提示“请以管理员身份运行[HttpListener.bat]脚本后重试”字样,则说明监听启动失败,未获得权限需以管理员身份运行。详细步骤如下: 如下图所示打开本地软件包目录,随后进入Script文件夹 ![](https://img.kancloud.cn/a0/cf/a0cf101519ba33864e9fd50d7bc5d2ee_1018x196.png)<br> 如下图所示在进入Script文件夹后,找到HttpListener.bat文件,右键点击以管理员身份运行 ![](https://img.kancloud.cn/88/93/88933f3510b589fb152d65b85360e6cc_1015x418.png)<br> 弹出如下图所示窗口后,随后敲击键盘上任一按键,然后窗口会自动关闭,窗口关闭后则可回到步骤2启动监听 ![](https://img.kancloud.cn/a9/a4/a9a4a25bc6f62746b6ee1c8a8b5b752c_959x458.png)<br> 4.采集分为单个产品详情页采集和多产品列表页采集两种情况,具体步骤如下:<br> (1)单产品链接采集 如下图所示打开本地浏览器,访问要采集的单个产品详情页面(图中以速卖通为例),点击采集按钮,随后进入下一步 ![](https://img.kancloud.cn/1c/7a/1c7a6da2dcd1025b65df6da05ebed5b8_1653x806.png)<br> 如下图所示在弹出窗口中,点击确定即可创建该采集任务并完成采集,随后进入下一步 ![](https://img.kancloud.cn/3c/7c/3c7c06639c2ea8b81dc284846c1e300e_1257x640.png)<br> 如下图所示选中上一步创建的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/cf/04/cf0498cb963baa28bb405675c5376d04_1255x619.png)<br> 如下图所示查看确认数据都已采集到,随后勾选,选中后点击同步云端按钮,即可将采集到的产品信息上传到产品列表中,上传后可到产品列表查看该产品 ![](https://img.kancloud.cn/b7/80/b780541eba7b40bd67bd9ecd993d1e7d_1255x582.png)<br> (2)多产品列表页采集 如下图所示打开本地浏览器,访问要采集的产品列表页页面(图中以速卖通为例),随后勾选需采集产品,选中后点击开始采集按钮,随后进入下一步 ![](https://img.kancloud.cn/cf/b4/cfb43aae95109636c3e31007781c3dd0_1634x932.png)<br> 如下图所示在弹出窗口中,点击确定即可创建该采集任务,随后进入下一步 ![](https://img.kancloud.cn/3e/6d/3e6dfe837204e9555e28104c6e7fd936_1267x634.png)<br> 如下图所示选中上一步创建的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/23/54/23540bafa9922f207324e1debc473440_1264x610.png)<br> 如下图所示任务中产品只有基本信息,更多信息还需再次采集,选中产品后点击采集详情页按钮,随后进入下一步 ![](https://img.kancloud.cn/a7/01/a7018a400a55f5de45ab6d772f21f244_1255x622.png) 如下图所示产品信息都采集全后即可点击同步云端按钮将产品同步到产品列表 ![](https://img.kancloud.cn/f5/72/f572c976d51832634ff78da0698b2632_1255x635.png)<br> **二:内置浏览器模式采集**<br> 采集分为单个产品详情页采集和多产品列表页采集两种情况,具体步骤如下:<br> (1)单产品详情页采集<br> 如下图所示,点击产品采集按钮,随后进入步骤下一步 ![](https://img.kancloud.cn/e2/ad/e2adc3cf266274359f269225acb02d64_1709x178.png)<br> 如下图所示,将需采集的产品链接地址复制到URL输入框中(图中以Alibaba平台产品为例),随后点击转到,待页面跳转完成后,点击分析按钮即可进入下一步 ![](https://img.kancloud.cn/5d/dc/5ddc735ae88b1b629f11769b1d042e7b_1254x670.png)<br> 如下图所示,在弹出窗口中,点击确定即可创建该采集任务,随后进入下一步 ![](https://img.kancloud.cn/e4/75/e475a38c5ed6370509013494cf9163dd_1275x659.png)<br> 如下图所示,选中上一步创建的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/1c/41/1c4179d8f5a802c4c979474ed4a512e6_1265x617.png)<br> 如下图所示,查看确认数据都已采集到,随后勾选,选中后点击同步云端按钮,即可将采集到的产品信息同步到产品列表中,同步后可到产品列表查看该产品 ![](https://img.kancloud.cn/c3/eb/c3eb424b150995cd748aeaa826d22185_1261x623.png)<br> (2)多产品列表页采集 如下图所示,点击产品采集按钮,随后进入步骤下一步 ![](https://img.kancloud.cn/e2/ad/e2adc3cf266274359f269225acb02d64_1709x178.png)<br> 如下图所示,将需采集的产品列表页链接地址复制到URL输入框中(图中以Alibaba平台产品为例),随后点击转到,待页面跳转完成后,点击分析按钮即可进入下一步 ![](https://img.kancloud.cn/85/27/8527980a288b905e582db413b2bc8ea2_1263x641.png)<br> 如下图所示,在弹出窗口中,点击确定即可创建该采集任务,随后进入下一步 ![](https://img.kancloud.cn/5e/41/5e418c95328293b95583c82250a7f523_1262x639.png)<br> 如下图所示,选中上一步创建的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/8f/8f/8f8f8931f03ddb7cdaf94c6060d5f2e3_1260x585.png)<br> 如下图所示,任务中产品只有基本信息,更多信息还需再次采集,选中产品后点击采集详情页按钮,随后进入下一步 ![](https://img.kancloud.cn/4b/be/4bbef09352e4059d5eb1fa7b19034065_1263x617.png)<br> 如下图所示,产品信息都采集全后即可点击同步云端按钮将产品同步到产品列表 ![](https://img.kancloud.cn/e8/b4/e8b487d0a62341164e6f962e7cc6f73c_1253x616.png)<br> **三.批量采集**<br> (一)多个产品列表页采集<br> 如下图所示,点击产品采集按钮,随后进入步骤下一步 ![](https://img.kancloud.cn/e2/ad/e2adc3cf266274359f269225acb02d64_1709x178.png)<br> 如下图所示,点击批量采集,进入批量采集界面后,录入任务名称-->随后选择需采集产品对应的平台(图中以速卖通链接为主)-->随后将需采集的产品列表页链接粘贴至列表页网址输入框中-->设置需采集页数(注:该页数不可以超过链接本身最大页数)-->信息录入完成后点击新增按钮即可进入下一步 ![](https://img.kancloud.cn/4d/17/4d17fdd1ee67fc596f23ca8aa964ac53_1263x620.png)<br> 如下图所示,勾选上一步创建的采集任务,点击开始抓取按钮即可采集,采集完成后进入下一步 ![](https://img.kancloud.cn/24/45/2445d1f88a4ff8e6ef7b9573a75e69aa_1262x633.png)<br> 如下图所示,选中采集完成的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/d4/e7/d4e709f48609b9fee6613f4346ffd692_1256x638.png)<br> 如下图所示,查看确认数据都已采集到,随后勾选,选中后点击同步云端按钮,即可将采集到的产品信息同步到产品列表中,同步后可到产品列表查看该产品 ![](https://img.kancloud.cn/41/26/4126e328ccac795c3b1c0c9487e5e67a_1258x628.png)<br> (二)单个产品详情页采集<br> 批量采集器主要针对多产品列表页链接采集,如需使用批量采集采集单个产品详情页链接,步骤如下: 如下图所示,将需采集的单个产品链接都放入一个记事本中,格式一行一个链接(图中以速卖通产品链接为例),随后进入下一步 ![](https://img.kancloud.cn/f5/54/f554c8e130356377d178130225e9d79d_1367x500.png)<br> 如下图所示,打开批量采集界面,录入任务名称-->随后选择需采集产品对应的平台-->随后选择导入url选项-->随后选择上一步创建的采集记事本-->点击新增按钮即可进入下一步 ![](https://img.kancloud.cn/27/a4/27a43b578fd23e2fb5b5b44ff2b45063_1268x611.png)<br> 如下图所示,勾选上一步创建的采集任务,点击开始抓取按钮即可采集,采集完成后进入下一步 ![](https://img.kancloud.cn/77/25/7725301590a39018eb3d1502eba0371a_1261x632.png)<br> 如下图所示,选中采集完成的采集任务,随后点击管理选中任务已采集数据按钮,随后进入下一步 ![](https://img.kancloud.cn/2d/15/2d1504066c1f8385df9590ae32431775_1251x633.png) 如下图所示,查看确认数据都已采集到,随后勾选,选中后点击同步云端按钮,即可将采集到的产品信息同步到产品列表中,同步后可到产品列表查看该产品 ![](https://img.kancloud.cn/2d/15/2d1504066c1f8385df9590ae32431775_1251x633.png)<br>