地方互联网创业交流论坛 - 框分类信息系统

注册

 

发新话题 回复该主题

[资源下载] 采集器 1. 31 下载地址及说明 2016-11-1更新 [复制链接]

1#
附件: 你需要登录才可以下载或查看附件。没有帐号? 注册


说明:本采集器目前支持百姓网,会陆续加入58赶集等分类网站。需要定制其它网站采集器,请联系QQ:251443403

功能特色:
可直接将图片保存到空间。
如果未设置采集信息所属的分类和地区,采集器将自动识别。
可过滤重复信息和电话黑名单信息
无需人工,采集器会自动检测被采集页面有无更新,更新后自动采集新的信息。


本次升级功能:
获取内容不全
当分类名中有“\”时出错问题

以往升级功能
2016-9-26
1、获取不到价格问题。
2、采集有时无法获取到信息问题。
3、优化了采集速度
2016-8-18
1、解决采集一段时间后无法获取电话号码问题。
2、解决采集的内容中有问号和乱码问题。

3、支持设置随机发布时间,让信息发布时间无规律,没有采集的迹象(设置随机采集间隔)。
4、设置参数记忆功能,不需要每次打开采集器都设置一遍。
5、解决采集的内容在信息详细页面不换行问题。

如何升级:
下载压缩包,解压覆盖上传即可。


使用说明:
下载后解压,把bin和cjq目录上传到网站根目录。



访问您的域名/cjq/,如www.kfenlei.com/cjq/
为防止他人恶意访问你的采集器,对你的网站注入其它地区的信息,您可以把cjq目录重命名成其它目录。



打开您当地的百姓网,打开您要采集的分类,如房产信息,点击下一页。




将浏览器地址栏的地址复制到采集器的采集地址中,需要把地址中的page=2换成page={p},这样采集器就会自动把{p}替换成每页的页码了





然后按照您的要求设置一下采集器,点击开始采集就可以了。



采集器设置的说明:
1、采集地址:就是您要采集的百姓网页面地址。
2、采集页数:是要采集的百姓网页面从每一页开始采集多少页。
3、随机采集间隔:设置采集每条信息之间间隔的随机时间。例:设置60-600。就是随机1至10分钟采集下一条信息。让每条信息的发布时间没有规律,没有采集的迹象。
4、重采间隔:是当采集完成后,多少秒后重新采集。
5、分类:采集的信息所导入的分类。不设置会自动判断
6、所在地:采集信息所导入的所在地。不设置会自动判断
7、过滤重复:最好钩选,因为设置了采集间隔后,采集器会每隔一段时间采集一次。避免采集重复信息。
8、直接审核:采集的信息会直接为审核状态。
9、过滤电话黑名单:钩选后,不对采集电话号设为黑名单的信息。注:在后台 - 网站设置 - 安全设置中设置电话黑名单。
10、有效日期:采集的信息的有效天数。




使用巧门:

您可以对当地百姓网的全部信息的页面进行采集,不设置采集的分类和地区,采集器会自动判断信息的分类和地区
地址为:当地百姓网址/root/?page={p}&view=item 如北京:http://beijing.baixing.com/root/?page={p}&view=item
本主题由 管理员 yyg 于 2016-2-8 1:35:42 执行 设置高亮 操作
分享 转发
TOP
2#

支持好东西需要
TOP
3#

采集终于出来了!给老大点个赞!
贵阳信息网-贵阳地区最大的免费信息发布平台
http://www.1230851.com
TOP
4#

欢迎欢迎
[满扎信息网  www.m0470.com
TOP
5#

神器
西海岸信息网 www.xihaianba.com
TOP
6#

TOP
7#

支持支持
TOP
8#

好东西~支持一下~~~~~顶~~~www.960427.net
【盘锦便民信息网】盘锦本地最专业的信息免费发布网站!http://www.960427.net
TOP
9#

有问老大, 采集器只能采集baixing.com 网的信息吗?
能采集其他信息网站的信息吗
最后编辑kkff 最后编辑于 2016-02-08 16:50:51
TOP
10#

采集后的信息 里面 带很多的  问好  (?)
TOP
发新话题 回复该主题