附件:
你需要登录才可以下载或查看附件。没有帐号? 注册 说明:本采集器目前支持百姓网,会陆续加入58赶集等分类网站。需要定制其它网站采集器,请联系QQ:251443403功能特色:可直接将图片保存到空间。
如果未设置采集信息所属的分类和地区,采集器将自动识别。
可过滤重复信息和电话黑名单信息
无需人工,采集器会自动检测被采集页面有无更新,更新后自动采集新的信息。
本次升级功能:获取内容不全
当分类名中有“\”时出错问题
以往升级功能2016-9-261、获取不到价格问题。2、采集有时无法获取到信息问题。3、优化了采集速度2016-8-18
1、解决采集一段时间后无法获取电话号码问题。
2、解决采集的内容中有问号和乱码问题。3、支持设置随机发布时间,让信息发布时间无规律,没有采集的迹象(设置随机采集间隔)。
4、设置参数记忆功能,不需要每次打开采集器都设置一遍。5、解决采集的内容在信息详细页面不换行问题。如何升级:
下载压缩包,解压覆盖上传即可。使用说明:下载后解压,把bin和cjq目录上传到网站根目录。
访问您的域名/cjq/,如
www.kfenlei.com/cjq/为防止他人恶意访问你的采集器,对你的网站注入其它地区的信息,您可以把cjq目录重命名成其它目录。
打开您当地的百姓网,打开您要采集的分类,如房产信息,点击下一页。
将浏览器地址栏的地址复制到采集器的采集地址中,需要把地址中的page=2换成page={p},这样采集器就会自动把{p}替换成每页的页码了
然后按照您的要求设置一下采集器,点击开始采集就可以了。
采集器设置的说明:
1、采集地址:就是您要采集的百姓网页面地址。
2、采集页数:是要采集的百姓网页面从每一页开始采集多少页。
3、随机采集间隔:设置采集每条信息之间间隔的随机时间。例:设置60-600。就是随机1至10分钟采集下一条信息。让每条信息的发布时间没有规律,没有采集的迹象。4、重采间隔:是当采集完成后,多少秒后重新采集。
5、分类:采集的信息所导入的分类。不设置会自动判断
6、所在地:采集信息所导入的所在地。不设置会自动判断
7、过滤重复:最好钩选,因为设置了采集间隔后,采集器会每隔一段时间采集一次。避免采集重复信息。
8、直接审核:采集的信息会直接为审核状态。
9、过滤电话黑名单:钩选后,不对采集电话号设为黑名单的信息。注:在后台 - 网站设置 - 安全设置中设置电话黑名单。
10、有效日期:采集的信息的有效天数。
使用巧门:您可以对当地百姓网的全部信息的页面进行采集,不设置采集的分类和地区,采集器会自动判断信息的分类和地区地址为:当地百姓网址/root/?page={p}&view=item 如北京:http://beijing.baixing.com/root/?page={p}&view=item