·进入以前版本帮助
·官方站
·技术论坛
·演示中心
·域名主机
·智能建站系统
·商业版本购买
·关于我们

四川成都武侯区惠民街109号A座8层1-34、36
邮编:610041
电话总机:028-85098980; 028-66026180; 028-82105266
产品咨询:602, 代理合作:601
技术支持:607, 项目开发606
网站建设:609, 客服:608
市场支持:605,028-82105266
网站建设:028-85098980/605,028-82105266, 传真603
电子邮件:service@foosun.cn, office@foosun.cn, MSN:foosun0@hotmail.com
 
专题导航:新手入门系统操作模板制作标签使用高级使用采集系统
搜索
位置:首页>>常见问题>>正文
3.1采集容易出错的几个地方的设置说明
属性:2005-11-1 下午 02:16:40||

3.1的采集增加了模糊匹配查询的功能,

从发布以来大家使用后反映问题来看,

我特总结几点做特别说明(以后发现更多情况再继续补充):

一、采集条数设置后导致下标越界的问题

出现这个问题是因为设置的采集条数过大,已经大于了目标页面的实际新闻条数,如果要采集的新闻是整个目标页面的新闻,请不要填写条数,直接点击确定就是了,默认是全部采集对象页的全部符合条件的新闻。

二、无法读取新闻列表的问题

新闻列表在3.1里面设置是非必须的,即可以不设置,默认是全页面(在<body和</body>之间)匹配符合条件的新闻地址。但是我们建议您设置一下采集“新闻列表”,那样可以加快采集速度,并且给你设置“列表URL”带来方便。设置的时候请注意开始标记的唯一性,结束标记也建议设置成唯一的,如果设置中有不方便的情况,可以使用“[变量]”代替一下不确定的字符,可以设置多个“[变量]”。

三、采集目标地址在页面中是相对路径的问题

其实这个不算是个问题,因为我们系统会判断是相对路径和绝对路径的,相对路径在采集的时候也会补充完整的!对采集没有影响!

四、采集分页的问题

采集新闻对象页分页这里不说了,请看教程和录像;采集新闻内容分页,请设置具有“下一页”标记的地方,取得“下一页”指向的地址,如果只有第一页,第二页,第三页等,无法确定下一页标记的页面,内容分页暂时是不能采集的,除非如当前页是第二页,“第二页”标记是没有加超连接的,那样可以寻找这样没有加超连接的下一个标记就是下一页。总之,必须要准确取出“下一页”的URL地址才能使用内容分页采集。

内容分页还有一个技巧,一般当前页都是红色显示,并且没有加超连接,有了这个规律就直接找他的下面一个部分就可以了。举例说明请看:http://bbs.foosun.net/dispbbs.asp?boardID=24&ID=13551&page=1

五、对续采的说明

续采新闻需要在前面采集有记录的情况下进行,并且要和采集顺序相同,如果采集是顺序采集,在续采的时候改成了倒序采集,续采是进行不下去的。如果采集对象也更新很快,前一次采集比较久了,采集记录比采集对象页老的情况下续采将无法确定前一次采集的结束点,建议使用正常的采集。续采没有采集条数的设置。

六、目标页采集回来出现乱码的问题

那是目标页编码方式和采集默认编码方式不一样导致的,我们默认是采集GB2312,在采集UTF-8等编码方式会出现乱码,需要修改collect/inc/function.asp里面第二个函数对编码方式的设置,采集完成后请修改回GB2312,因为现在的中文网页绝大部分是使用GB2312的。

七、远程存图和存FLASH的问题

如果在站点选项里面设置了保存远程图片,在采集时会将新闻页面的图片和FLASH采集到本地你设置的保存文件的目录里面,并将页面对应的图片和FLASH地址替换成你现有的本地路径,如果不保存远程图片,也会将图片和FLASH连接地址替换成绝对的,所以不用担心采集回来有相对路径的显示问题。

八、其他一些不能采集的情况

请注意红色显示的报错信息,比如标题失败,内容失败等,请检查相应部分的设置,在不熟悉的情况下多修改几次,你一定能采集成功的!

九、类型不匹配: 'UBound' 错误发生的原因和修改办法

出现这种情况是因为你的"新闻URL"设置前后都包含了"[变量]",无法取得新闻URL的数组,所以出现你们那样的情况。

在其他设置部分可以前后都包含"[变量]",只有新闻URL由于其特殊性,只能前后一部分包含变量。

如这种情况会出现以上错误:

<font [变量]><a href=[新闻URL]>[变量]</a>

修改方法:将"[新闻URL]"前面或者后面的"[变量]"删除一个!

修改为:><a href=[新闻URL]>[变量]</a><font [变量]>或者:<a href=[新闻URL]>

只要内容列表设置合理,取新闻URL的时候是很好定位的。

还有一些地方需要自己体会,有问题欢迎上论坛我们大家讨论!

 


Copyright 2002-2005 Foosun,Inc.           Powered by FoosunCMS3.1.0930