Tsys OkHtm.com修改版数据采集方法

采集功能

[1]分类管理

a 添加一个频道

upload/200511/14_201951_1.jpg


b 频道(点击进入栏目管理)

upload/200511/14_202156_2.jpg


c 添加新栏目

upload/200511/14_202258_3.jpg



[2] 项目管理

a 添加新项目

upload/200511/14_202519_4.jpg


项目名称: 填写采集的项目名称,便于自己以后管理
所属频道: 请选择采集的频道
所属栏目: 请选择所属于的栏目
所属专题: 不属于任何专题
网站名称: 自己用来采集的对象网站名称
网站网址: 自己用来采集的对象的地址
网站登录: 不需要登录 设置参数
登录参数: 需要登录才能访问的请设置登录参数(不支持验证码登录)
提交地址:点击 登录 按钮后用来验证用户名、密码的文件网址,如动力3.62的
是 http://www.****.com/Admin_ChkLogin.asp。
用户(密码)参数:查看登录表单源码,找到形如下面之类的代码
用户名:<input type="text" name="UserName" value="">
密码:<input type="password" name="Password" value="">
用户参数就是--第一行的name=后面的UserName
密码参数就是--第二行的name=后面的Password
失败信息: 用户名或者密码不正确时,登录后的失败提示信息,用于判断登录是否成功的一个标志,请一定要填写,否则不能采集,比如:您输入的用户名或密码不正确,请重新输入!
项目备注:该项目的其它要记录的信息,以后每天都要采集

b 列 表 设 置

upload/200511/14_203032_4.jpg


Quote
列表就像一本书的目录,目录可以有一页,也可以有很多页,列表也一样。

列表索引页面:

你要开始采集的列表页。

列表开始/结束标记:

平面上的两点确定一条直线,学过几何吧?用在这里是一样的道理,开始/结束标记可以确定你要采集的新闻,有的这里没有设置好结果采集到其它新闻去了。
比如这是某一列表页面的主要部分代码:
<table width="98%" border="0" cellspacing="0" cellpadding="3">
<tr>
<td align="left" valign="top"><br>
<a href="News.asp?id=1" target=_blank>新闻标题</a><br>

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/3028.html