所有软件外包项目 Gray arrow bg 网页文本在线搜索项目需求(基于爬虫)

网页文本在线搜索项目需求(基于爬虫)

发包方 : Gggchen 接包方 : Mhz1600 状态 :项目验收中
项目编号 : 220265
项目预算 : ¥15,000-20,000
开发周期 : 30 天
技能 : PHP Python
发布日期 : 2016-05-06

描述

1、输入为单个或多个网站域名,从词库中选取词组(包括排除词、动词、形容词、名词和其他),输出为中标的疑似URL及网页摘要;
2、处理过程包括网站页面数据获取、分析处理及报表三大模块,处理的数据仅限文字,建议采取模块开发;
3、对监控词组设置请参考附件,本项目最核心程序包括爬虫效率及页面过滤分析算法效率,最终结果以准确率和时间效率来衡量;
4、为便于筛选合适的投标方,一期只要求对单个网站中所有网页页面标题对其分析检索即可,项目金额4000元。二期要求分析网页页面内容,项目金额12000元。

项目竞标

接包方 国家/地区
通过实名认证 拥有案例
4
Chenrongye
北京市
用户在智城存有保证金 通过实名认证 拥有案例
2
Mhz1600 (中标)

竞标

请您先登录,然后提交此项目的竞标方案。
还不是智城用户? 智城期待您的加入,请注册成为我们的一员吧!
Project ad2