所有软件外包项目 定制一个python w...

定制一个python web网站下载器

发包方 : Zxn001 状态 :竞标已关闭
成员 统计 任务 工作报告 文档
项目编号 : 223361
项目预算 : 服务商报价
开发周期 : 7 天
技能 : Python
类别 : 应用软件开发 - 桌面应用
发布日期 : 2017-07-22

描述

类似:https://haojixing.tmall.com/
https://pouch.tmall.com/
用python写一个批量爬虫下载器
要求:
1.不需要下载js、css、图片,远程即可
2.下载域名下的二级页面包括html 保存到本地
3.生成html地图
4.每天自动某个时间根据规则爬取,有新页面,马上抓取
5.最好能够实现代理ip爬取
6.最好结合django可以控制(选项:爬取域名以及保存目录)
要有控制页面:最好可以实现批量管理
7.内置一些正则过滤部分代码
本人不是专业写的不是很清楚,请谅解
只要能做,价格是可以商议的。
URL:以https://haojixing.tmall.com/为例
https://haojixing.tmall.com/category.htm
https://haojixing.tmall.com/category-1251306560.htm
等等,保存的路径是要目标一致的

竞标

请您先登录,然后提交此项目的竞标方案。
还不是智城用户? 智城期待您的加入,请注册成为我们的一员吧!