所有软件外包项目 Gray arrow bg 豆瓣爬虫

豆瓣爬虫

发包方 : Jacobm 状态 :竞标已结束
项目编号 : 179934
项目预算 : ¥1,000-3,000
开发周期 : 14 天
技能 : Python
发布日期 : 2014-07-23

描述

项目描述:
为了更好的了解网络用户购物行为,需要积累用户与商品的互动行为数据,以便进行相关大数据分析。豆瓣网“东西”部分的公开数据很具有代表性,请编写一个网络爬虫将这部分数据抓下来。

基本要求:
0. 鼓励使用敏捷开发流程(Agile),开发期间可将我们视作用户随时进行沟通。
1. 编程语言:Python
2. 数据库:NoSQL,时下流行的任选一个或多个
3. 设计:OOP,需考虑扩展性,各个模块尽量做到高聚合低耦合
4. 数据结构自行设计,兼顾统一性和实用性
5. API 可以给出用户之间关注被关注关系;用户与物品之间发布关系,关注关系,喜欢关系;物品之间的豆列属性;物品之间通过“相关的东西”表现的相关度等
6. 用户基本信息完整,不泄露个人隐私。
7. 物品基本信息完整,不需要保存图片。
8. 快速,稳定。
9. Finish in two-man-week maximum.

项目竞标

接包方 国家/地区
通过实名认证 拥有案例
5
Wenx
通过实名认证 拥有案例
3
Shinelight
成都市

竞标

请您先登录,然后提交此项目的竞标方案。
还不是智城用户? 智城期待您的加入,请注册成为我们的一员吧!
Project ad2