项目描述:
为了更好的了解网络用户购物行为,需要积累用户与商品的互动行为数据,以便进行相关大数据分析。豆瓣网“东西”部分的公开数据很具有代表性,请编写一个网络爬虫将这部分数据抓下来。
基本要求:
0. 鼓励使用敏捷开发流程(Agile),开发期间可将我们视作用户随时进行沟通。
1. 编程语言:Python
2. 数据库:NoSQL,时下流行的任选一个或多个
3. 设计:OOP,需考虑扩展性,各个模块尽量做到高聚合低耦合
4. 数据结构自行设计,兼顾统一性和实用性
5. API 可以给出用户之间关注被关注关系;用户与物品之间发布关系,关注关系,喜欢关系;物品之间的豆列属性;物品之间通过“相关的东西”表现的相关度等
6. 用户基本信息完整,不泄露个人隐私。
7. 物品基本信息完整,不需要保存图片。
8. 快速,稳定。
9. Finish in two-man-week maximum.
接包方 | 国家/地区 | |
---|---|---|
5
Wenx
|
||
3
Shinelight
|
成都市 |