一、项目概述
需要一款微博数据爬虫软件,针对一些特定微博账号内容--图片+文字数据进行爬取。
二、性能指标
1、可多线程并行爬取数据,并发的任务数量在10个以上。
2、保证搜索数据的全面性、准确性、时效性。
三、接包方必备的条件
1、有相关项目经验(重要),熟悉常见微博网络爬虫及搜索,页面信息抽取等技术。对产品设计有很深的理解。
2、开发及测试周期:一周。周期结束后需要提交测试后的软件。要求接包方时间相对灵活,沟通方便。
3、最好有成功案,可以试用。
4、所使用的编程语言应是当前Java和Python(或其他主流语言),软件代码应简洁、高效且注释详细准确,在Linux或mac系统平台上能够稳定运行,兼容性好。
5、交付的软件,不能有致命Bug、后门、恶意代码等。
6、提供全套完整的源代码。
如果您符合我们的要求并有意向合作,可加QQ(请注明微博爬虫)。详细功能和所需插入的数据库我方可另提供。