所有软件外包项目 Gray arrow bg 爬虫项目-挖掘网红数据

爬虫项目-挖掘网红数据

发包方 : Pango_fabao 状态 :火热竞标中
项目编号 : 229192
项目预算 : ¥60,000-70,000
开发周期 : 30 天
技能 : Python
类别 : -
发布日期 : 2019-04-18
竞标后显示联系方式

描述

背景:
本项目为了向一家国际知名电影出品公司, 提供时下中国各网红平台内, 各个热门网红的数据, 交付对应数据 (如果接包方可以做报表更好)

网红数据的爬虫目的:
理想情况是建立起一个网红数据的database,每月或者每个季度更新数据,从而能够帮助今后的BD,并发布网红Index指数

网红数据的爬虫范围:
爬虫针对的网红人数:Top 200~1000人 (待讨论,可以与接包方确定, 原则上越多越好, 但不需要超过1000个网红)
爬虫的平台:抖音、美拍、B站、爱奇艺、腾讯、斗鱼直播、虎牙直播、微博、小红书(待讨论, 可选定3~5个平台范围)
爬虫的数据维度:粉丝数、点赞数、发布数、评论数、转发数、评论内容、弹幕内容(B站)、礼物个数(直播app)、视频时长、直播市场、post文数等(待讨论, 可选定一些指标, 具体可以由接包方定义, 原则上有几个关键指标, 比如粉丝, 点赞等等, 不能没有)

需要与接包方确定:
1. 网红人数
2. 平台和数据内容后
3. 以及爬虫执行时间
4. 是否能够提供爬虫的源代码,便于今后每月/每季度自行操作下载数据
5. 费用

一些问题(不是接包方的硬性要求):
1. 这些平台会定期修改自己的代码以防止爬虫, 接包方一般会如何应对

2. 考虑到网红数据可能存在虚假性,需要leverage资源来对获取的网红数据做进一步分析,包括数据验真,从而给到客户指导性意见,例如帮助他们挑选真正的网红来深入研究流量变现的商业模型,而不是选择了错误的网红导致分析结果有偏差, 这一点听取接包方的意见

附件是一个希望生成的单网红样例(生成效果只是参考, 具体优先要数据).

项目竞标

接包方 国家/地区
拥有案例
10
Bestpartner
成都市
通过实名认证
7
Zhangyuebb
北京市
拥有案例
5
Xisou
上海市
用户在智城存有保证金 拥有案例
5
Ittray
广州市
拥有案例
6
Liwei2017
成都市

竞标

请您先登录,然后提交此项目的竞标方案。
还不是智城用户? 智城期待您的加入,请注册成为我们的一员吧!
Project ad2