需要做一个微信公众号实时抓取的应用。
1 监测公众号数量:500+,无上限,用户自定义增删
2 范围:实时抓取图文(更新频率1小时以内)、阅读量、发布时间
3 功能
a)根据标题含有的关键词,自动分类,自动标签
b)可按阅读量从高到低排序,也可按全文搜索标签、关键词,可搜索查看某一公众号
c)计算抓取时该图文已发布多少分钟,并用抓取时的阅读量除以时间,获得“传播速度”,可以对图文按“传播速度”排序。
d)页面做成“自适应”页面,手机也可浏览。
4 实现方法
因搜狗经常时间滞后,故建议,用[服务器模拟手机点击]的方式,获得最新的微信公众号内容。
5 要求
希望有经验者投标,并要有防封ip的方案。