苏州本地网站,抖音seo推荐算法,创客贴网页设计网站,网络项目设计方案基于新浪微博海量用户行为数据、博文数据数据分析#xff1a;包括综合指数、移动指数、PC指数三个指数 项目介绍 微指数是基于海量用户行为数据、博文数据#xff0c;采用科学计算方法统计得出的反映不同事件领域发展状况的指数产品。微指数对于收录的关键词#xff0c;在指…基于新浪微博海量用户行为数据、博文数据数据分析包括综合指数、移动指数、PC指数三个指数 项目介绍 微指数是基于海量用户行为数据、博文数据采用科学计算方法统计得出的反映不同事件领域发展状况的指数产品。微指数对于收录的关键词在指数方面提供微博数据层面的指数数据包括综合指数、移动指数、PC指数三个指数。 项目举例 以‘中兴’这一关键词为例要求获取中兴的三个指数数据。微指数的数据收录时间有范围范围表现在 1整体趋势2013-03-01-至今 2移动趋势2014-01-06-至今 3PC趋势2014-01-06-至今 本例子设定start_date ‘2016-05-29’end_date ‘2018-05-29’ 原始结果如下
1.原始综合指数 2. 原始移动/pc指数 实现流程 主函数def index_main(self, word, start_date, end_date):# 打开数据页面print(step1, open page....)3driver self.search_index(word)# 构造请求获取指数json数据print(step2, get data....)data self.get_data(driver, start_date, end_date)# 判断数据返回类型若微博没有收录改词则退出显示退出信息if data[zt]:print(step3, save data ...)self.output_data(word, data)print(finished....)else:print(not be record...)#关闭浏览器对象driver.close()执行 def demo():start_date 2016-05-29end_date 2018-05-29sina SinaIndex()search_word 中兴sina.index_main(search_word, start_date, end_date)demo()3.效果展示
将得到的数据文件进行本地可视化效果如下
3.1 综合指数 3.2 移动指数 3.3 PC指数 3.4指数对比 5.总结
1、微指数的采集难度介于百度指数与阿里指数之间两个特点1)指数有js动态请求而成可以通过构造请求解析获得。2)无需用户登录。 2、微指数收录的日期比阿里指数要广较百度指数要窄但基于微博这一层面得到的数据对于相关研究还是有一定新意的。
项目码源见文章顶部or文末
https://download.csdn.net/download/sinat_39620217/88000970