苏州工业园区质安监站网址,帝国cms怎么做网站地图,一学一做腾讯视频网站吗,怎么免费做网站不要域名转载请标记本文出处 软件#xff1a;tableau、pycharm、关系型数据库#xff1a;MySQL 数据大量分析考虑电脑性能的情况。 文章目录前言一、爬虫是什么#xff1f;二、使用tableau数据可视化1.引入数据1.1 制作直方图-各地区酒店数量条形图1.2 各地区酒店均价1.3 价格等级堆… 转载请标记本文出处 软件tableau、pycharm、关系型数据库MySQL 数据大量分析考虑电脑性能的情况。 文章目录前言一、爬虫是什么二、使用tableau数据可视化1.引入数据1.1 制作直方图-各地区酒店数量条形图1.2 各地区酒店均价1.3 价格等级堆积柱形图2.分析数据总结前言
仅供学习参考 一、爬虫是什么 爬虫是一个自动提取网页的程序。 爬虫一段自动抓取互联网信息的程序从互联网上抓取对于我们有价值的信息。 二、使用tableau数据可视化
1.引入数据 将execl表格中的数据导入到tableau当然有人肯定会说我用sql不可以吗直接count * from 酒店数据表 group by 地区/城市。通过分组统计简单数据还可以级联查询但制作出来的表是我们再MySQL中用命令行输出的。故本文提出用tableau来实现当然有一些也可以用execl来实现。
1.1 制作直方图-各地区酒店数量条形图 重要的事情放前面所以我们选择降序来处理。
同时建议将数据的值显示出来。
同时我们通过交换行列让数据显示的更清晰。 上面这个试图我们发现有部分数据并没有完全显示出来是因为我们没有选择整个视图。将“标准”改为“整个视图”。
1.2 各地区酒店均价 由此可以看出中西区的酒店平均价格偏高可能多一些五星级的酒店而其他地区的酒店均价都在一定区间浮动。元朗区这些地方的酒店比较便宜。
1.3 价格等级堆积柱形图 由图中我们可以看出香港酒店的价格等级的堆积图油尖旺地区价格等级为C的比较多中西区酒店价格等级为A的比较多而湾仔ABC三种价格等级的酒店都比较平均。
2.分析数据 数据预处理的话tableau还是比较弱的。还是采用Python或R来预处理会更佳 可以看出香港油尖旺地区价格等级为C的酒店比较多同时也可以发现油尖旺酒店数量比较多。 总结
以上就是今天要讲的内容本文仅仅简单介绍了tableau的使用而tableau提供了大量能使我们快速便捷地处理数据的工具和方法。