当前位置: 首页 > news >正文

一个备案号可以用几个网站微营销工具有哪些

一个备案号可以用几个网站,微营销工具有哪些,wordpress 本地运行,html评论页面模板TMDB电影数据分析#xff08;下#xff09; 本文对源自Kaggle TMDB电影数据集进行分析影响电影票房的因素#xff0c;数据分析流程包含数据集概分析、数据清洗、数据统计以及分析影响电影票房的因素。影响票房因素可能是电影预算、电影类型、电影时长、受欢迎程度、电影评分…TMDB电影数据分析下 本文对源自Kaggle TMDB电影数据集进行分析影响电影票房的因素数据分析流程包含数据集概分析、数据清洗、数据统计以及分析影响电影票房的因素。影响票房因素可能是电影预算、电影类型、电影时长、受欢迎程度、电影评分发行时间等有关系通过具体数据进行分析影响票房的因素。 数据集概分析 以及 数据清洗 接上文TMDB电影数据分析上 数据统计 1、查看收入前十的电影信息 初步猜测影响电影收入的因素是电影预算电影类型上映年份电影时长评分参与评分次数受欢迎程度等。下面我们找出电影收入最高的前十部电影的基本信息。 第一行代码调用sort_values()方法针对revenue字段进行降序排列并取前10行记录赋值给top10变量。该变量的值是一份DataFrame表格一共有11行第一行是列标题剩下10行是电影收入排名前十的电影信息。第二行代码输出top10表格中的buget、genres、original_title等字段结果发现电影收入排名前十的电影预算相对高genres字段中id为12、name为Adventure的电影和id为28、name为Action的电影占比较大release_date字段中显示上映年份基本分布在2000年后vote_count字段表明参与评分次数相对充足从vote_average字段看出收入高的电影评分不低而popularity字段显示高收入电影的受欢迎程度。 2、计算收入与其他字段相关系数 第一行代码在原数据集中增加一个release_year字段数据集中提供了电影上映日期但release_data字段值的数据类型不是日期类型使用DataFrame的to_datatime()函数将指定格式转为日期格式使用year属性获取日期中的年份作为新增字段的值。为了验证猜测第二行代码中调用DataFrame的corr()函数计算budget、release_year、runtime、popularity、vote_average、vote_count等字段与revenue电影收入字段的相关性获取发现revenue字段与budget、popularity及vote_count字段相关系数分别为0.70、0.60及0.76具有高相关性revenue字段与runtime、release_year、vote_average字段相关系数分别为0.23、0.14、0.18具有低相关性。 3、查看电影年份分布 首先调用DataFrame中的value_counts()方法对release_year字段值进行频数统计得出各个年度发行的电影数量数据集中电影发行年份自1916年起包含89个年份的电影信息。 通过绘制直方图直观看出电影在各年度的分布情况如下图所示。 从图中可以看出电影发行年份集中在2000-2016年之间。 4、查看电影时长分布 统计不同时长电影的数量通过数据可以看出数据集中记录的电影时长总共有136个以及不同时长电影的数量。 通过直方图可以直观看出电影时长集中分布在80-130之间其中时长在90-110的电影数量占比较大。 5、查看预算分布 数据集中低预算电影占比较大预算集中在0至0.5x108 6、查看评分分布 电影的评分集中分布在5-7分 7、查看评论次数分布 数据集中绝大多数电影评论次数低于2000其中评论次数在500以内评论次数占比最大。 影响收入的因素分析 1、绘制电影收入与影响因子散点图 下面的代码绘制budget、release_year、runtime、popularity、vote_average、vote_count等字段与revenue字段的散点图。Matplotlib.pyplot模块参数可用plt.rcParams[‘配置参数’][修改值]进行修改默认配置rcParams即run configuration parameters运行配置参数。第一行代码修改配置参数中的字体font为黑体SimHei是为了在图中可以正常显示中文。第三行代码使用Matplotlib.pyplot模块提供的subplots()函数返回一个元组包括一个图形对象和所有的axes对象作为元素的ndarray对象ndarray是2行3列的矩阵每一个axes对象通过索引进行访问索引下标从0开始。为每一个axes对象调用scatter()方法绘制散点图并调用set_title()方法为每个axes对象增加标题。完成子图绘制后代码第7行调用suptitle()方法为fig对象增加一个标题。效果如下图所示 上图的第一行标题为budget、popularrity、vote_count的三个子图能更可以直观看出budget、popularrity、vote_count字段与revenue字段呈线性分布意味着随影响因子增长收入整体均呈增长趋势。而第二行标题为vote_average、runtime、release_year的三个子图表明vote_average、runtime、release_year字段与revenue字段没有明显的线性关系。 2、分组分析电影收入与影响因子的关系 由于电影发行时间集中在2000年以后为了更好研究影响电影票房的因素我们针对2001年至2015年发布的电影数据做进一步分析。 首先提取出发行年份在2001年至2015年的所有电影保存到movies中筛选后数据还有2103条记录。 电影中数据记录了2001至2015总共15年的电影数据时间跨度可能会相对大一些按照年份进行分组以每5年作为一组将电影数据分成三组针对每一组数据分析影响电影票房的因素。 接下来使用cut()方法将电影票房按照四分位点划分为四个等级分别为’Low’, ‘Medium’, ‘Moderately High’, ‘High’也即“低”、“中下”、“中上”和“高”。 划分等级后按照revenueclass、 fiveyearclass字段对数据进行分组取出各组数据的中位数保存到变量d_summary中。 按年份分组后得到三组数据分别为‘2001-2005年’‘2006-2010年’‘2011-2015年’针对每一组数据进行分析随着收入越高对应的预算越高受欢迎程度越高评论次数越多电影时长、评分情况表现不明显。下面通过绘制条形图可以更直观的显示影响收入的因素。 下面代码调用matplotlib.pyplot模块中bar()函数绘制电影收入与预算、受欢迎度、评论次数、评分、时长、发行年份之间关系的条形图。 上图中含有6幅图图中横坐标表示收入等级纵坐标表示影响因素针对每一幅图同一收入等级中有三根柱子从左向右以此表示为第一个5年数据即2001至2005年电影数据第二个5年数据即2006至2010年电影数据第三个5年数据即2011至2015年电影数据。第一行分别绘制收入与预算条形图、收入与受欢迎程度条形图、收入与评论次数条形图。从收入与受欢迎程度图像可以看出三组5年数据每一组数据均是当电影票房高时对应受欢迎程度也高当收入处于同一个等级时随着时间的推移电影受欢迎程度略微增高可能电影受欢迎层度受时间影响间接影响着电影票房。 针对收入与预算条形图对于每一组年份预算对票房的影响比较明显收入高的电影对应预算也高即随着预算增加电影票房也增加。说明投资方在制片质量上具有保障性外加对影片宣传力度大使票房得以提高。另外针对收入等级相同时预算投入与时间没有直接关系说明不会因为当时时代背景而影响电影预算投入。 针对收入与评论次数条形图电影票房受评论次数影响比较大参与评论的次数多的电影电影票房高。 第二行分别绘制收入与评分条形图、收入与时长条形图、收入与年份条形图。从这三幅条形图可以看出电影收入与电影评分、电影时长、电影发行年份的关联度不明显。说明评分高低、时长长短及上映年份与电影收入无关。 3、分析电影类型对电影收入的影响 由于每一部电影类型可以兼有多种类型数据集中genres字段值是以字典数据类型给出。定义一个counttype函数以数据集作为参数使用for循环遍历genres字段数据函数返回值为以电影类型为键电影类型数量为值构成键值对的字典。 针对数据集数据统计各种类型电影数量将统计结果绘制成条形图可以更直观查看不同类型电影数量发现Drama、Comedy是占比最多的。 按照受欢迎程度进行排序提取最受欢迎前100部电影。并统计最受欢迎的100部电影不同类型占比。由于每一部电影类型可以兼有多种类型数据集中genres字段值是以字典数据类型给出。使用for循环遍历genres字段数据并以电影类型为键电影数目为值构成的键值对作为元素存储到moviestype字典中得到最受欢迎前100部电影不同类型的数量。 100部最受欢迎电影中其中Adventure类型和Action类型占比较高。猜测Adventure类型和Action类型是最受欢迎的两类电影电影类型会影响电影受欢迎程度。 针对不同收入等级统计电影类型出现频数并提取频数最多的前5种类型电影绘制条形图效果如下 Action、Adventure、Drama、Comedy、Thriller等类型电影在收入不同等级中占比都很高考虑到Drama、Comedy在整体电影类型占比中基数比较大可以猜测电影类型对电影票房具有一定影响但影响不明显。电影票房可能与影片质量本身有密切关系。 本博客采用TMDB电影数据集记录了1919-2016年间电影4803组数据从电影的评分、预算、受欢迎程度、评论次数、时长、类型以及票房等信息进行分析评价主要有以下结论 1 电影评分主要集中在5-7分电影评分与电影收入没有明显关联关系。说明评分高低不代表电影好坏不一定能带来更好收益可能有一大部分观众没有参与评分。 2 电影受欢迎程度电影预算及评论数量直接影响电影收入。说明电影拍摄前期在灯光、演员、道具、服饰、制作等方面投入较大保证影片质量另外收入高的影片参与评论次数多观众更受欢迎说明可以电影宣传比较到位宣传力度大。 3 最受欢迎的电影类型是AdventureAction且收入最高的电影类型依然是AdventureAction说明电影类型对电影收入有一定影响但影响不明显。推测可能与电影上映地区的文化有关。 4 电影时长对电影收入影响不大记录中电影时长集中分布在90-110分钟推测原因是数据集中不同时长的数据量过少体现不出时长和收入的关系另外收入高的电影时长比较适中所以电影时长适中才能保证观众对电影满意同时能够保证拍片质量创造更多收益时长过短无法保证质量过长影响观众的观感。
http://www.w-s-a.com/news/836161/

相关文章:

  • 赣州网站开发公司怎么才能设计好一个网站
  • 个人网站建设分几个步走培训网站开发哪个好
  • 智能网站价格河北城乡建设网站
  • 做动画在线观看网站网上花店 网站源代码
  • 做网站项目体会商业信息
  • 深圳的设计网站谷歌浏览器下载手机版官网
  • 苏州网站建设都找全网天下外贸响应式网站设计
  • 揭阳专业做网站网站迁移教材
  • 手机上怎么上传网站吗工程信息网站建设
  • 用手机建网站微信手机网站流程
  • 专注软件优化分享的网站梧州网页设计
  • 长春火车站和高铁站是一个站吗公司名称注册查询系统
  • 便利的集团网站建设网页的依托网站
  • 茶叶网站建设题库制作助手app
  • 网站建设栏目层级北京网站搭建公司电话
  • 网站开发运营经理打开百度竞价页面是网站是什么
  • 国内最专业的设计网站建设现在用什么语言做网站
  • 湖南网站开发 岚鸿象山县建设工程招投标网站
  • 长沙免费网站排名wordpress 教学
  • 专门做app的网站html代码是什么
  • 临沂网站制作建设欧米茄表官网
  • 北京模板网站开发全包网站建设的第三方平台
  • 在凡科做的网站怎么推广网页模板下载 免费 html
  • 有关网站建设的标题仿亿欧网wordpress
  • 网站建设公司销售招聘常用的搜索引擎有哪些?
  • wordpress中.htaccess新上线的网站怎么做优化
  • 家教网站怎么做网站建设品牌推荐
  • 青岛做外贸网站建设茶叶公司网站建设策划书
  • 个人电脑做网站主机三合一网站
  • 用html框架做网站怎么在.Net中做团购网站