当前位置: 首页 > news >正文

福州网站建设搭建中企动力科技集团股份有限公司

福州网站建设搭建,中企动力科技集团股份有限公司,wordpress媒体库 替换,什么是企业云网站建设一、引言 本案列基于北京某平台的二手房数据#xff0c;通过数据可视化的方式对二手房市场进行分析。通过对获取的数据进行清冼#xff08;至关重要#xff09;#xff0c;对房屋价格、面积、有无电梯等因素的可视化展示#xff0c;我们可以深入了解北京二手房市场的特点…一、引言 本案列基于北京某平台的二手房数据通过数据可视化的方式对二手房市场进行分析。通过对获取的数据进行清冼至关重要对房屋价格、面积、有无电梯等因素的可视化展示我们可以深入了解北京二手房市场的特点和趋势为购房者和投资者提供有价值的信息和参考。 为了实现这个目标我们将使用Python编程语言及其相关的数据分析库包括pandas、matplotlib、seaborn和pyecharts。这些库提供了丰富的功能和工具使我们能够对数据进行处理、分析和可视化。 二、数据探索和清冼 进行数据探索和清冼的目的主要是因为数据来源并不是官方的数据中往往存在一些异常情况这些异常的情况会导致我们分析的结果出现大量的偏差所以我们需要对爬取的北京二手房数据进行探索的清冼数据集下载地址https://download.csdn.net/download/qq_38614074/89017277 废话不多说直接上代码 1、导入数据探索清冼需要的库 import pandas as pd2、导入数据进行数据整体的探索 data pd.read_csv(二手房数据.csv,encoding gb18030)#查看数据的维度 data.shape #打印数据的前5行 data.head()data.info()对数据进行整体的探索我们发现数据集中11 Unnamed列好像都是空值Id列在后续的分析中也使用不到故后续需要将这两列进行删除; 并且电梯列中有比较多的缺失值数据中可以看到电梯有8255条数据缺失记录后续需要进行清冼 3、数据中字段级别的数据探索 后续的分析主要是对数据中的一些字段进行可视化分析所以需要查看不同维度的数据中是否存在一些异常情况不应该出现出现的情况 3.1 市区字段分析 data[市区].value_counts() 分析 在市区列中存在异常值[‘15’, ‘有电梯’, ‘京师吉地’]且量非常少不影响这个数据分析后续需要将这些数据所在的行数据进行删除 3.2 户型字段分析 data[户型].unique() 分析通过unique()我们发现后续的处理中我们需要房间替换成室保证数据的一致性并需要将一些非户型类型的描述给删除这里主要包括[‘叠拼别墅’,‘有电梯’, ‘京师吉地’]等户型列中的异常值 3.3 其它字段的分析 # 小区 len(data[小区].unique()) #电梯 data[电梯].value_counts() #朝向 data[朝向].unique() #楼层 data[楼层].unique() #装修情况 data[装修情况].value_counts() #面积 data[面积(㎡)].unique() #年份 data[年份].unique()分析 1、小区列中的字段数据过多此次不在处理此份数据对分析结果无影响 2、电梯列中缺失值比较多后续将列中的数据不是’有电梯’ or’无电梯’的情况全部替换成’未知‘ 3、朝向列中将[‘97’,‘有电梯’,‘京师吉地’]异常值所在的行进行删除 4、楼层列中将[‘490’, ‘房山’, ‘精装’, ‘朝阳’, ‘有电梯’, ‘京师吉地’]异常值所在的行进行删除 5、装修情况列中将[‘无电梯’,‘2013’,‘丽水嘉园’,‘长阳国际城三区’,‘有电梯’,‘京师吉地’]异常数据所在的行进行删除 6、年份列中将[‘1.01E11’,‘其他’,‘精装’, ‘西南’,‘22’,‘有电梯’, ‘京师吉地’]异常数据所在的行进行删除 7、面积(㎡)列中将包含中文的行进行删除 8、价格(万元)列中将[‘光明西里’]异常数据所在的行进行删除 4、编写最终的清冼代码 根据上面的分析编写对应的代码如下 # clean步骤 # 删除指定的列 [Unnamed: 11, Id] data data.drop([Unnamed: 11, Id], axis1) def remove_outlies(data,col_name楼层,to_remove [490, 房山]):mask data[col_name].isin(to_remove) data data[~mask] return data# 市区列中异常值清冼 data remove_outlies(data,市区,[15, 有电梯, 京师吉地]) # 电梯列中的数据清冼 data[电梯] data[电梯].apply(lambda x:x if (x有电梯 or x无电梯) else 未知) # 户型列中的数据清冼 data[户型] data[户型].apply(lambda x:x.replace(房间,室)) data remove_outlies(data,户型,[叠拼别墅,有电梯, 京师吉地]) # 朝向列中的数据清冼 data remove_outlies(data,朝向,[97,有电梯,京师吉地]) # 楼层列中的数据清冼 data remove_outlies(data,楼层,[490, 房山, 精装, 朝阳, 有电梯, 京师吉地] ) # 装修情况列中的数据清冼 data remove_outlies(data,装修情况,[无电梯,2013,丽水嘉园,长阳国际城三区,有电梯,京师吉地]) # 年份列中的数据清冼 data remove_outlies(data,年份,[1.01E11,其他,精装, 西南,22,有电梯, 京师吉地])# 面积(㎡)列中的数据清冼 def contains_chinese(s): if isinstance(s, str): return any(\u4e00 c \u9fff for c in s) return False mask data[面积(㎡)].apply(contains_chinese) data data[~mask] data remove_outlies(data,价格(万元),[光明西里])5 将清洗后的数据保存 将清冼后的数据进行保存方便后续的分析不用再重新进行数据的清冼清冼后的数据下载地址https://download.csdn.net/download/qq_38614074/89017277 data.to_csv(‘clean_data.csv’,indexFalse,encoding‘utf-8-sig’) 三、数据分析和可视化 在这一部分你可以逐步介绍你对数据进行的分析和可视化的过程。你可以展示一些关键的图表和图形并解释它们背后的含义和发现。 加载绘图需要的库 import pandas as pd from pyecharts.charts import Map from pyecharts.charts import Bar from pyecharts.charts import Line from pyecharts.charts import Grid from pyecharts.charts import Pie from pyecharts.charts import Scatter from pyecharts import options as opts from pyecharts.globals import ThemeType from pyecharts.charts import Geoimport matplotlib.pyplot as plt import seaborn as sns %matplotlib inline from pylab import mpl mpl.rcParams[font.sans-serif] [Microsoft YaHei] # 指定默认字体解决plot不能显示中文问题 mpl.rcParams[axes.unicode_minus] False # 解决保存图像是负号-显示为方块的问题导入清冼后的数据 data pd.read_csv(‘clean_data.csv’) data.describe() 图中显示北京二手房平均平均总价 609万平均年份2001年平均楼层 12-13 层平均房屋面积 99 m²。另还有标准差、最小值、四分之一分位数、二分之一分位数、四分之三分位数、最大值等信息。 下面从几个点上进行数据可视化 1各区二手房数量条形图 ,获取数据中各区信息和对应区的房屋数量绘制条形图 region_list data[市区].value_counts().index.tolist() house_count_list data[市区].value_counts().values.tolist()c Bar(init_optsopts.InitOpts(themeThemeType.CHALK)) c.add_xaxis(region_list) c.add_yaxis(北京市, house_count_list) c.set_global_opts(title_optsopts.TitleOpts(title北京各区二手房数量柱状图, subtitle),xaxis_optsopts.AxisOpts(axislabel_optsopts.LabelOpts(interval0))) # c.render(武汉各区二手房数量柱状图.html) c.render_notebook()北京各个城区二手房价格地图分布 zone_median data.groupby([市区])[价格(万元)].median() c (Geo().add_schema(maptype北京,itemstyle_optsopts.ItemStyleOpts(color#A60B63,border_color#FFFF22)).add(,[list(z) for z in zip(zone_median.keys().tolist(),zone_median.tolist())]).set_series_opts(label_optsopts.LabelOpts(is_showFalse)).set_global_opts(visualmap_optsopts.VisualMapOpts(min_280,max_720),title_optsopts.TitleOpts(title北京各个城区二手房平均价格(万元), subtitle),) ) c.render_notebook()各区二手房单价箱型图 统计各区名称信息及对应单价信息并绘制箱型图。 统计各个区二手房单价信息 unit_price_list [] for region in region_list:unit_price_list.append(data.loc[data[市区] region, 价格(万元)].values.tolist())# 绘制箱型图 from pyecharts.charts import Boxplotc Boxplot(init_optsopts.InitOpts(themeThemeType.CHALK)) c.add_xaxis(region_list) c.add_yaxis(北京市, c.prepare_data(unit_price_list)) c.set_global_opts(title_optsopts.TitleOpts(title北京各区二手房总价箱型图), xaxis_optsopts.AxisOpts(axislabel_optsopts.LabelOpts(interval0))) # c.render(boxplot_base.html) c.render_notebook()二手房面积分布与价格关系图 f, [ax1,ax2] plt.subplots(1, 2, figsize(16, 6))# 房屋面积 sns.distplot(data[面积(㎡)], axax1, colorr) sns.kdeplot(data[面积(㎡)], shadeTrue, axax1) ax1.set_xlabel(面积)# 房屋面积和价格的关系 sns.regplot(x面积(㎡), y价格(万元), datadata, axax2) ax2.set_xlabel(面积) ax2.set_ylabel(总价)plt.show()房屋朝向饼状图 d data.groupby(朝向) direction d.count()[小区] directionfrom pyecharts.charts import Piec (Pie().add(,[list(z) for z in zip(direction.keys().tolist(),direction.values.tolist())],radius[30%, 75%],).set_global_opts(title_optsopts.TitleOpts(title房屋朝向比),legend_optsopts.LegendOpts(orientvertical, pos_top15%, pos_left2%),).set_series_opts(label_optsopts.LabelOpts(formatter{b}: {c} ({d}%))) ) c.render_notebook()- 6) 各户型横向条形图 series data[户型].value_counts() series.sort_index(ascendingFalse, inplaceTrue) house_type_list series.index.tolist() count_list series.values.tolist()c Bar(init_optsopts.InitOpts(themeThemeType.CHALK)) c.add_xaxis(house_type_list) c.add_yaxis(北京市, count_list) c.reversal_axis() c.set_series_opts(label_optsopts.LabelOpts(positionright)) c.set_global_opts(title_optsopts.TitleOpts(title北京二手房各户型横向条形图),datazoom_opts[opts.DataZoomOpts(yaxis_index0, type_slider, orientvertical)],) #c.render(北京二手房各户型横向条形图.html) c.render_notebook()房屋装修程度饼状图 decoration_list data[装修情况].value_counts().index.tolist() count_list data[装修情况].value_counts().values.tolist()from pyecharts.charts import Piec Pie(init_optsopts.InitOpts(themeThemeType.CHALK)) c.add(series_name房屋装修,data_pair[list(z) for z in zip(decoration_list, count_list)],rosetyperadius,radius55%,center[50%, 50%],label_optsopts.LabelOpts(is_showFalse, positioncenter)) c.set_global_opts(title_optsopts.TitleOpts(title北京二手房房屋装修饼状图,pos_leftcenter,pos_top20,title_textstyle_optsopts.TextStyleOpts(color#fff)),legend_optsopts.LegendOpts(is_showFalse)) c.set_series_opts(tooltip_optsopts.TooltipOpts(triggeritem, formatter{a} br/{b}: {c} ({d}%)),label_optsopts.LabelOpts(colorrgba(255, 255, 255, 255))) # c.render(customized_pie.html) c.render_notebook()房屋面积分布柱状图 area_level [0, 50, 100, 150, 200, 250, 300, 350, 400, 1500] label_level [50-100,100-150,150-200,200-250,250-300,300-350,350-400,400-450] p1 pd.cut(data[面积(㎡)],area_level,label_level) p2 p1.value_counts() p3 p2.values.tolist() p3 [13647, 5808, 1675, 1561, 541, 217, 93, 54, 53]c (Bar().add_xaxis(label_level).add_yaxis(面积(㎡),p3,color#7944B7).reversal_axis().set_series_opts(label_optsopts.LabelOpts(positionright)).set_global_opts(title_optsopts.TitleOpts(title房屋面积分布柱状图),xaxis_optsopts.AxisOpts(name数量),yaxis_optsopts.AxisOpts(name面积(㎡))) ) c.render_notebook()楼层的分布 sns.distplot(data[楼层],colorr)北京市二手房有无电梯的关系柱状图和有无电梯和房价的关系折线图 df data[data[电梯]!未知]sns.barplot(x市区, y价格(万元), hue电梯, datadf)sns.lineplot(x“市区”, y“价格(万元)”, hue“电梯”, datadf) 出售房数大于15间且房价均值Top10的小区 df data[小区].value_counts().reset_index() #data[小区]value_counts的结果转成dataframe df1 data.groupby([小区])[价格(万元)].mean().reset_index() df df.merge(df1,on[小区],howleft) # 筛选出计数大于15的小区 filtered_counts df[df[count] 15] sorted_counts filtered_counts.sort_values(by价格(万元),ascendingFalse)[:10] sorted_countssns.barplot(x‘小区’,y‘价格(万元)’,datasorted_counts) 本文完整代码下载地址https://download.csdn.net/download/qq_38614074/89017277 总结 通过对北京某平台二手房数据的可视化分析我们可以得出以下结论 北京二手房市场的价格呈现出明显的分布特点不同价格区间的房屋数量和价格水平存在差异。 房屋面积在北京二手房市场中也存在一定的分布特点不同面积区间的房屋数量和面积大小有所差异。 北京各区域的二手房分布不均一些热门区域的房源较多价格也相对较高。 这些分析结果可以为购房者提供有价值的信息和参考帮助他们更好地了解市场情况做出明智的购房决策。同时对于投资者来说这些数据分析也可以提供市场趋势和投资机会的线索。 需要注意的是本文仅基于某平台的二手房数据进行分析可能存在一定的局限性。在实际购房或投资决策中还应综合考虑其他因素如房屋质量、交通便利性、配套设施等。 通过数据可视化的方式我们可以更直观地了解和分析二手房市场的情况为决策者提供更全面的信息支持。希望本文的分析结果对读者有所启发并在购房或投资过程中起到一定的指导作用。
http://www.w-s-a.com/news/844112/

相关文章:

  • 怎样开发设计网站建设博物馆网页设计案例
  • 山西建设厅网站查不了seo搜索引擎优化包邮
  • 临沂网站建设价格太原网站优化公司
  • 网页设计基础课程设计搜索引擎优化英文
  • 网站备案号怎么查楼书设计素材网站
  • 网站设计机构有哪些中国建设银行网站登录不上
  • 烟台理工学校网站罗湖建设网站
  • 卑鄙的网站开发公司郑州人才网站
  • 成都专业的网站设计公司文化建设的成就
  • 做书籍封皮的网站如何建网站教程视频
  • 唐山建站公司模板ipfs做网站
  • 贵阳做网站品牌网站模板
  • 紫网站建设我的个人博客
  • 优秀网站菜单网页上的视频怎么下载
  • 龙口建网站公司价格国内的平面设计网站
  • 电子商务网站建设与管理读后感上海市基础工程公司
  • 织梦免费企业网站做网站时,404网页如何指向
  • 摄影工作室网站源码百度为什么会k网站
  • 哪个网站有淘宝做图的素材网站分享做描点链接
  • 做哪个网站零售最好网站空间在哪里
  • 荆州网站建设多少钱南阳做网站推广
  • 网站代理打开个人网站设计源码
  • 做php网站的话要学什么语言wordpress搜索不到
  • 金华官方网站建设网络营销策划模板
  • 网站开发到上线在线生成小程序
  • 动易网站设计方案郑州营销网站建设
  • 怎么上网站做简易注销的步骤郑州大学现代远程教育《网页设计与网站建设》课程考核要求
  • 新乡网站建设新乡长沙本地论坛有哪些
  • 潍坊中企动力做的网站怎么样wordpress接入微博
  • 网站开发者所有权归属网站项目建设的必要性