南京专业网站开发团队,四川省住房与城乡建设 厅网站,手机app软件开发哪里好,wordpress时尚主题文章目录 #x1f3f3;️#x1f308; 1. 导入模块#x1f3f3;️#x1f308; 2. Pandas数据处理2.1 读取数据2.2 数据信息2.3 数据去重2.4 订单日期处理提取年份2.5 产品名称处理 #x1f3f3;️#x1f308; 3. Pyecharts数据可视化3.1 每年销售额和利润分布3.2… 文章目录 ️ 1. 导入模块️ 2. Pandas数据处理2.1 读取数据2.2 数据信息2.3 数据去重2.4 订单日期处理提取年份2.5 产品名称处理 ️ 3. Pyecharts数据可视化3.1 每年销售额和利润分布3.2 各地区销售额和利润分布3.3 各省订单量分布3.4 各省销售额分布3.5 各类别产品订单量3.6 客户类别占比3.7 Apriori算法关联分析3.8 帕累托分析 ️ 4. 可视化项目源码数据 大家好我是
【Python当打之年(点击跳转)】 本期我们利用Python分析「超市销售数据集」看看每年销售额和利润分布、各地区销售额和利润分布、各省订单量分布、各省销售额分布、各类别产品订单量、客户类别占比等等希望对大家有所帮助如有疑问或者需要改进的地方可以联系小编。
涉及到的库
Pandas— 数据处理Pyecharts— 数据可视化
️ 1. 导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings(ignore)️ 2. Pandas数据处理
2.1 读取数据
df pd.read_excel(超市销售数据.xlsx)2.2 数据信息
df.info()2.3 数据去重
df df.drop_duplicates()2.4 订单日期处理提取年份
df[年] df[订单日期].dt.year2.5 产品名称处理 ️ 3. Pyecharts数据可视化
3.1 每年销售额和利润分布
defget_chart1():chart (Bar().add_xaxis(x_data).add_yaxis(销售额, y_data1,gap5%,label_optsopts.LabelOpts(formatter{c}万)).add_yaxis(利润, y_data2,gap5%,label_optsopts.LabelOpts(formatter{c}万)).set_global_opts(title_optsopts.TitleOpts(title1-每年销售额和利润分布,subtitlesubtitle,pos_top2%,pos_leftcenter),legend_optsopts.LegendOpts(pos_top15%)))销售额和利润均呈现逐年增长的趋势。
3.2 各地区销售额和利润分布 华东大区的销售额最高反映出当地消费能力较高中南和东北地区紧随其后利润方面来看中南地区和华东地区的利润要远高于其他地区。
3.3 各省订单量分布 沿海地区的订单量要明显高于内地尤其是广东、山东、江苏、辽宁。
3.4 各省销售额分布 3.5 各类别产品订单量 办公用品类商品需求量最大占比超过了50%技术类和家具类各占20%左右。
3.6 客户类别占比 客户类别以个体消费者为主其次是公司和小型企业。
3.7 Apriori算法关联分析
# 转换为算法可接受模型(布尔值)
te TransactionEncoder()
d_data te.fit(data_am).transform(data_am)
df_t pd.DataFrame(d_data,columnste.columns_)
# 设置支持度求频繁项集
frequent_itemsets apriori(df_t,min_support0.04,use_colnames True)
rules association_rules(frequent_itemsets,metric confidence,min_threshold 0.1)
# 设置最小提升度, 一般认为提升度大于1的关联规则才有商业价值
rules rules.drop(rules[rules.lift 1].index)
# 设置标题索引并打印结果
rules.rename(columns {antecedents:from,consequents:to,support:sup,confidence:conf},inplace True)
rules rules[[from,to,sup,conf,lift]].sort_values(sup,ascendingFalse).reset_index(dropTrue)结果 3.8 帕累托分析
帕累托分析模型Pareto Analysis又称80/20法则、ABC分析法或主次因素分析法是一种基于“关键少数与次要多数”原理的决策工具用于识别和优先处理对结果影响最大的关键因素。
defget_chart8():bar (Bar().add_xaxis(x_data).add_yaxis(销售额, y_data1,itemstyle_optsopts.ItemStyleOpts(colorrange_color[-1]),label_optsopts.LabelOpts(is_showFalse),).extend_axis(yaxisopts.AxisOpts(max_120,)).set_global_opts(title_optsopts.TitleOpts(title8-帕累托分析,subtitlesubtitle,pos_top2%,pos_leftcenter,),xaxis_optsopts.AxisOpts(axislabel_optsopts.LabelOpts(rotate60,font_size10)),legend_optsopts.LegendOpts(pos_top12%)))line (Line().add_xaxis(x_data).add_yaxis(累积利润占比,y_data2,z10,yaxis_index1,label_optsopts.LabelOpts(is_showFalse),))️ 4. 可视化项目源码数据 点击跳转【全部可视化项目源码数据】 以上就是本期为大家整理的全部内容了赶快练习起来吧原创不易喜欢的朋友可以点赞、收藏也可以分享注明出处让更多人知道。