当前位置: 首页 > news >正文

做网站高手网站开发文档带er图

做网站高手,网站开发文档带er图,网络结构形成的系统解决什么问题,织梦网站一排4张图片DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli… DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseline换为lightgbm基线不加任何特征线上得分0.52214 添加baseline特征线上得分0.78176 暴力衍生特征并微调模型参数线上得分0.86068 2023.08.23 数据分析、衍生特征0.87488 衍生特征、模型调参0.89817 交流分享视频 【DataWhale“用户新增预测挑战赛”交流分享-哔哩哔哩】 https://b23.tv/zZMLtFG 1.赛题理解 这次比赛特征主要可以分为以下三个维度 行为维度eid、udmap udmap的key处理成了类别特征 时间维度common_ts 进行了时间戳特征的提取day, hour, minute 用户维度x1~x8 2. 数据可视化分析 使用以下代码绘制前还需做一些设置具体可以参考如下链接 https://www.kaggle.com/code/jcaliz/ps-s03e02-a-complete-eda/notebook 该notebook内提供了丰富的可视化分析代码和思路值得参考。 绘制代码 def plot_cate_large(col):data_to_plot (all_df.groupby(set)[col].value_counts(True)*100)fig, ax plt.subplots(figsize(10, 6))sns.barplot(datadata_to_plot.rename(Percent).reset_index(),hueset, xcol, yPercent, axax,orientv,hue_order[train, test])x_ticklabels [x.get_text() for x in ax.get_xticklabels()]# Secondary axis to show mean of targetax2 ax.twinx()scatter_data all_df.groupby(col)[target].mean()scatter_data.index scatter_data.index.astype(str)ax2.plot(x_ticklabels,scatter_data.loc[x_ticklabels],linestyle, marker., colorcolors[4],markersize15)ax2.set_ylim([0, 1])# Set x-axis tick labels every 5th valuex_ticks_indices range(0, len(x_ticklabels), 5)ax.set_xticks(x_ticks_indices)ax.set_xticklabels(x_ticklabels[::5], rotation45, haright)# titlesax.set_title(f{col})ax.set_ylabel(Percent)ax.set_xlabel(col)# remove axes to show only one at the endhandles []labels []if ax.get_legend() is not None:handles ax.get_legend().legendHandleslabels [x.get_text() for x in ax.get_legend().get_texts()]else:handles ax.get_legend_handles_labels()[0]labels ax.get_legend_handles_labels()[1]ax.legend().remove()plt.legend(handles, labels, locupper center, bbox_to_anchor(0.5, 1.08), fontsize12)plt.tight_layout()plt.show() 2.1 用户维度特征分布分析 可视化分析说明 研究离散变量[eid, x3, x4, x5‘,x1, x2, x6,x7, x8]的分布蓝色是训练集黄色是验证集分布基本一致粉色的点是训练集下每个类别每种取值的target的均值也就是target1的占比 该图主要分析类别数较少的离散变量 训练集和测试集分布比较均匀x1主要集中在 x14 x2分布比较均匀x6基本集中在1和4两个值x7分布比较均匀可能是一个关键特征x8可能是性别特征特征重要性较低udmap_key为提取出的特征存在缺失值 x3主要集中在41下占比太大特征重要性很低 x4中各个类别下target的分布变化较大可能是一个关键特征 x5中各个类别同x4,target的分布变化较大可能是一个关键特征但特征数量太多在衍生特征时需要注意避免产生稀疏性 2.2 时间特征分布分析 主要绘制了common_ts中 day 和 hour 的变化情况 day的值和用户增长有很大的关系可以发现在10、14和17新用户有明显的增长老用户对应也呈现出增长趋势 绘制了从day10到day18的新老用户变化情况新老用户的数量在每天的各个时间段呈现基本相同的趋势进一步观察原始数据可以发现三个峰的出现是因为在该三个时间段数据量较其他时间段多可以进一步绘制出各个时间段人数占全天人数的占比图来进一步分析数据
http://www.w-s-a.com/news/25491/

相关文章:

  • 文字网站居中能自己做网站接业务吗
  • 免备案自助建站网站广州珈瑶公司是哪一年注册的
  • ps做网站界面wordpress为图片添加圆角
  • seo优化推广业务员招聘seo顾问服务福建
  • 成都私人网站建设seo网站推广方案策划书
  • 广州网站建设工作室wordpress log
  • 网站后台添加wordpress h1标签优化
  • 自己做网站都需要什么高密 网站建设
  • 网站语言选择郑州本地做团购的网站
  • dw网页设计模板图片谷歌wordpress优化
  • 网站seo优化要怎么做礼品公司怎么做网站
  • 做网页网站需要钱吗提供常州微信网站建设
  • 网站建设文化效果广东网站建设哪家有
  • 毕业设计做网站怎样做特别一点在线网页制作软件
  • html网站代码上海这边敲墙拆旧做啥网站的比较多
  • 微网站怎么用在线crm管理系统
  • 中国城乡建设部人力网站首页如何利用某个软件做一个网站
  • 个人承接网站建设wordpress editor
  • 建站主机 wordpress专业的菏泽网站建设公司
  • 网站响应时间 标准网站建设色调的
  • 网站开发的合同网站建设 设计
  • 网站开发设置网页端口申请免费个人网站空间
  • 制作广告网站的步骤云服务器做网站
  • ipv6可以做网站吗东莞网站建站推广
  • 注册功能的网站怎么做做网站容易还是编程容易
  • wordpress建立目录seo编辑培训
  • 网站怎么群发广州现在可以正常出入吗
  • 微信有网站开发吗多语种网站
  • 深圳网站设计 建设首选深圳市室内设计公司排名前50
  • 上海网站建设 觉策动力wordpress接口开发