当前位置: 首页 > news >正文

商城网站建设流程网站建设互联网推广

商城网站建设流程,网站建设互联网推广,吴忠住房和城乡建设网站,简洁大方 网站【2023美赛】C题Wordle预测27页中文论文及Python详解 相关链接 #xff08;1#xff09;2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 #xff08;2#xff09;2023年美赛C题Wordle预测问题二建模及Python代码详细讲解 #xff08;3#xff09;2023年美赛C题…【2023美赛】C题Wordle预测27页中文论文及Python详解 相关链接 12023年美赛C题Wordle预测问题一建模及Python代码详细讲解 22023年美赛C题Wordle预测问题二建模及Python代码详细讲解 32023年美赛C题Wordle预测问题三、四建模及Python代码详细讲解 42023年美赛C题Wordle预测问题25页论文 1 论文简介 1.1 问题一 通过解读问题其中需要解决两个问题第一小问为了对2023年3月1日的 Number of reported results进行预测并创建一个预测区间。这是一个时间序列预测问题本文建立机器学习模型进行时间序列数据回归预测。对于时间序列的回归预测线性回归模型需要满足线性、独立性、正态性、方差齐性、自变量间不存在多重共线、因变量为连续变量。所以首先要对数据进行数据分析查看数据的分布、异常值、是否存在季节性趋势和。正态分布检验是计算偏度(skewness)和峰度(kurtosis)。偏度能够反应分布的对称情况若以bs表示偏度。bs0称分布具有负偏离也称左偏态此时数据位于均值左边的比位于右边的少直观表现为左边的尾部相对于与右边的尾部要长因为有少数变量值很小使曲线左侧尾部拖得很长bs0称分布具有正偏离也称右偏态此时数据位于均值右边的比位于左边的少直观表现为右边的尾部相对于与左边的尾部要长因为有少数变量值很大使曲线右侧尾部拖得很长而bs接近0则可认为分布是对称的。是指反应的是图像的尖锐程度。峰度越大表现在图像上面是中心点越尖锐。峰度为0表示该总体数据分布与正态分布的陡缓程度相同峰度大于0表示该总体数据分布与正态分布相比较为陡峭为尖顶峰峰度小于0表示该总体数据分布与正态分布相比较为平坦为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。对于异常值可以采用以箱线图查看异常值的处理有填充法和删除样本的方法但在时间序列中优先考虑填充的方法填充的方法又向前填充、中位数填充、平均数填充以及众数填充。 其次需要进一步做特征工程特征工程是将原始数据转化成更好的表达问题本质的特征的过程使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度包括对时间特征进行信息提取、提取不同长度的滑动平均值、标准差等特征提高机器学习模型的拟合能力。在此基础上选择多种机器学习模型进行回归预测并可以通过K折验证来防止模型过拟合。最后预测阶段计算模型测试集误差将预测结果减去误差得到预测区间的最低值加上预测结果的误差得到预测区间的最高值。 第二小问需要分析单词的属性是否会影响困难模式下玩家得分的百分比。首先单词的属性有元音、辅音、字母序号、字母顺序、词性。将字母频率、字母序号、字母顺序、元音、辅音编码后分析与7种百分比的分析相关性可视化相关性得出结论。 1.2 问题二 通过解读问题其中需要解决两个问题第一小问需要在开发一个时间序列预测模型能够预测报告结果的分布即预测未来日期(1,2,3,4,5,6,X)的相关百分比。首先针对1-7种尝试建立7个回归模型特征工程部分包括提取百分比的数据特征包括滑动平均值、窗口标准差获取时间特征以及将字母频率、字母序号、字母顺序、元音、辅音编码行编码作为类别特征采用机器学习的回归模型进行预测7种情况的百分比。其次大部分特征可能存在多重共线性数据存在多重过线性会导模型容易过拟合或者导致模型无法解释。去除共线性特征的方法有画图法定性分析、相关法定量分析、方差膨胀系数分析、Principal Component Analysis (PCA)分析、相关法迭代分析。然后将数据标准化后才能将数据作为训练集和测试用来训练和测试模型。回归模型有线性回归、多项式回归、逐步回归、岭回归、Boost模型XGBoost和融合模型LightGBM回归。最后题目中要求评价模型的性能可以采用多重误差评价方法包括均方误差Mean Squared ErrorMSE均方根误差Root Mean Squard ErrorRMSE以及平均绝对误差Mean Absolute ErrorMAE。 1.3 问题三 题目中要求建立一个模型对单词进行分类我们采用机器学习中的聚类方法对单词进行编码后采用K-Means(K均值)聚类、均值漂移聚类、基于密度的聚类方法(DBSCAN)、层级聚类算法、EM聚类或者图团体检测(Graph Community Detection)将单词难度分为三类或者更多如困难、一般、简单。然后对每一类的单词可视化分析并描述数据得出结论。并分析EERIE的类别以轮廓系数等评价方式评价聚类效果的好坏。 2 下载方式 betterbench.top/#/45/detail
http://www.w-s-a.com/news/463393/

相关文章:

  • 网站网页设计内容品牌高端网站建设公司
  • 网站开发报价 福州中国建筑网官网手机版
  • 网站 图片 自动往右移专门做定制化的网站
  • 最好用的cms手机百度关键词排名 网站优化软件
  • 凉山州城乡规划建设局网站长沙网站建设哪家强
  • 广州网站开发创意设计公司企业自己怎么制作网站首页
  • 曲靖 曲靖网站建设软件(app)开发wordpress 没有远程发布
  • 官方网站开发与定制网站建设技术是干嘛的
  • 昆明网站建设工作室网站菜单导航怎么做的
  • 南京网站做的好的公司猪八戒网站做推广怎么样
  • 建站收费标准福州网站搭建
  • 做防护用品的网站欧美网站建设风格特点
  • 龙华做网站联系电话北京软件开发培训班
  • 做网站运营有前途网站的建设与管理的心得体会
  • 河南网站推广怎么做网页制作免费下载
  • 网站如何屏蔽中国ip商丘网站建设的公司哪家好
  • 东莞广告公司东莞网站建设价格鹤壁哪有做网站的
  • 门户网站界面设计logo设计商标设计
  • 建设银行网站驱动宁波网站建设相信荣胜网络
  • 八里河网站建设项目建设可行性企业品牌推广方式有哪些
  • jsp网站开发之html入门知识广州服装设计公司
  • 做电商看的网站有哪些个人网页制作成品免费
  • 沈阳建站多少钱境外网站 备案
  • 提交网站收录入口斗图在线制作
  • 建设化妆品网站服务医药网站前置审批
  • 购物网站修改注册信息模块的分析怎么注册公司logo
  • 那个网站可以做域名跳转的青岛网站建设定制
  • 网站登记模板互联网技术发展及其影响的调查
  • 北京专业的网站建设西安企业家名单
  • 移动网站开发服务器丰都集团网站建设