当前位置: 首页 > news >正文

网站seo数据分析新人如何做自己的网站

网站seo数据分析,新人如何做自己的网站,中学生做的网站有哪些方面,合肥网站建设代理商置信度#xff0c;置信区间 给定一个置信度#xff0c;就可以算出一个置信区间。 如果给的置信度越大#xff0c;那么阿尔法就越小 给的置信度越小#xff0c;那么α就越大#xff0c;那么 考虑精确性#xff0c;希望区间长度尽可能小#xff0c;所以是取正态的中间…置信度置信区间 给定一个置信度就可以算出一个置信区间。 如果给的置信度越大那么阿尔法就越小 给的置信度越小那么α就越大那么 考虑精确性希望区间长度尽可能小所以是取正态的中间的对称位置 置信度越高则精度越低反之精度越高则置信度越低 置信水平描述真实值落在置信区间中的概率 当你要提高置信水平即真实值落在置信区间中的概率的时候相应的将要付出的代价就是拉长置信区间也就是区间半径的增大。 那么很显然的如果你想让一个区间保持完美的100%的可靠度在已有的条件下我只能将区间半径拉长到∞。也就是置信区间为R。 那么显然这个参数估计就失去了意义自然不存在可靠性。 另外的置信水平和显著性水平是负相关的并且置信水平与显著性水平的和为1 错误理解上图浅色的虚的竖直线代表样本参数真值横的两端有端点的代表95%置信度的置信区间100条竖直线里有95条左右落入这个区间内。 这是非常错误的理解样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值这个值只有一个且不会变动。 样本数目不变的情况下做一百次试验有95个置信区间包含了总体真值。置信度为95% 其中大虚线表示总体参数真值是我们所不知道的想要估计的值。正因为在100个置信区间里有95个置信区间包括了真实值所以当我们只做了一次置信区间时我们也认为这个区间是可信的是包含了总体参数真实值的。 置信区间是变的是不固定的课本上让求的那个置信区间只是某种条件下的置信区间可能是区间长度最短的置信区间但实际上只要这个区间上的点占总点的置信度就是一个置信区间 上分位点 就是右侧占α类似相同的概念就是分布函数只不过分布函数是左侧的总体的 对于对称的分布正态t分布1-α和α是对称的即分布在对称轴左右 对于不对称的分布F分布是一个倒数关系 对于卡方分布相对关系很复杂要查两次表 上分位点出来的是x轴上的一个值由于是右侧占α所以α越小这个值越大反之则越小 即右侧占的越多那么分位点越靠前右侧占的越少分位点越靠后。 正态分布用分布函数描述即左侧占比t分布卡方分布F分布都是右侧占比。t,卡方 正态分布也可以用分位点去描述为u。 不过分位点出来的是坐标轴上的数分布函数出来的是左侧占1的比例大小相当于一个反函数的关系。 假设检验 假设方式 假设方式有是不是与偏大还是偏小即单尾检测与双尾检测 单尾检测就是判断是否高于或是否低于 对于均值的单尾检测 如果考虑样本低于总体那么原假设就是大于等于总体新假设H1是低于总体 因为左加右减所以当分布发生变化均值越大减的数越大左加右减相当于在原基础上又减了数所以就越会在标准分布中向右偏均值越小减的数越小在原来基础上加了数就会越往左偏。 也就是标准分布中也能体现出一定的原来均值的位置先根据相应的均值定义出一个标准的分布然后向右偏的都是均值偏大的样本数据向左偏的都是均值偏小的样本数据。所以极左极右发生时就意味着当前定义的均值所产生的标准分布失去了参考意义即数据分布发生了变化在单尾检测中如果偏小就是分布在左侧的1-α分位点如果偏大就是分布在右侧的α分位点 对于双尾检测 就不考虑到底是偏大还是偏小只是考虑到底还是不是原分布在单尾检测中只检测一端所以允许分布偏离原分布向相反方向偏离都可以但就是不允许向指定的检测方向偏移所以对某个方向的检测更加严格 而双尾检测就不关心这个它只关心到底还是不是原分布所以极左与极右都不允许发生相应的显著性水平也就不止分散在一端而是两端各分一半这也就意味着相比单尾检测的一端不那么严格因为单尾检测是全部的α都分布在一侧而这里只分布着一半。、 所以双尾检测的重点就放在了到底”是不是“的问题上 即两种假设方式分别为 与 即单尾检验用不等式双尾检验用等式 单变量检验 单变量检测中重点在于均值与方差是否等于某个值对于均值而言意义比较明显就是和以往相比检测是否合格是否认为是不是某个值对于方差的单变量检验意义不那么明显因为方差难以直观的用数字去感知与衡量基于比较才有直观的含义即波动是偏大还是偏小而由于是单变量所以比较的值一般就是基于之前的历史值或经验值。 均值检验采用正态与t方差采用卡方。 对均值进行检验就是正态分布根据方差是否已知采用不同的分布但都是正态型的。 如果方差已知取几个样就有多少复杂度如果未知就要用计算出的方差自由度就要失去一个退化为t分布 对方差进行检验就是要卡方分布 如果均值已知那就是取样个数的自由度不然就要失去一个自由度。 在假设过程中所使用的方差都是假设的那个值。不过就是均值已知时就用均值均值未知时就用计算出的均方差 用了均方差就会丢一个自由度。 在均值检验中均方差用于弥补未知方差的信息在方差检验中均方差用于弥补未知均值的信息。方式都是乘n-1后分子分母消除掉的标准差凑成的那个自由度为n-1的卡方分布实现。 在均值检验中用于形成n-1自由度的卡方分布从而形成n-1的t分布进行检验 在方差检验中就是直接形成n-1自由度的卡方分布进行检验 在均方差中用的就不是总体分布的均值而是样本的均值所以自由度才会-1所以在方差均值未知时就可以规避掉未知的总体均值信息在均值检验中方差未知时如果方差已知直接构造标准正态就可以进行检验因为检验均值相对于假设均值已知总体方差又已知所以可以直接求解如果方差未知就不能直接转为标准正态分布。而t分布由于是标准正态分布除以卡方分布所以在方差未知时可以规避掉未知的方差信息从而构造出最大可能利用已知信息的t分布 方差检验就是假设方差是已知的均值检验就是假设均值是已知的 对于标准正态分布就是总体的方差均值都已知。 对于T分布可以在总体方差未知时发挥作用 对于卡方分布若为n自由度则总体的方差均值都已知 若为n-1自由度那么总体均值未知通过除以已知的方差将均方差转化为自由度为n-1的卡方分布 双变量 双变量的检测重点在于检测两个变量的均值是不是相等方差是不是相等重点在于是否相等上而不是是多少的问题上 所以在假设中假设都是等于还是不等于。所以在均值检测当中要构造第一个的均值减去第二个的均值的统计量在方差检验中是构造作比的F分布 均值检验中 用正态分布与t分布 在这一部分中有一特殊情况就是n1n2,即两个体系中取的样本数量相等那么就可以化为配对一组一组即合并成新的统计量如果方差已知就是正态否则就用t统计量。即所谓配对问题。 一般是取样数量不相等即一个取得多一个取得少那就是整成各自的均值与方差进行计算 方差检验中 用F分布 均值已知时那么两个变量各自可以构造出各自自由度的卡方分布相比就是Fm,n)的F分布 均值未知时就需要通过均方差构造出各自自由度-1的卡方分布相比即m-1,n-1的F分布 F分布只能用来检测两个变量的方差是不是相等即数据波动程度是否一致而判断不出来方差的具体数值。在F分布中两个卡方分布相比都把方差消掉了而这个消掉过程就是基于他们方差相等如果不相等就不能消掉所以如果不符合F分布的大概率事件就不能认为他们方差相等。 两类错误 显著性水平的含义就是原假设成立时放弃原假设取H1的概率即第一类错误弃真错误的概率 另一种错误是说原假设错误但是选择了原假设即取为假设。 错误就是错误对于每种具体情况而言第一类错误与第二类错误所标注的实际意义的情况不会同时发生但当”弃真“时就意味着”取伪“ 他们的本质区别就在于原假设是不是正确的假设如果原假设正确那么判断错误时就是放弃原假设H0,即弃真错误如果原假设错误那么判断错误时就是选择原假设即取伪错误 所以第一类第二类错误只是对同一种错误的不同描述方式他们的概率判断没有意义因为不可能针对同一种假设同时发生因为每次只会发生一种错误在唯一确定原假设的情况下第一第二类错误并不是对错误整体集合的一个划分而是对错误集合的命名方式依据原假设的不同而发生变化。 第一类错误的概率计算就是原假设为真但是弃真即统计量最终落在了拒绝域里 第二类错误的概率计算就是原假设为假但是取伪即统计量最终没落在拒绝域里。 此外需要注意标准的分布是基于正确的假设上的错误的假设不被认为构成标准分布即对应的统计量实际上在错误的假设上并不服从标准分布而只有在正确的参数下才是标准的分布 故在第一类错误弃真中标准的定义是H0,即原假设在第二类错误取伪中标准的定义是备选H1,即备选假设原假设不被认为构成标准分布。 通过两类错误增大样本容量 一般思路是控制第一类错误的概率依据第二类错误的概率来确定样本容量的要求 即在原假设的基础上可以知道某个原始量的分布范围在接受的情况下即接受原假设会对应某个量的一个区间此时假设原假设是不对的再假设实际参数是某个数希望第二类错误的概率不要超过某个期望的值也就是说此时的分布与分布公式就变化了但依据原来的错误假设已经算出来了一个分界点即取伪区间那么在这个正确的分布下其在标准分布里占据的比例不应该超过所期望的值所以就对应可求出所需的样本量的要求 因为取伪就是因为原假设是错误的但是就是发生了取了它 实际上不是的话那么它发生的概率应该是小的第二类错误就是所谓瞎猫碰上死耗子。 为什么是要在原假设里求出接受域的范围而不是在正确的假设里 两个参数要先取伪首先是因为不知道它是“伪”其次是要取它即在不知情的情况下不发生“第一类错误”这里就用到了第一类错误的参数α要让统计量落在它所界定的接受域内才会接受原假设才会取伪第二个参数发生的概率就是在一种极端假设上对于原假设的怀疑即如果原假设不是真的又有多大把握避免这一错误 检测方式 在置信区间中一般是左端占α/2右端占α/2中间占1-α。即无论那种分布样本总是围绕在均值的左右极左与极右都是极端的小概率事件。假设检验就是为了检测这样的小概率事件是否发生。 显著性水平越大左右不被允许的区间越大也就是弃真错误率越大即原假设正确时判断错误的概率也就是对样本的分布更加苛刻越要求它紧紧分布在均值两侧反之则越宽松。 步骤就是先依据已有的信息选定合适的统计量与分布方式那么就可以化为相应标准统计量的分布注意是标准统计量的分布这个统计量综合了一切的信息并非单一样本某个样本的信息而是样本总体的一个信息所以不存在多个这样的统计量每次取样都只会综合出一个这样的统计量应该满足相应的条件即最终应该落在标准分布均值左右的两侧即置信区间内。 而依据显著性水平就可以得到左右两侧小概率事件的分布的概率也可以说是分界线也就是要求综合了一切信息的统计量应当在拒绝域之外置信区间内这要才符合大概率大数定律否则就是小概率事件的发生即在当下这个假设下由多次取样出的一个样本总体情况在当下假设中出现了分布异常即发生概率很小的小概率事件 显著性水平用来确定拒绝域 已知条件用来确定统计量是什么选取什么样的统计量进行检验 具体数值与查表用来确定选定的统计量到底是多少 最后比较判断到底是接受还是拒绝原假设
http://www.w-s-a.com/news/801560/

相关文章:

  • 网站浏览图片怎么做的群晖wordpress升级5.0
  • 25个优秀个人网站设计模板网站建设定位分析论文
  • 在线网站备案站长seo综合查询工具
  • 网站根 html网站建设行业数据
  • 网站公司做的网站有最字设计说明室内设计
  • 在线网站代码生成我想做个百度网站怎么做
  • 网站的建设费用分为长治市建设厅官方网站
  • 做网站都有哪些费用建设免费手机网站
  • 网站 组成代码做网站图片怎么插
  • 2020中国企业500强榜单南宁seo标准
  • 北美购物网站排名烟台专业的网站建站公司
  • 门户网站设计特点营销策划咨询机构
  • 天津做网站就到徽信xiala5中国营销型网站
  • 外汇网站建设制作深圳三站合一网站建设
  • 深圳坂田网站设计公司有哪些学校网站建设管理办法
  • 太原建设银行网站中山营销型网站设计
  • 广东省建设厅官方网站多少钱江苏省江建集团有限公司建设网站
  • 网站开发主流服装网站开发课程设计
  • 在iis里面创建网站wordpress响应式视频
  • 学设计哪个网站好网页设计音乐网站
  • 可以自己做斗图的网站上海模板建站多少钱
  • 山东川畅信息技术有限公司网站建设网站开发任务书
  • 网站排版设计欣赏搭建公司介绍网站
  • 网站弹窗是怎么做的长沙智优营家
  • 手机网站菜单设计模板菜单网站图片素材
  • 浙江网站推广爱企查企业查询入口
  • 公司网站平台vs2012网站开发课程设计
  • 哪些方法可以建设网站做网站失败
  • 龙岗网站建设技术wordpress左右两栏
  • 电子商务网站开发与应用的介绍怎么查询域名是否备案