网站开发实施方案,怎么设置wordpress底栏文字,珠海网站制作服务,办公网站模板一、定义
卡方检验是用来检验样本观测次数与理论或总体次数之间差异性的推断性统计方法#xff0c;其原理是比较观测值与理论值之间的差异。两者之间的差异越小#xff0c;检验的结果越不容易达到显著水平#xff1b;反之#xff0c;检验结果越可能达到显著水平。
二、用…一、定义
卡方检验是用来检验样本观测次数与理论或总体次数之间差异性的推断性统计方法其原理是比较观测值与理论值之间的差异。两者之间的差异越小检验的结果越不容易达到显著水平反之检验结果越可能达到显著水平。
二、用法
chisq.test()函数
函数的用法
chisq.test(x, yNULL, correctTRUE, prep(1/length(x), length(x)), rescale.pFALSE, simulate.p.valueFALSE, B2000) 参数详解 x数值向量、因子或矩阵y数值向量或因子当x是因子时y也必须是一个相同长度的因子如果x是一个矩阵那么y就会被自动忽略。correct用于单元格的数值小于5时的连续矫正只能用于2x2的列联表连续性矫正通常用于减少由于样本量较小而导致的偏差。p表示与x长度相同的概率值向量。用于拟合优度检验时指定每个类别的期望概率。如果未指定则默认为等概率分布即每个类别的概率为1/length(x)。rescale.p逻辑参数用于控制是否将p的和重新调整为1默认情况下为FALSE表示不进行调整。如果p的元素之和不为1且rescale.p TRUE则会自动将p重新调整为等概率分布。simulate.p.value逻辑参数用于控制是否以蒙特卡洛采样的方法模拟p值。默认情况下为FALSE表示不使用蒙特卡洛模拟。当样本量较小或期望频数较小时使用蒙特卡洛模拟可以得到更准确的p值。B整数参数指定蒙特卡洛采样的重复次数。仅在simulate.p.value TRUE时有效。默认情况下为2000次重复采样。 三、举例
1、默认p中所有元素都相等
随机抽取了50名儿童从5种玩具中挑选出一种自己最喜欢的玩具。
# 50名儿童对5种玩具的选择结果
toys - c(10, 8, 20, 7, 5)
# 检验这5种玩具的结果是否相同
chisq.test(toys)
# 参数p中的每个元素默认相同故设置prep(0.2,5)
chisq.test(toys, prep(0.2,5))
从以下结果可知卡方值为14自由度为4p值为0.0080.05故可得出结论这5种玩具受欢迎程度差异显著。 2、p中的元素不等
# 50名儿童对5种玩具的选择结果
toys - c(10, 8, 20, 7, 5)
p - c(0.21, 0.13, 0.43, 0.12, 0.11)
chisq.test(toys, pp)
从 以下结果可知5种玩具的受欢迎程度不同但这些不同与前期研究的结论是吻合的p0.9530.05
set.see(123)
norm - rnorm(10000)
ks.test(norm, ypnorm) 3、拟合优度检验ks.test()函数
ks.test()函数是 R 语言中用于执行 Kolmogorov-Smirnov (K-S) 检验的函数。K-S 检验是一种非参数检验方法用于比较一个样本的分布与一个参考分布或两个样本的分布是否存在差异。具体来说它评估样本数据的累积分布函数CDF与参考分布或另一个样本数据的 CDF之间的差异是否显著。
单样本K-S检验
检验一个样本是否服从标准正态分布
# 生成一个标准正态分布的样本
set.seed(123) # 设定随机种子数
sample_data - rnorm(10000)# 执行单样本 K-S 检验
ks.test(sample_data, pnorm, mean 0, sd 1) 双样本K-S检验 检验两个样本的分布是否相同
# 生成两个样本
set.seed(123)
sample1 - rnorm(10000, mean 0, sd 1)
sample2 - rnorm(10000, mean 0.5, sd 1)# 执行双样本 K-S 检验
ks.test(sample1, sample2) 4、二维列联表独立性检验
若要对二维列联表进行独立性检验只需要让chisq.test()函数中的x参数为一个矩阵或者让x参数和y参数都是向量或同因子。
用vcd扩展包中的Arthritis数据集为例男性和女性在接受两种实验处理时的人数是否一致以及这种相关疗法是否有效果。
x参数是矩阵
library(vcd)
table1 - table(Arthritis$Treatment, Arthritis$Sex)
table1table2 - table(Arthritis$Treatment, Arthritis$Improved)
table2chisq.test(xtable1)
chisq.test(xtable2) x和y参数都是因子
chisq.test(xArthritis$Treatment, yArthritis$Sex)
chisq.test(xArthritis$Treatment, yArthritis$Improved) 上面两种方法的结果都想死男性和女性在接受两种实验处理时的人数是一致的因为p0.53560.05新疗法也是有效果的因为p0.0014630.05。