定义
拟合优度(Goodness of Fit)是指回归曲线对观测值的拟合程度,对应的拟合优度检验是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法。接下来我们以拟合优度检验中的一种常见检验方法:K-S检验为例进行具体的说明。
K-S检验(Kolmogorov-Smirnov test)是以两位苏联数学家Kolmogorov和Smirnov的名字命名的。作为一种拟合优度检验,K-S检验是基于累计分布函数的,用于检验一个分布是否符合某种理论分布或比较两个经验分布是否有显著差异。
与t-检验等其他参数检验方法不同,K-S检验不需要知道数据的分布情况,是一种非参数检验方法。这使K-S检验的应用范围更为广泛,但这种不需要假设数据分布的要求也带来了一定的问题,即当检验的数据符合特定分布时,使用K-S进行检验,结果的灵敏度不如特定分布相对应的检验高。在样本量比较小的时候,K-S检验作为非参数检验在分析两组数据之间是否不同时得到广泛应用。
K-S检验步骤分为以下几步:
(1)提出假设H0:Fn(x)=F(x),其中Fn(x)为观察序列值,F(x)为理论序列值或另一观察序列值;
(2)计算样本累计频率与理论分布累计概率的绝对差,令最大的绝对差为Dn;Dn=max{[Fn(x) - F(x)]};
(3)用样本容量n和显著水平a查出临界值Dna;
(4)如果Dn<Dna,则认为拟合接受原假设。
参考文献
[1] https://www.sciencedirect.com/topics/engineering/kolmogorov-smirnov
[2] https://www.cnblogs.com/arkenstone/p/5496761.html