用qq图,可以获得R2的值,这个值多少可以认为具有较好的正态性?有个分布,该R2为0.991
但用如下Python提供的检验方法进行检验,所计算的前两个检验方法P值都为0,按照其说明,都不是正态分布。
该待检验的数据为12万5千多个。下面第一种方法,在计算中
#stat, p=stats.shapiro(vnn),提示数据个数多于5000时,p值的计算就不准确了。
其他算法没有这样的提示,但p值计算是否也会因为数据多而计算不准呢?查询了一些文献,1000就算大样本了,这种12万多的,不知道有相关文献说明没有?
Statistical Normality Tests – Shapiro-Wilk Test in Python
Statistical Normality Tests – D’Agostino’s K^2 Test in Python
Statistical Normality Tests – Anderson-Darling Test in Python
===
网上目前看到的就这些,对10来万这样的样本量,还有其他检验方法吗?
--
FROM 218.68.227.*