样本数量都取了相同的100万,那确实就没问题了,前边已经说了。
但你觉得这个例子不恰当,吸烟者和非吸烟者本来就可以把人群一分为二,就好比直接比较轿车和SUV的报废年限,这是不需要知道车型占比的。但这里说的死亡人数,就又成了统计吸烟者和非吸烟者的肺癌患者人数一样,统计样本数量再多,都必须明确统计样本中吸烟者和非吸烟者的各自占比,再看各自肺癌患者的数量。
【 在 lailuotalie 的大作中提到: 】
: 你说这个毫无意义。因为两边样本数量都足够多(而且样本数量都取了相同的100万)
: 举个例子就清楚了,假设有个结论:吸烟者的平均寿命比非吸烟者低几年,你说这结论有问题,应比较吸烟者与非吸烟者在人群中的占比? 你真要质疑结论,不如举例说明吸烟者往往有别的更重要的原因(比如身体因素、遗传因素,或者其他影响健康的坏习惯)导致其寿命受损。
--
FROM 1.202.187.*