现在,为了熟悉样本调查,您需要熟悉以下术语:
总体:也被称为母体,是研究对象的全体。如对某一定固定时间段和固定地点的单位、项目、服务、居民等的调查。
抽样框:是总体中全部单位的物理目录。
差距(gap):总体中的单位与抽样框中的单位的差别。
如果缝隙中的单位分布与采样盒中的单位分布相同,那么缝隙就没有问题。但是,如果间隙中的单位分布与取样盒中的单位分布不同,那么取样盒的分析就会出现系统偏差。例如,如果18岁以上纽约城市居民的抽样框架是选民登记名单,而名单上18岁及以上人口的分布(抽样框架)与不在名单上的人口分布(gap)不同,那么对名单上选民的统计分析就可能包含偏差。这种差异可能会有一些影响。例如,进行一项调查以确定对移民的态度,但选民登记名单不包括尚未成为公民的居民。
样本是总体的一部分,被选择用来收集信息,然后为描述总体提供依据。与一般普查不同,统计抽样程序侧重于收集一般人口中的一小部分数据。例如,从一个由10000个应收账款组成的数据列表或抽样框中,选取50个应收账款组成样本。最终样本应提供可用信息,用于估计整个采样框架的特征。
使用抽样调查有四个原因,如下表所示:
样本有两种类型:不等概率样本和等概率样本。
在不等概率样本中,项目和个体的选择不依赖于抽样框。因为不等概率样本不按抽样框选择单位,所以选择概率是未知的(比如在某些情况下,被测对象有自我选择行为)。
对于非等概率样本,统计推断理论不能适用于样本数据。例如,许多公司通过要求访问其网站的访问者填写电子调查表并提交来进行调查。来自调查的回答可以提供大量的数据,但是因为样本包括自选的网络冲浪者,所以没有抽样框。通常情况下,基于专家的意见(判断样本),我们选择非等概率样本(便利样本)是为了方便,或者是因为人们希望样本中的某些项目、单位或人达到预定的比例(配额样本)。非等概率样本都包含未知程度的偏差。出现偏差是因为没有使用取样盒,然后项目或人的分类可能会系统性地否定样本的代表性(缺口)。
非等概率样本具有方便、快速和低成本的潜在优势。然而,它们也有两个主要缺点:潜在的选择偏差和由此产生的结果缺乏普遍性。这些缺点远远大于优点。所以,非等概率抽样法只能用在你想以较低的成本做一个粗略的估计,或者在小规模的初始研究或试点研究之后会有更严格的调查的时候。
尽可能使用等概率抽样,因为统计推断可以从一个等概率样本中得出。
在等概率抽样中,项目或个体是从抽样框中选出的,因此,群体中的单个个体被选中的概率是已知的。
四种最常用的等概率抽样类型是简单随机抽样、分层抽样、系统抽样和整群抽样。这些采样方法在成本、准确性和复杂性方面各不相同。
天行健管理咨询公司将在下一篇文章中详细介绍这四种等概率抽样类型。请注意。
下一篇:六西格玛设计项目的核心任务