数据处理与质量分析
(一)数据处理
1.数据收集
在数据收集过程中,为了数据能够更加真实完整,本团队运用问卷星平台仔细控制和监测数据收集和问卷回收工作,掌握每天完成的问卷数量,并将所有问卷导出、进行编号。
2.数据预处理
在此次调研过程中,实际发放问卷1600份,为了保证正式问卷样本源的可靠性,对所收集数据进行筛选:
(1)以主观建议题为判断依据,剔除回答不符合逻辑的问卷。
(2)剔除存在漏填、多填或含有缺失值的问卷。
(3)剔除极端答案问卷问题数量在二十个左右,因此团队有理由认为:若
某问卷的填答用时不超过100秒,则该份问卷不是在受访者理性情况下的作答的。故对受访者平均回答时间小于100s的问卷进行剔除。
3.数据的编码与录入
通过问卷调查获得的资料转变为SPSS能够识别的数据文件,为各种统计分析做好准备。在调查中结束后,根据问卷的编码顺序,将每份问卷中每个问题对应的编码输入电脑中,通过Excel和SPSS软件实现。
4.数据的清洗
为了解决数据适量问题,使其更适合做挖掘,团队的录入后超出范围、有极端值、逻辑上不一致的数据,进行异常值处理。具体方法如下:
图 6 数据清洗具体步骤图
对于缺失值的处理:使用该项的变量取值的平均数来代替少量的缺失值,数据缺失较多则将整条数据作废。
(二)质量分析
1、信度检验
信度,即为可靠性,是指问卷的可信程度。它主要表示检验结果的一贯性、一致性、再现性以及稳定性;是一个较好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才较为可信。Cronbach‘a系数属于内在一致性系数,是目前最常见的信度系数,比较适合对态度、建议等类量表的分析。因此也适用于团队量化过的问卷。
团队利用SPSS对问卷各个潜变量进行信度分析。具体分析如下。
表7 中医药消费者问卷信度分析结果表
变量名称
Cronbach'a
测项数
个人客观因素
0.829
农村污染主观认可度因素
0.866
农村污染认知程度因素
0.821
政府政策因素
0.779
所有变量的Cronbach'a:0.782
根据表结果,在验证性因子分析目的下,0.7被视为可以接受的标准,0.8是较好的标准。根据Hair等人的建议,当一个变量的测量题项少于6个时,系数大于0.6也说明数据是具有较高的信度。根据分析结果,各变量信度均大于0.7,信度良好。
2、效度检验
效度是指测量工具的准确性,即测量结果能够反映所要测量特性的程度,效度越高越能够达到问卷测验的目的。本研究采用Bartlett球形度检验KMO样本测度两种方法。KMO是做效度分析的检验指标之一,如果KMO的值小于0.5,则说明量表数据不宜进行因素分析即因子分析;若0.50.9,表示非常适合做因子分析。
http://www.dxsbao.com/shijian/550035.html 点此复制本页地址