您的位置:首页 > 分析研究
从审核查询谈农普数据质量控制
西宁市统计局:http://xntjj.xining.gov.cn    来源:中国信息报    创建时间:2017/4/5 9:46:48    
  数据质量控制是三农普的重要工作,贯穿于整个普查数据采集、数据审核和数据验收的全过程。数据审核查询是数据质量控制的重要手段,是产出数据的质量检测环节,为最终的数据验收提供保障。在农普业务处理工作中,数据审核查询就是围绕农普数据质量控制,对上报到农普数据处理系统中的普查数据进行的系统审核和人工查询工作。
  审核查询的出发点
  农普业务处理相对较为复杂。数据处理平台共有五张报表,指标近千个,其中部分指标为常规统计之外新增指标,业务处理难度较大。此外三农普登记对象数量众多,增加了数据质量控制的难度。尽管各级统计部门在普查员培训和登记过程中,对重点疑难业务进行反复强调,但业务理解的偏差在操作中难免存在。各项普查数据进入数据处理系统后,必须做好数据审核查询这项基础工作。通过审核查询,再次排除普查员个体理解差异造成的业务指标误差,确保农普数据质量。
  数据处理程序相对不全面。农普系统数据审核模块直接和PDA审核对接,分为强制型和提示型两类审核。但审核指标数量相对较少,且重点关注单个指标的奇异值,对于关联指标审核较少。以农户普查表为例,在基本人员情况部分的“在校学生填未上过学”等逻辑性错误,系统不进行审核。所以,必须在系统审核模块之外,利用好系统查询模块,进行手工查询,把握系统批量审核没有覆盖到的数据质量控制点,保证数据处理系统上的质量控制环节无死角。
  PDA录入误差难免存在。普查登记采用PDA设备进行录入,由于时间紧任务重,普查员手工录入大量数据时,录入误差难免存在。这些录入误差,必须通过数据审核查询予以清除,以保证农普数据质量。
  审核查询的着力点
  系统审核是基础着力点。农普数据处理系统的数据审核模块分为六部分,包括数据审核、审核任务查看、审核信息查看、数据编辑、审核进度监控和重复数据对比。数据审核是对所有报送到平台的数据按内置规则进行审核,并提供所有的审核错误清单与地区统计汇总等信息。在进行系统批量审核工作时,要注意以下几点:一是开展重复数据对比工作,及时核查重复数据原因,如确实录入重复的进行删除,如仅是同一个普查区下普查小区2位码录入错误造成的重复要及时进行编码修正。二是要用好系统审核业务操作,除全量审核、增量审核外,还应学会定时执行审核程序,让系统在规定的时间内自动进行审核。三是要学会对批量审批信息进行查看分析,可以选择系统内直接查看或导出查看。一方面从总体上分析本地区审核情况,查看各项审核信息的地区分布等情况;另一方面从明细上分析审核情况,要进入单张普查表查看具体数据情况,如重点核实普查登记对象划分是否正确等。
  人工查询是重要着力点。由于系统批量审核不能完全满足数据质量控制的需要,必须利用好系统数据查询功能,做好人工查询审核工作。人工查询审核对业务人员的素质要求高,既要熟知农普业务指标,又要能够进行系统查询公式设置等操作。要做好人工查询审核工作,必须做到系统操作和农普业务双结合。
  相关查询技术手段是进行人工查询的有力抓手。在长期的统计工作中,统计人员积累了大量的数据审核查询经验,同样的,这些经验完全可以借鉴到三农普数据审核查询中来。总的来说,人工查询可以从汇总表、具体指标和关联指标三个角度进行切入。
  汇总表查询是通过系统提供系统常规汇总表和自定义汇总表功能,通过对汇总数中的异常值判断,从整体上对数据质量进行审核。如笔者所在地区属于内陆,但在汇总表数据查询中的农业用地情况中出现海水面积,经核实,由于PDA上H403指标与H401指标为同一项下,确实存在录入错误。具体指标查询是通过查询某一具体指标情况进行数据质量控制。如笔者所在地区的H042指标实际上只有选项2省定这一标准,但经过查询,发现仍有少量错误选择。关联指标查询在实际中应用最广,可以分为关联逻辑指标、关联经济指标、关联农业具体指标。逻辑指标如基本情况部分的人员年龄与学历、婚姻状况等关联指标,可以设置相关查询模板,方便多次查询。关联经济指标如规模户指标中种植面积、产量、销售额计算出来的每亩产量和每亩销售额,还有单位表中的人均服务收入和支出情况等。关联农业具体指标,如农户表中喷滴灌理解错误,认为所有灌溉设施都应算作喷滴灌,就可以通过H072、H073和H070之间的比较关系来查询。
  审核查询的注意点
  明确审核查询的目的。数据审核查询的最终目的是为了保证数据质量真实可靠。此次普查中必然会遇到大量的新情况、新问题,如以每亩销售额异常为例,可能是由于减灾或高价值品种的影响,这种情况下只需要详尽填写数据说明即可。一定要避免为了减少各级查询审核,系统不出现提示型审核清单,相关人员直接简单粗暴修改数据的统计违法行为。
  健全数据审核查询机制。为保证全过程的数据质量控制,要做到PDA审核和系统审核查询双结合。在数据上报前,必须进行PDA审核,必须对提示型错误进行查看确认。数据上报后,必须在数据处理平台进行再次系统审核确认,在系统审核完成的基础上,进行人工查询工作。在整体审核查询工作的业务流程上,为提高工作效率,各级统计机构需将审核查询工作前移,实现边录、边审、边反馈,从而做好数据质量控制工作。