您的位置:首页 > 分析研究
用好大数据  加强“三新”统计
西宁市统计局:http://xntjj.xining.gov.cn    来源:中国信息报    创建时间:2017/9/8 10:32:14    
  大数据时代的到来,为统计工作开辟了新的渠道。本文主要对“三新”统计存在的难点、“三新”统计特征与大数据特征的趋同性,以及大数据在“三新”统计中的应用等进行了分析,以期扩展统计应用领域,创新出迎合大数据的新统计方式方法。
  “三新”统计存在的难点
  “三新”经济的内涵仍是一个开放的、不断演进的概念,“三新”统计的对象和范围也在不断发展变化。正是由于其本身的特点,使“三新”统计存在几方面难点有待解决:
  “三新”企业规模小、数量多、变化快等特点,给长期监测带来困难。“三新”经济具有信息化、高技术、现代管理扁平化、生产要素流动高、企业用人较少等特征,因此催生出大量属于规模以下的中小微企业,除新兴产业单位相对稳定外,新型业态、新商业模式的变换迅速,以现有常规统计方法,难以全面及时反映企业的发展全貌。
  “三新”企业跨界融合特点,挑战现行行业分类。虽然在今年2月份国家统计局研究制定印发了《新产业新业态新商业模式统计分类(试行)》,但随着“三新”经济的不断发展,创新变革层出不穷,企业生产经营不再拘泥于三个产业的界限,已经突破过去传统的产品生活流通方式,以市场需求为导向,即有生产环节,又有研发、营销等环节,加大了行业分类及时补充、调整难度。
  现行统计方法和指标体系难以反映“三新”经济发展成果。一方面,传统的统计方式与方法通过统计数据逐级汇总、层层上报的报送方式的时效性、有效性值得商榷;另一方面,现行统计报表制度中采用的中小企业抽样调查方法,对及时抓取替换单位的整体设计还存在不足,客观上无法满足“三新”经济的发展情况。
  各部门协同参与度无法满足“三新”统计的需求。数据割据的壁垒将成为阻碍大数据技术在各行业实现大发展的关键因素。虽然我国已经开展“五证合一,一照一证”的数据共享平台,但由于每个部门的职能不同,关注点不同,在满足数据共享权限的前提下,满足“三新”统计的信息共享需求还任重道远。
  “三新”数据与大数据具有诸多共性
  数据量大。数据量大是大数据最基本的特征。互联网的发展使得相关的数据集合呈现爆炸式增长趋势,数据量的单位已经由GB、TB向PB、EB发展。据国际数据公司IDC的研究报告称,未来10年全球的大数据将增长50倍,管理数据仓库的服务器数量将增长10倍。随着“大众创业、万众创新”理念的提出,“三新”经济企业数和职工人数大幅度增加,活动体量所产生的数据也呈现几何式增长趋势。
  更迭迅速。快速是大数据有别于传统数据的重要特性。一是数据产生快,大数据往往是爆发式出现或者以数据流的形式实时快速地产生,短时间内产生的数据量非常庞大。二是数据处理快,快速增长的数据量将对数据处理的速度有很高的要求。国家对“三新”经济统计对数据的采集和处理速度也有很高要求。按照经合组织OECD推荐的企业仿生化指标测算,我国小微企业死亡率达到2.3%,平均寿命为6.8年,这就意味“三新”企业的消亡更迭速度比传统的企业要快得多,如果统计数据的采集和处理的速度较慢,那么数据所蕴含的实时信息将无法获取,统计的价值也将大打折扣。
  多样性。在大数据时代,数据格式变得越来越多样,既包括数值型数据,也包括文字、图形、图像、音频、视频、网络日志、邮件等非数值型或者非结构化数据,且预计这些非结构化信息将占未来10年数据产生量的90%。“三新”企业包括多种类型,涵盖一、二、三产业,包括股份合作企业、其他联营企业、外商投资企业等多种经营形式,行业种类的繁多也决定了“三新”经济统计数据的多样性。
  加强大数据应用的建议
  大数据时代的到来,为统计工作开辟了新的渠道。应充分利用互联网信息庞杂,数据量巨大,数据记录易获得等特征,加强大数据在“三新”统计上的应用。
  打造数据平台标准化采集模式。虽然从今年开始实行的“五证合一,一照一证”数据共享平台,有效打破了各部门“信息孤岛”的壁垒,初步实现跨部门信息共享,但平台的基础信息在是否按照统计元数据的标准设计,是否包含需求的统计数据指标等方面还存在差距;另外,在政府部门、电商企业、电信运营商等数据持有者之间,还存在数据标准不统一、指标口径杂乱、数据之间难以整合和衔接等问题。“三新”统计应加强推进政府数据采集工作的标准化,强化在统计制度和技术方法、统计规范和数据标准的制定等方面的机制研究和实践。
  加强统计数据搜集的“第二轨”建设。应加强打造统计数据采集的“第二轨”,从提升统计数据质量的角度出发,建立国家各级政府统计机构与民间大数据的“联姻”,同时在实现企业一套表联网直报的基础上,探索直接抓取企业原始数据的数据生产方式,为生产统计数据提供重要参考。
  着力开发人工智能,提高统计数据监督预测能力。近几年,在大数据的基础上,深度学习算法的提出和发展,已经使人工智能在很多应用领域取得了突破性的成果,应着手开发人工智能在“三新”统计上的应用,利用现有的人工智能框架对数据进行分析。结合自身业务上的优势,通过现有的大数据进行数据的标注和训练,开发出适合统计需求的各种算法,推动数据处理方式从简单汇总向数据挖掘方向转变。
  促进大数据与统计调查数据的有机融合。目前,我国主要是利用三种方法开展统计调查:一是周期性的普查;二是经常性的抽样调查;三是以企业一套表联网直报为核心的全面调查。在“三新”统计调查中,可以与传统数据及非传统数据相结合,充分发挥协同作用。尝试与统计普查大数据、企业一套表大数据、部分稳定可靠的外部大数据和数据源建立连接,相互验证分析。
  加强复合型专业人才的培养和贮备。应高度重视复合型人才队伍的建设,多途径加强对统计人员的技术培训,培养一批不但懂统计业务而且懂信息化应用,对数学、经济学、统计学以及计算机等知识熟练掌握的复合型人才,能多维度分析,把握经济形式。通过培训,使统计人员了解数据开发和熟练运用专用统计分析和数据挖掘工具,做好人才的贮备。
  着力建立健全网络和平台安全管理保障机制。在基础设施方面,要特别注意大数据的垂直应用体系特点,强化终端安全、网络安全、云计算平台安全和其他技术设施的建设与安全管理。要加大统计法规修订工作,增加相关条款,无论是数据的定期交换,还是实时接入式政府大数据采集计算渠道的合规性、安全性,都需要新的相关法规来保障。