根据《第四次全国经济普查方案》和《第四次全国经济普查数据处理方案》,制定《第四次全国经济普查清查数据处理实施细则与规范》(以下简称《细则与规范》)。
本《细则与规范》包括了单位清查阶段普查区划分与绘图、部门数据整理、清查数据采集和清查数据处理等数据处理工作内容,是指导各级普查机构开展普查单位清查数据处理工作的重要文件。各级普查机构应遵循本《细则与规范》规定的工作原则、流程和要求,结合本地区实际情况,明确工作任务,制定本级清查数据处理实施细则与规范。
一、工作原则和要求
(一)统一领导、分级负责。
第四次全国经济普查(以下简称四经普)清查数据处理工作按照“统一领导,分级负责”的原则进行,即在国务院第四次全国经济普查领导小组办公室(以下简称国务院经普办)统一领导和部署下,各级普查机构按照统一的数据处理标准和规范,组织实施本级的数据处理工作。
(二)专业协作,注重配合。
单位清查数据处理工作涉及到不同专业和部门,各级普查机构要明确专业和部门间的分工与责任,加强协作,相互配合,共同做好清查数据处理工作。
(三)统筹管理、保证质量。
数据质量是普查工作的生命,是数据处理贯穿始终的根本遵循。要牢牢树立质量第一的观念,加强管理,做好统筹,采用多种技术手段,确保数据的完整性、一致性和及时性,把好数据质量关。
(四)加强防范,确保安全。
各级普查机构要树立安全意识,采取必要的技术和安全防范措施,建立完善的网络安全系统,防止病毒侵袭和“黑客”攻击,严防数据丢失、泄密,确保数据安全。
二、业务模式
单位清查的业务模式为:
各级普查机构按照普查方案要求收集部门数据,进行部门数据整理,生成清查底册;县级普查机构组织完成普查(小)区划分和绘图,生成离线地图包。
县级普查机构将清查底册和离线地图包推送到PAD。
普查员携带PAD,根据普查区电子地图,对除军队系统普查对象外的法人单位、产业活动单位和从事第二、三产业的个体经营户,进行“地毯式”清查,采集普查对象(不包括不得使用PAD采集清查表和定位的,以及不得通过网络报送信息的单位,此类单位采集和报送方式另行规定)所在建筑物信息,分类填报清查表。其中,国务院经普办下发的金融、铁路部门名录单位,由普查员利用PAD进行定位,核实地址和运营状态,免填清查表其他内容。普查员对采集的数据进行初审,通过无线网络上传。
国家、省、市和县四级普查机构组织在线编码、审核、处理。
国务院经普办统一编制普查名录。
三、清查数据处理软件与环境
国务院经普办统一组织清查数据处理软件的开发。软件包括:
(一)普查区划分与绘图系统。
使用国家地理信息公共服务平台“天地图”为电子底图,在三经普普查区划分的基础上,根据统计用区划进行边界的调整,普查(小)区的划分、命名、编码和审核,形成四经普普查区电子地图。
软件在国家级数据处理节点部署。
各级普查机构根据本地区实际情况,应准备足够的PC机,用于普查区划分与绘图工作。PC机参考配置如下:
CPU:英特尔酷睿i5及以上,主频2.6GHz及以上;
内存:4G及以上;
硬盘:250G及以上;
浏览器:IE11及以上,火狐浏览器(最新版),360浏览器(最新版);
操作系统:win7及以上。
(二)清查比对处理系统。
该系统在国家级和省级数据处理节点分别部署,主要包括两部分内容:
1.部门数据整理。对部门单位名录资料与统计基本单位名录进行比对、合并,生成法人单位和产业活动单位清查底册;有条件的地区可依据市场监管部门提供的个体工商户资料,生成个体经营户清查底册。
2.清查数据处理。接收PAD上传的清查数据,进行编码、审核、汇总、查疑补漏、上报和验收等,整理形成联网直报普查单位名录、PAD填报普查单位名录和部门普查单位名录。
省级系统部署示意图如下:
省级设备参考配置如下:
1.数据库服务器:2台,用于部署应用程序数据库,安装数据库RAC组件,其配置不低于如下参数:
CPU:4颗Intel E7-4820V3处理器(10Core/1.9GHz/25M);
内存:256G;
硬盘:6*600GB硬盘;
网卡:4*千兆网卡;
光驱:DVD光驱;
1G缓存RAID卡;
光纤接口:2*16GbHBA卡。
2.应用服务器:2台,用于部署清查比对程序及PAD数据接收程序,应用服务器应不低于如下参数:
CPU:2颗Intel E5-2630V3处理器(8Core/2.4GHz/20M);
内存:64G;
硬盘:3*900GB硬盘;
网卡:4*千兆网卡;
光驱:DVD光驱;
512M缓存RAID卡。
3.操作系统:4套 NeoKylin Linux Advanced Server release 6.7操作系统。
4.数据库:2套,带RAC组件64位Oracle11gR2数据库。
5.应用中间件:2组,使用Apache Tomcat 8。
6.负载均衡交换机:2台。CPU:1颗,可支持500万并发,10Gb吞吐量,8*千兆,支持20000TPS SSL处理,支持内存Cache,支持数据压缩。
7.光纤交换机:2台,16个激活端口,16个16Gb光纤模块。
8.数据库存储设备:1组,用于生产数据存储,及日志备份。双控制器双活型磁盘阵列,48GB缓存,8*16G主机端口,2*4*12Gb SAS后端存储接口,5T硬盘,支持自动精简置备、自动存储分层、自动配置管等。
备注:各省自行搭建存储备份系统对数据进行备份。
(三)PAD数据采集软件。
包括PAD的管理与清查数据采集。
1.移动终端管理系统(MDM)。负责PAD的注册管理;负责PAD软件、制度包、地图资源包、清查底册、离线地图包等文件的推送。在国家级和省级数据处理节点分别部署。
2.PAD清查数据采集软件。根据清查底册对清查单位(含个体经营户)开展地毯式清查,填报清查表,并对清查底册单位信息进行核查,同时对清查单位所在建筑物进行标定。
清查阶段数据处理软件构成如下图所示:
在各软件系统正式部署上线后,各级用户按照分配的用户名和初始口令登录,及时更改密码,且必须使用强口令。密码设置规则为不少于8位,且至少应包含大写字母、小写字母、数字和特殊字符中的3种。
四、业务流程
清查数据处理总体流程如下图所示:
(一)移动终端管理。
对移动终端管理系统(MDM)进行初始设置。
1.创建并分发“四经普清查专业”。
国务院经普办通过国家级MDM系统创建“四经普清查专业”,上传清查数据包的部分内容,包括:PAD清查数据采集软件、清查制度包、清查地图资源包等,并将清查数据包分发到省级MDM系统。
2.接收“四经普清查专业”。
省级MDM系统接收国家级分发的“四经普清查专业”,省级普查机构在此专业下导入本省用于单位清查PAD设备的移动终端码,接收国家级分发的清查数据包。
(二)普查区划分与绘图。
四经普清查数据处理使用国家统计局发布的截至2018年6月的统计用区划代码。电子底图使用国家地理信息公共服务平台“天地图”,坐标系为2000国家大地坐标系。
1.核实边界。
省级普查机构组织核实辖区内省、市、县三级边界。省、市、县普查机构分别登录普查区划分与绘图系统对本级边界进行确认。辖区内需要调整的省、市、县边界,由省级普查机构统一汇总上报到国务院经普办,国务院经普办统一进行调整。本次普查绘制的各级边界不作为各级政府行政区域划分和行政管理的依据。
2.划分普查(小)区。
在普查区划分工作开始前,县级普查机构应先确认辖区内是否含有外埠飞地,在完成外埠飞地的绘制后,再组织乡级业务人员核定乡界、绘制本埠飞地和划分普查(小)区。
3.审核和验收普查区地图。
县级普查机构完成普查(小)区划分与绘图后,逐级上报普查区边界数据。县级及以上普查机构逐级进行审核、验收。上报后的普查区边界系统自动锁定不允许修改。
4.预置建筑物。
县级普查机构应在完成普查区边界划分后组织进行建筑物的预置,需要多台PAD采集数据的建筑物必须提前预置,通过普查区划分与绘图系统打点、录入建筑物属性信息,也可以将底图上已有的参考建筑物标记为预置建筑物,并标记建筑物标识。
5.导出数据。
县级普查机构在完成上述工作后,导出辖区内的15位地址码和以乡(镇、街道)为单位的离线地图包,其中离线地图包内容包括:辖区内电子底图、地址码、普查区边界、参考建筑物和预置建筑物。
普查区划分与绘图工作流程如下图所示:
(三)部门数据整理。
1.收集部门数据。
各级普查机构按照普查方案的要求收集同级的部门数据,经过预处理,导入到清查比对处理系统。
2.整理并下发部门数据。
(1)对本级形成的部门数据文件进行字段规范化处理;
(2)行业代码由2011年标准转换为2017年标准;
(3)对不符合审核要求的数据进行核实修改或者标记无效;
(4)将数据逐级分解至县级普查机构。
3.进行单位比对。
对通过审核的本辖区部门数据进行比对合并,当单位详细名称、统一社会信用代码(组织机构代码)都一致时,其他指标按比对规则优先级的顺序自动进行合并,对单位详细名称、统一社会信用代码(组织机构代码)单一相同的单位,需进行人工合并;整理补充区划代码等指标,形成单位比对数据库。利用部分部门数据进行行业代码和单位状态等指标的赋值与标记。
4.编制清查底册。
完成单位比对后,以县为单位生成单位清查底册(无效单位和未通过强制性审核的单位不生成底册,底册中的单位数量不应超过10万条)。有条件的地区可依据市场监管部门提供的个体工商户资料,生成个体经营户清查底册(底册中的个体经营户数量不应超过10万条)。县级普查机构导出清查底册。
部门数据整理流程如下图所示:
(四)单位核实与清查数据采集。
1.清查数据包的推送与接收。
(1)导入清查用地址码和上传数据。
县级普查机构导入清查数据处理用地址码(15位),将本县的清查底册和离线地图包上传至MDM后,向PAD推送清查数据包内所有文件内容。在清查过程中如有新的数据包,应及时接收,再次推送。
(2)清查数据采集客户端注册。
县级及县以下普查机构组织普查员在PAD上安装MDM客户端,并注册到四经普清查专业,接收清查数据包。
2.清查数据采集(PAD)。
(1)登录并初始化。
普查员安装PAD清查数据采集软件,根据MDM客户端注册的用户名和密码登陆,首次登陆后需进行初始化操作:
选择数据报送方式:对于“联网上报”和“离线上报”的数据报送方式,普查员只能选择其一,原则上普查员应选择“联网上报”的方式,只有个别无网络地区方可选择“离线上报”;
加载数据:普查员在PAD清查数据采集软件中分别加载清查制度包、清查地图资源包、单位清查底册、个体经营户清查底册和离线地图包。如果在清查过程中有新的数据包,应及时接收,并再次加载。
添加普查小区:普查员登录PAD清查数据采集软件后,可添加同一普查区下的多个普查小区进行数据采集。
(2)清查数据采集。
采集建筑物信息:普查员现场通过PAD进行建筑物定位,PAD软件以列表方式显示周边预置和参考建筑物信息,普查员选择或新增建筑物进行信息采集。
采集单位、个体经营户清查数据:普查员选定单位或个体经营户所在建筑物,进入建筑物后,采集单位清查表或个体经营户清查表数据。其中,“统一社会信用代码”可利用营业执照上的信息通过PAD端安装的输入法OCR识别插件联网进行识别(如搜狗输入法等),以简化信息输入过程。完成数据采集后,普查对象应在PAD端手写签名。
标注单位底册核查情况:普查员应对单位清查底册中本小区的单位标注核查情况。
(3)清查数据的初审与报送。
普查员将采集的清查数据经过初审后及时上传。在完成本普查(小)区的全部清查登记后,由县级及以下普查机构组织以“离线导出”的方式导出手写签名数据,填写《手写签名导出登记表》(附表1),并由县级统计机构保存。
(五)清查数据处理。
1.接收PAD数据。
清查比对处理系统以自动或手动两种方式接收PAD报送数据,对于离线上报的数据,需填写《离线上报数据记录表》(附表2),并对上传数据的情况进行监控。
对于PAD上传的数据,清查比对处理系统返回PAD端有以下几种消息解释和处理办法:
(1)接收成功
接收成功代表系统已成功接收到PAD上传的数据包。
(2)接收失败
接收失败主要有9中情况详细如下:
①错误信息1:请确认上报地址和注册区划是否正确。
表示PAD上传的zip包名中截取的12位区划代码不在全国的标准区划码库中,PAD注册的区划码来自于MDM,清查系统和MDM区划代码库是一致的。所以出现这种报错需要检查PAD注册的区划,以及MDM和清查系统的区划。
②错误信息2:上报失败,上传文件序号错误。
同一个PAD接收数据时为顺序接收,如果出现未按照序号接收的情况将返回此消息。这种错误出现的几率极小。
③在线数据对接功能已关闭。
清查系统关闭了PAD数据包入库的功能。
④未到上报开始时间。
清查比对处理系统中可以设置接收PAD数据包的开始时间和结束时间,如果当前时间未到设置的开始时间会返回此信息。
⑤上报截止时间已过,无法上报。
如果当前时间超过设置的接收PAD数据包的截止时间会返回此信息。
⑥当前程序不是在用版本。
清查比对处理系统会预置PAD的版本信息,匹配验证失败时返回此消息。
⑦制度版本错误。
清查比对处理系统会预置PAD的制度信息,匹配验证失败时返回此消息。
⑧msg未接收到可用文件或包名不正确。
清查比对处理系统会检测PAD上传的包是否为zip格式,或者包名是否符合接口规范中的规则,监测失败会返回此消息。
⑨未知错误。
当清查比对处理系统接收数据包入库出现内部程序问题时,会返回此消息。
2.数据编码与审核。
利用行业智能赋码功能对主要业务活动(法人和产业活动单位核实后主要业务活动、分支机构一览表中主要业务活动和个体户的主要业务活动)编写行业代码;利用区划赋码功能,对区划代码为空或不标准的单位进行赋码;利用临时代码赋码功能,对没有统一社会信用代码和原组织机构代码的法人及产业活动单位编写统计用临时代码;对相关行业单位编写经济活动代码。
根据建筑物信息,标记商业综合体和商品交易市场;根据普查单位划分具体处理规定,标记视同法人单位;依据相关标准,标记文化产业标识。
各级普查机构在完成本级的数据编码后,对清查数据分专业进行审核。对于建筑物信息,县级普查机构应指定专人进行审核。
3.查疑补漏。
县级普查机构利用清查比对处理系统,根据市场监管部门提供的新增单位、统计调查发现的新增单位,清查数据与清查底册中的差异情况,法人单位和产业活动单位关联审核情况等,生成以本县区划码(6位)命名的查疑补漏单位底册,并上传至MDM,组织开展查疑补漏工作。
县级普查机构为每个有查疑补漏任务的普查区配备专用PAD,组织普查员在MDM上注册,可注册到该普查区下的任意普查小区。县级普查机构通过MDM将查疑补漏数据包(包括PAD清查数据采集软件、清查制度包、清查地图资源包、查疑补漏单位底册和离线地图包等)推送到PAD,普查员安装软件,加载数据,完成查疑补漏单位的数据采集、初审和上报工作。
如果使用“地毯式”清查数据采集的PAD,须检查数据是否全部上传,再做注销。
4.上报清查结果。
省级及省以下普查机构完成清查数据的审核、验收后,逐级上报,形成省级清查结果数据库,省级普查机构将数据上报至国家清查比对处理系统,同时上报省级扩大联网直报范围单位名录;填写《数据简要评审报告》(附表3),加盖省级普查机构公章,并通过传真或邮件发送至国务院经普办。
5.编制普查名录。
国务院经普办审核、验收清查数据,分类标记一套表、非一套表单位、省级扩大联网直报单位、金融、铁路、个体经营户样本单位等情况,形成普查单位名录,反馈或上传至普查数据处理系统、移动终端管理系统等。
清查数据处理流程如下图所示:
五、工作任务
清查数据处理工作分三个阶段进行:
第一阶段为准备阶段。主要任务为:做好清查数据处理的各项准备工作,包括:制定清查数据处理实施细则与规范;制定清查数据处理相关标准;研制清查数据处理软件;开展清查数据处理工作试点;组织清查数据处理软件培训;完成清查数据处理设备采购、环境搭建与软件部署;组织开展普查区划分与绘图;完成部门数据的收集和整理,生成清查底册;分配清查任务等。
第二阶段为清查数据采集和审核阶段。主要任务是:组织完成单位核实、清查数据采集与上传工作;完成数据编码、审核、汇总、查疑补漏、上报和验收等工作。
第三阶段为编制普查名录阶段。主要任务是:国务院经普办根据一套表单位审核确认结果和部门确认结果,根据省级普查机构提供的扩大范围的联网直报单位名录,在法人单位和产业活动单位清查数据中分类标记一套表法人单位、省级扩大范围的联网直报单位、非一套表法人单位、产业活动单位、金融铁路部门负责普查单位等,整理形成普查名录。
各级普查机构应根据单位清查数据处理工作任务,组建由业务人员和技术人员组成的数据处理相关工作组,设置相应的岗位,明确分工,相互配合,协同完成各项具体工作任务。
(一)县级工作任务。
1.负责对下级数据处理人员进行软件培训。
2.负责核定县级边界,组织核定乡级边界和完成普查(小)区的划分及绘图。
3.负责收集本级部门数据,整理导入到单位清查比对处理系统,接收上级下发的部门数据。
4.负责比对合并生成单位比对数据库,生成并导出单位清查底册,有条件的地区生成并导出个体经营户清查底册。
5.通过MDM对权限范围内的PAD进行管理。
6.负责组织和指导普查员完成PAD 的MDM客户端注册,接收清查数据包,安装清查数据采集软件和现场采集清查数据。
7.负责组织辖区内PAD采集数据的备份、报送和手写签名数据的导出与保存等工作。
8.负责县级清查数据编码、标记、审核及验收。
9.负责开展查疑补漏工作。
(二)市级工作任务。
1.负责下级数据处理人员的软件培训。
2.负责核定本级边界。
3.负责收集本级部门数据,并整理导入到单位清查比对处理系统,接收上级下发和分解下发部门数据。
4.负责比对合并生成单位比对数据库。
5.负责本级清查数据编码、标记、审核、验收与上报。
6.通过MDM对权限范围内的PAD进行管理。
(三)省级工作任务。
1.负责制定本省的清查数据处理实施细则与规范。
2.负责组织接收并验收采购的数据处理设备。
3.负责本省清查数据处理环境的准备、部署和系统安全。
4.负责下级普查机构清查数据处理软硬件的培训,指导下级普查机构清查数据处理工作和负责相关的技术支持工作。
5.负责省级边界的确认和各级普查区划分与绘图人员的管理。
6.负责收集本级部门数据,将数据整理导入到单位清查比对处理系统;接收上级下发的部门数据;将部门数据分解下发。
7.负责比对合并生成单位比对数据库。
8.负责本省PAD设备的管理。
9.接收国家分发的本省区划代码,并导入到MDM系统;接收国家分发的清查数据包。
10.负责接收本省PAD采集的清查数据。
11.负责对清查数据编码、标记、审核、汇总、核准、备份及验收。
12.负责生成本省清查结果数据库并上报到国家级清查比对处理系统。
13.负责接收国家下发的普查名录并进行核实。
14.完成本省清查数据处理工作总结。
六、质量控制
各级普查机构应高度重视数据质量,加强责任意识,严格遵守普查工作纪律,不得擅自更换数据采集工具,不得修改软件系统的数据结构、程序模块、描述文件和操作规程等。
要扎实细致地做好单位清查的各项培训工作,在清查数据处理各环节最大限度地减少和消灭各种再生性错误,做好清查数据处理的质量控制。
(一)普查区划分与绘图。
应确保每个普查(小)区均为完整、封闭的区域。各普查(小)区不交叉、不重叠,同一乡级区域内普查区合并后应完整覆盖该乡级行政区域。同时要求普查(小)区边界不重不漏,且个数、代码和名称与规定的一致。
县级及以上普查机构逐级验收下一级的普查区地图,出现问题及时反馈。
(二)部门数据整理。
各级普查机构要确保从各部门获取的数据规范与完整,省级普查机构要根据本地区实际情况清晰划分各级的部门数据获取边界。单位清查比对数据处理软件要对部门数据进行严格的审核控制,针对比对合并中特殊的指标进行必要性审核限制。对单位比对库要进行审核和排重等工作,保证导出的清查底册不重不漏,符合普查方案要求。
(三)单位的核实与清查数据采集。
通过质量抽查和逻辑审核提高数据采集的质量,确保调查对象的不重不漏,各项信息的完整准确。
普查员要将PAD采集到的数据及时上报,以防PAD意外损坏、丢失等风险。
不在PAD端进行与清查数据处理无关的操作。不能装载与清查工作无关的软件。
(四)清查数据处理。
通过清查数据处理软件实现对数据的审核校验,包括数据的上下限控制、重复记录的核查、一致性、完整性检验等。对全部单位进行排重,对所有数据进行审核、查询、修正,直至合格,确保清查数据质量。
通过对主要指标或数量进行汇总,与历史资料进行对比;通过分行业汇总,考察单位行业分布的合理性。重点做好“四对比”,即汇总表内或汇总表间相关指标的对比,看是否有不合理的数据;汇总表主要指标数据与常规报表掌握的数据对比,看是否有奇异数据;各地汇总数据间的对比,看是否出现异常数据;分行业主要指标数据相对数据对比,看是否有超常规的数据。
七、数据安全
为保障四经普清查阶段数据安全,防止数据因各种原因造成的篡改、丢失、泄漏、破坏等安全风险,各级普查机构应按照《网络安全法》的要求,将《国家统计信息系统数据安全管理办法》落实到普查工作的各个环节。工作要求参见《第四次全国经济普查数据处理方案》。
八、时间进度安排
省级及省以下普查机构应按照《第四次全国经济普查方案》的时间进度要求,按时完成各项清查数据处理工作任务,并于2018年11月10日前由省级普查机构将清查结果上报至国务院经普办。2018年12月底完成清查数据处理工作总结。
国务院经普办于2018年12月10日前完成普查名录的编制等工作。
请输入验证码