贵州财经大学学报 ›› 2021 ›› Issue (05): 20-29.

• 宏观经济 • 上一篇    下一篇

中国工业企业数据库(1999~2013)的使用研究:基于插值处理方法的比较分析

张少华, 李苏苏   

  1. 广州大学, 广东 广州 510006;
    广东财经大学, 广东 广州 510320
  • 收稿日期:2021-03-05 出版日期:2021-09-15 发布日期:2021-09-23
  • 通讯作者: 李苏苏(1984-)(通讯作者),女,湖南娄底人,广东财经大学讲师,博士,研究方向为生产率测度与分解研究。
  • 作者简介:张少华(1975-),男,山西阳城人,广州大学经济与统计学院教授、博导,中山大学博士,浙江大学博士后,研究方向为资源错配与全要素生产率研究
  • 基金资助:
    国家社会科学基金重大攻关项目"全面建成小康社会背景下新型城乡关系研究"(17ZDA067);国家自然科学基金常规面上项目"中国的"中部迷失"问题:典型事实、形成机理及宏观后果"(批准号:71673253)、"中国企业和城市规模分布异化的政策根源、形成机制与效率评估"(批准号:72073038),以及广州市宣传文化人才培养专项经费资助的成果之一。

Research on the use of China industrial enterprise database (1999~2013): Comparative analysis of missing value processing methods

ZHANG Shao-hua, LI Su-su   

  1. Guangzhou University, Guangzhou, Guangdong 510006, China;
    Guangdong University of Finance and Economics, Guangzhou, Guangdong 510320, China
  • Received:2021-03-05 Online:2021-09-15 Published:2021-09-23

摘要: 中国工业企业数据库已经成为研究中国微观企业活动的首选数据库,但是数据库中关键指标的缺失严重影响了数据库的更新和使用。本文在借鉴主要文献处理方法的基础上,先后采用单值移动时序平滑法、MICE1、MICE2、MMICE1和MMICE2五种插补方法对数据库进行完善,从而将中国工业企业数据库延伸至2013年,并通过计算企业全要素生产率来评估各种插补方法的相对有效性。研究表明:在这五种插值方法中,单值移动时序平滑法和MMICE1是两种最为有效的插值方法,不仅可以实现插值前后的数据库特征一致,而且能够实现所计算的全要素生产率的数据结构特征一致。值得强调的是,在完善数据库和计算全要素生产率方面,前者因为处理过程简单因而是一种相对经济的方法,而后者因为能够保留更多样本信息因而是一种相对有效的方法。本文研究价值体现在对使用中国工业企业数据库提供了基础性研究工作。

关键词: 中国工业企业数据库, 单值移动时序平滑法, 多重链式方程插补法, 混合插补法, 全要素生产率

Abstract: China industrial enterprise database has become the preferred database to study China's micro enterprise activities. However, the lack of key indicators in the database seriously affects the update and use of the database. On the basis of referring to the main literature processing methods, this paper uses five interpolation methods to improve the database, including single imputation, MICE1、MICE2、MMICE1和MMICE2, so as to extend the Chinese industrial enterprise database to 2013, and evaluate the relative effectiveness of various interpolation methods by calculating the total enterprise productivity. The results show that:In the five interpolation methods, the single imputation method and MMICE1 are the two most effective interpolation methods, which can not only achieve the consistency of database features before and after interpolation, but also achieve the consistency of data structure features of total factor productivity. It is worth emphasizing that in terms of improving the database and calculating the total factor productivity, the former is a relatively economic method because of its simple process, while the latter is a relatively effective method because it can retain more sample information The research value of this paper is to provide basic research work for the use of Chinese industrial enterprise database.

Key words: chinese industrial enterprise database, single imputation, multivariate imputation by chained equations, mixed interpolation method, total factor productivity

中图分类号: