北京市 2024 0.6787 天津市 2024 0.5908 河北省 2024 0.9709 山西省 2024 0.9690 内蒙古自治区 2024 0.6226 辽宁省 2024 0.8053 吉林省 2024 0.6301 黑龙江省 2024 0.7860 上海市 2024 0.8828 江苏省 2024 0.8600 浙江省 2024 0.6447 安徽省 2024 0.9565 福建省 2024 0.9925 江西省 2024 0.7988 山东省 2024 0.9655 河南省 2024 0.8853 湖北省 2024 0.7308 湖南省 2024 0.6747 广东省 2024 0.5857 广西壮族自治区 2024 0.7475 北京市 2024 0.6787 天津市 2024 0.5908 河北省 2024 0.9709 山西省 2024 0.9690 内蒙古自治区 2024 0.6226 辽宁省 2024 0.8053 吉林省 2024 0.6301 黑龙江省 2024 0.7860 上海市 2024 0.8828 江苏省 2024 0.8600 浙江省 2024 0.6447 安徽省 2024 0.9565 福建省 2024 0.9925 江西省 2024 0.7988 山东省 2024 0.9655 河南省 2024 0.8853 湖北省 2024 0.7308 湖南省 2024 0.6747 广东省 2024 0.5857 广西壮族自治区 2024 0.7475
首页/ 省级数据/ 核心数据库/ 工具变量/ 环境/ 环境规制词频和占全文字数的比例
Panel Dataset — 省份级面板数据

中国省份环境规制词频和占全文字数的比例面板数据(2002-2024)

参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用省级政府工作报告文本,统计环境相关词频。。数据整理自地方政府网站。

精选数据 省份 更新 2026-04-04 2002-2024 · 23年 Excel / Stata
2024
覆盖年份
2002–2024
共 23 年连续面板
有效样本
713
缺失率 0.0%
覆盖主体
31
省份数量
指标类型
精选
支持预览与下载
01 趋势分析
1.12 0.94 0.75 0.56 0.37 2002 2006 2011 2015 2020 2024
折线为年度均值
2002
0.4044
2006
0.5571
2009
0.6390
2013
0.9196
2017
1.0557
2020
0.8642
2024
0.8177
02 样例数据
样例数据(前 10 行) 支持复制到 Excel
年份 省份 环境规制词频和占全文字数的比例(%)
2002 北京市 0.5986
2002 天津市 0.2236
2002 河北省 0.5936
2002 山西省 0.1125
2002 内蒙古自治区 0.7707
2002 辽宁省 0.2363
2002 吉林省 0.7674
2002 黑龙江省 0.5245
2002 上海市 0.2294
2002 江苏省 0.2704
参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用省级政府工作报告文本,统计环境相关词频。。覆盖 31 个省份23 年连续面板,适用于面板回归、政策评估与综合评价研究。
03 指标详情

指标解释

指标定义

参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用省级政府工作报告文本,统计环境相关词频。

数据类型

省份级面板数据,覆盖31个省份。

时间跨度

2002-2024年,共23年连续面板数据。

应用场景

  • 作为被解释变量或核心解释变量进行面板回归分析
  • 结合其他指标做相关性与多元回归研究
  • 分析时间趋势与区域差异
  • 政策评估(DID、PSM-DID 等准自然实验)
  • 构建综合评价指标体系(熵值法等)
04 技术文档
数据说明书(Data Dictionary)
数据来源

数据整理自地方政府网站。经人工校验与交叉比对,确保数据准确性。

部分缺失值已通过线性插值补齐,原始数据与插值数据均可分别下载。

变量名 中文名称 类型 说明
year 年份 int 2002-2024
province 省份 string 省/自治区/直辖市
prov-dd0f9c65436e671238094-huanjingguizhicipinhezhanquanwenzishudebili-c60585 环境规制词频和占全文字数的比例 float 参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用省级政府工作报告文本,统计环境相关词频。
引用格式(Citation)
[1] 马克集数. 环境规制词频和占全文字数的比例面板数据(2002-2024)[EB/OL]. https://s.macrodatas.cn/article/indicator/prov-dd0f9c65436e671238094-huanjingguizhicipinhezhanquanwenzishudebili-c60585, 2026-04-04.
可直接复制上方引用格式至论文参考文献
Stata 读取代码

下载数据后,可使用以下 Stata 代码快速读取并设定面板结构:

Stata 复制代码
* 读取数据
use "prov_huanjingguizhicipinhezh_2002_2024.dta", clear

* 查看变量与前几行
describe
list in 1/10

* 编码省份变量(如尚未编码)
encode province, gen(prov_id)

* 设定面板数据结构
xtset prov_id year

* 描述性统计
summarize prov_huanjingguizhicipinhezh, detail

* 简单面板回归示例
xtreg prov_huanjingguizhicipinhezh x1 x2, fe
estimates store fe_model

如下载的是 Excel 格式,请先在 Stata 中使用 import excel "prov-dd0f9c65436e671238094-huanjingguizhicipinhezhanquanwenzishudebili-c60585_2002_2024.xlsx", firstrow clear 导入。

05 相关指标推荐
数据预览
加载中...