北京市 2024 0.6761 天津市 2024 0.5885 石家庄市 2024 0.4903 唐山市 2024 0.9677 秦皇岛市 2024 1.0673 邯郸市 2024 1.2040 邢台市 2024 0.7383 保定市 2024 0.8623 张家口市 2024 0.7973 承德市 2024 0.8780 沧州市 2024 0.6752 廊坊市 2024 0.9655 衡水市 2024 0.8802 太原市 2024 0.6694 大同市 2024 0.8669 阳泉市 2024 0.8891 长治市 2024 0.7737 晋城市 2024 0.9901 朔州市 2024 0.6711 晋中市 2024 0.6898 北京市 2024 0.6761 天津市 2024 0.5885 石家庄市 2024 0.4903 唐山市 2024 0.9677 秦皇岛市 2024 1.0673 邯郸市 2024 1.2040 邢台市 2024 0.7383 保定市 2024 0.8623 张家口市 2024 0.7973 承德市 2024 0.8780 沧州市 2024 0.6752 廊坊市 2024 0.9655 衡水市 2024 0.8802 太原市 2024 0.6694 大同市 2024 0.8669 阳泉市 2024 0.8891 长治市 2024 0.7737 晋城市 2024 0.9901 朔州市 2024 0.6711 晋中市 2024 0.6898
首页/ 城市数据/ 核心数据库/ 环境保护/ 环境规制词频和占全文字数的比例
Panel Dataset — 城市级面板数据

中国城市环境规制词频和占全文字数的比例面板数据(2002-2024)

参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。。数据整理自地方政府网站。

精选数据 地级市 更新 2026-02-23 2002-2024 · 23年 Excel / Stata
2024
覆盖年份
2002–2024
共 23 年连续面板
有效样本
5,706
缺失率 16.5%
覆盖主体
248
地级市数量
指标类型
精选
支持预览与下载
01 趋势分析
0.95 0.80 0.65 0.49 0.34 2002 2006 2011 2015 2020 2024
折线为年度均值
2002
0.4737
2006
0.4842
2009
0.6112
2013
0.7416
2017
0.8893
2020
0.7517
2024
0.7779
02 样例数据
样例数据(前 10 行) 支持复制到 Excel
年份 省份 城市 环境规制词频和占全文字数的比例(%)
2002 北京市 北京市 0.5986
2002 天津市 天津市 0.2236
2002 上海市 上海市 0.2294
2002 重庆市 重庆市 0.8433
2003 北京市 北京市 0.4647
2003 天津市 天津市 0.3679
2003 河北省 邯郸市 0.3177
2003 河北省 邢台市 0.3994
2003 河北省 保定市 0.4809
2003 河北省 沧州市 0.2896
参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。。覆盖 248 个地级市23 年连续面板,适用于面板回归、政策评估与综合评价研究。
03 指标详情

指标解释

指标定义

参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。

数据类型

城市级面板数据,覆盖248个地级市。

时间跨度

2002-2024年,共23年连续面板数据。

应用场景

  • 作为被解释变量或核心解释变量进行面板回归分析
  • 结合其他指标做相关性与多元回归研究
  • 分析时间趋势与区域差异
  • 政策评估(DID、PSM-DID 等准自然实验)
  • 构建综合评价指标体系(熵值法等)
04 技术文档
数据说明书(Data Dictionary)
数据来源

数据整理自地方政府网站。经人工校验与交叉比对,确保数据准确性。

部分缺失值已通过线性插值补齐,原始数据与插值数据均可分别下载。

变量名 中文名称 类型 说明
year 年份 int 2002-2024
province 省份 string 省/自治区/直辖市
city 城市 string 地级市名称
city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585 环境规制词频和占全文字数的比例 float 参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。
引用格式(Citation)
[1] 马克集数. 环境规制词频和占全文字数的比例面板数据(2002-2024)[EB/OL]. https://s.macrodatas.cn/article/indicator/city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585, 2026-02-23.
可直接复制上方引用格式至论文参考文献
Stata 读取代码

下载数据后,可使用以下 Stata 代码快速读取并设定面板结构:

Stata 复制代码
* 读取数据
use "city_huanjingguizhicipinhezh_2002_2024.dta", clear

* 查看变量与前几行
describe
list in 1/10

* 编码城市变量(如尚未编码)
encode city, gen(city_id)

* 设定面板数据结构
xtset city_id year

* 描述性统计
summarize city_huanjingguizhicipinhezh, detail

* 简单面板回归示例
xtreg city_huanjingguizhicipinhezh x1 x2, fe
estimates store fe_model

如下载的是 Excel 格式,请先在 Stata 中使用 import excel "city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585_2002_2024.xlsx", firstrow clear 导入。

05 相关指标推荐
数据预览
加载中...