01
趋势分析
折线为年度均值
2002
0.4737
2006
0.4842
2009
0.6112
2013
0.7416
2017
0.8893
2020
0.7517
2024
0.7779
02
样例数据
样例数据(前 10 行)
支持复制到 Excel
| 年份 | 省份 | 城市 | 环境规制词频和占全文字数的比例(%) |
|---|---|---|---|
| 2002 | 北京市 | 北京市 | 0.5986 |
| 2002 | 天津市 | 天津市 | 0.2236 |
| 2002 | 上海市 | 上海市 | 0.2294 |
| 2002 | 重庆市 | 重庆市 | 0.8433 |
| 2003 | 北京市 | 北京市 | 0.4647 |
| 2003 | 天津市 | 天津市 | 0.3679 |
| 2003 | 河北省 | 邯郸市 | 0.3177 |
| 2003 | 河北省 | 邢台市 | 0.3994 |
| 2003 | 河北省 | 保定市 | 0.4809 |
| 2003 | 河北省 | 沧州市 | 0.2896 |
参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。。覆盖 248 个地级市、23 年连续面板,适用于面板回归、政策评估与综合评价研究。
03
指标详情
指标解释
指标定义参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。
数据类型城市级面板数据,覆盖248个地级市。
时间跨度2002-2024年,共23年连续面板数据。
应用场景
- 作为被解释变量或核心解释变量进行面板回归分析
- 结合其他指标做相关性与多元回归研究
- 分析时间趋势与区域差异
- 政策评估(DID、PSM-DID 等准自然实验)
- 构建综合评价指标体系(熵值法等)
04
技术文档
数据说明书(Data Dictionary)
数据来源
数据整理自地方政府网站。经人工校验与交叉比对,确保数据准确性。
部分缺失值已通过线性插值补齐,原始数据与插值数据均可分别下载。
| 变量名 | 中文名称 | 类型 | 说明 |
|---|---|---|---|
| year | 年份 | int | 2002-2024 |
| province | 省份 | string | 省/自治区/直辖市 |
| city | 城市 | string | 地级市名称 |
| city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585 | 环境规制词频和占全文字数的比例 | float | 参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),利用地级市政府工作报告文本,统计环境相关词频。 |
引用格式(Citation)
[1] 马克集数. 环境规制词频和占全文字数的比例面板数据(2002-2024)[EB/OL]. https://s.macrodatas.cn/article/indicator/city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585, 2026-02-23.
可直接复制上方引用格式至论文参考文献
Stata 读取代码
下载数据后,可使用以下 Stata 代码快速读取并设定面板结构:
* 读取数据
use "city_huanjingguizhicipinhezh_2002_2024.dta", clear
* 查看变量与前几行
describe
list in 1/10
* 编码城市变量(如尚未编码)
encode city, gen(city_id)
* 设定面板数据结构
xtset city_id year
* 描述性统计
summarize city_huanjingguizhicipinhezh, detail
* 简单面板回归示例
xtreg city_huanjingguizhicipinhezh x1 x2, fe
estimates store fe_model
如下载的是 Excel 格式,请先在 Stata 中使用 import excel "city-e895d58f9d095f-huanjingguizhicipinhezhanquanwenzishudebili-c60585_2002_2024.xlsx", firstrow clear 导入。
05
相关指标推荐