01
趋势分析
折线为年度均值
2002
0.0000
2006
0.0092
2009
0.0192
2013
0.3353
2017
0.6373
2020
0.9930
2024
0.8180
02
样例数据
样例数据(前 10 行)
支持复制到 Excel
| 年份 | 省份 | 城市 | 人工智能词频和加1取对数 |
|---|---|---|---|
| 2002 | 北京市 | 北京市 | 0.0 |
| 2002 | 天津市 | 天津市 | 0.0 |
| 2002 | 上海市 | 上海市 | 0.0 |
| 2002 | 重庆市 | 重庆市 | 0.0 |
| 2003 | 北京市 | 北京市 | 0.0 |
| 2003 | 天津市 | 天津市 | 0.0 |
| 2003 | 河北省 | 邯郸市 | 0.0 |
| 2003 | 河北省 | 邢台市 | 0.0 |
| 2003 | 河北省 | 保定市 | 0.0 |
| 2003 | 河北省 | 沧州市 | 0.0 |
参考姚加权等(2024)的关键词,利用地级市政府工作报告文本,统计人工智能词频。。覆盖 248 个地级市、23 年连续面板,适用于面板回归、政策评估与综合评价研究。
03
指标详情
指标解释
指标定义参考姚加权等(2024)的关键词,利用地级市政府工作报告文本,统计人工智能词频。
数据类型城市级面板数据,覆盖248个地级市。
时间跨度2002-2024年,共23年连续面板数据。
应用场景
- 作为被解释变量或核心解释变量进行面板回归分析
- 结合其他指标做相关性与多元回归研究
- 分析时间趋势与区域差异
- 政策评估(DID、PSM-DID 等准自然实验)
- 构建综合评价指标体系(熵值法等)
04
技术文档
数据说明书(Data Dictionary)
数据来源
数据整理自地级市政府工作报告文本。经人工校验与交叉比对,确保数据准确性。
部分缺失值已通过线性插值补齐,原始数据与插值数据均可分别下载。
| 变量名 | 中文名称 | 类型 | 说明 |
|---|---|---|---|
| year | 年份 | int | 2002-2024 |
| province | 省份 | string | 省/自治区/直辖市 |
| city | 城市 | string | 地级市名称 |
| city-e895d586ae1b81-rengongzhinengcipinhejia1quduishu-f42b41 | 人工智能词频和加1取对数 | float | 参考姚加权等(2024)的关键词,利用地级市政府工作报告文本,统计人工智能词频。 |
引用格式(Citation)
[1] 马克集数. 人工智能词频和加1取对数面板数据(2002-2024)[EB/OL]. https://s.macrodatas.cn/article/indicator/city-e895d586ae1b81-rengongzhinengcipinhejia1quduishu-f42b41, 2026-02-23.
可直接复制上方引用格式至论文参考文献
Stata 读取代码
下载数据后,可使用以下 Stata 代码快速读取并设定面板结构:
* 读取数据
use "city_rengongzhinengcipinheji_2002_2024.dta", clear
* 查看变量与前几行
describe
list in 1/10
* 编码城市变量(如尚未编码)
encode city, gen(city_id)
* 设定面板数据结构
xtset city_id year
* 描述性统计
summarize city_rengongzhinengcipinheji, detail
* 简单面板回归示例
xtreg city_rengongzhinengcipinheji x1 x2, fe
estimates store fe_model
如下载的是 Excel 格式,请先在 Stata 中使用 import excel "city-e895d586ae1b81-rengongzhinengcipinhejia1quduishu-f42b41_2002_2024.xlsx", firstrow clear 导入。
05
相关指标推荐