01
趋势分析
折线为年度均值
2000
58.52
2004
144.52
2008
235.13
2012
545.97
2016
2,702.32
2020
9,402.10
2024
22,311.32
02
样例数据
样例数据(前 10 行)
支持复制到 Excel
| 年份 | 省份 | 人工智能企业注册数(家) |
|---|---|---|
| 2000 | 北京市 | 283.0 |
| 2000 | 天津市 | 27.0 |
| 2000 | 河北省 | 26.0 |
| 2000 | 山西省 | 26.0 |
| 2000 | 内蒙古自治区 | 13.0 |
| 2000 | 辽宁省 | 40.0 |
| 2000 | 吉林省 | 13.0 |
| 2000 | 黑龙江省 | 34.0 |
| 2000 | 上海市 | 95.0 |
| 2000 | 江苏省 | 133.0 |
参考《中国工业经济》中王林辉等(2022)的做法,整理人工智能企业数据库,包括企业三级行业、AI关键词、经营范围等数据。当企业经营范围涉及芯片、图像识别、计算机视觉、语音识别、传感器等与人工智能相关的73个关键词时,将该企业识别为人工智能企业。。覆盖 31 个省份、25 年连续面板,适用于面板回归、政策评估与综合评价研究。
03
指标详情
指标解释
指标定义参考《中国工业经济》中王林辉等(2022)的做法,整理人工智能企业数据库,包括企业三级行业、AI关键词、经营范围等数据。当企业经营范围涉及芯片、图像识别、计算机视觉、语音识别、传感器等与人工智能相关的73个关键词时,将该企业识别为人工智能企业。
数据类型省份级面板数据,覆盖31个省份。
时间跨度2000-2024年,共25年连续面板数据。
应用场景
- 作为被解释变量或核心解释变量进行面板回归分析
- 结合其他指标做相关性与多元回归研究
- 分析时间趋势与区域差异
- 政策评估(DID、PSM-DID 等准自然实验)
- 构建综合评价指标体系(熵值法等)
04
技术文档
数据说明书(Data Dictionary)
数据来源
数据整理自人工智能企业数据库。经人工校验与交叉比对,确保数据准确性。
部分缺失值已通过线性插值补齐,原始数据与插值数据均可分别下载。
| 变量名 | 中文名称 | 类型 | 说明 |
|---|---|---|---|
| year | 年份 | int | 2000-2024 |
| province | 省份 | string | 省/自治区/直辖市 |
| prov-dd0f9c64fbc9e4f1fca88-rengongzhinengqiyezhuceshu-9a2886 | 人工智能企业注册数 | float | 参考《中国工业经济》中王林辉等(2022)的做法,整理人工智能企业数据库,包括企业三级行业、AI关键词、经营范围等数据。当企业经营范围涉及芯片、图像识别、计算机视觉、语音识别、传感器等与人工智能相关的73个关键词时,将该企业识别为人工智能企业。 |
引用格式(Citation)
[1] 马克集数. 人工智能企业注册数面板数据(2000-2024)[EB/OL]. https://s.macrodatas.cn/article/indicator/prov-dd0f9c64fbc9e4f1fca88-rengongzhinengqiyezhuceshu-9a2886, 2026-04-10.
可直接复制上方引用格式至论文参考文献
Stata 读取代码
下载数据后,可使用以下 Stata 代码快速读取并设定面板结构:
* 读取数据
use "prov_rengongzhinengqiyezhuce_2000_2024.dta", clear
* 查看变量与前几行
describe
list in 1/10
* 编码省份变量(如尚未编码)
encode province, gen(prov_id)
* 设定面板数据结构
xtset prov_id year
* 描述性统计
summarize prov_rengongzhinengqiyezhuce, detail
* 简单面板回归示例
xtreg prov_rengongzhinengqiyezhuce x1 x2, fe
estimates store fe_model
如下载的是 Excel 格式,请先在 Stata 中使用 import excel "prov-dd0f9c64fbc9e4f1fca88-rengongzhinengqiyezhuceshu-9a2886_2000_2024.xlsx", firstrow clear 导入。
05
相关指标推荐