上市公司生成式人工智能水平
生成式人工智能(Generative AI)指通过学习大规模数据分布来生成文本、图像、音频与多模态内容的模型与应用体系,代表性路径包括预训练—对齐—推理的技术范式。其经济学意义在于重构信息生产与知识复用方式,进而影响企业创新、运营效率与风险治理等关键环节。
一、生成式人工智能
在企业层面,生成式人工智能可用于文档生成、客服与营销内容生产、研发辅助与代码生成、供应链计划以及知识库问答等;对外部环境冲击的适应力亦可能通过更快的信息加工与方案搜索得到提升。
二、生成式人工智能水平
借鉴相关研究思路,将“生成式人工智能关键词在企业年报中出现的次数”作为企业生成式人工智能水平的代理指标,可用于探究其与创新产出、经营绩效、韧性与风险暴露等社科实证问题的关系。样本期以1999–2024年为基准(可随数据更新延展)。
三、数据整理
- 整理所有样本企业的上市公司年报并转为纯文本格式。
- 确定生成式人工智能种子词与搜索范围,明确同义与派生词。
- 依据分词词典,使用 Python 对年报进行分词与文本抓取,统计生成式人工智能特征词词数。
- 对词数执行 ln(词数+1) 变换,得到平滑处理后的指标。
生成式人工智能关键词:
| 生成式人工智能水平 | 生成式人工智能词频总数 | 概念基础层 |
| 主要技术层 | 模型生态层 | 生成式人工智能 |
| Generative | AI | 生成式AI |
| Large | AI | Large |
| model | AIGC | 预训练模型 |
| Pretrained | Model | 大语言模型 |
| 人工智能基础模型 | LLM | 自然语言处理 |
| NLP | 知识图谱 | Transformer架构 |
| TensorFlow | pytorch | Keras |
| Caffe | MXNet | PaddlePaddle |
| 胶囊网络 | 生成对抗网络 | 扩散模型 |
| Diffusion | Models | GAN |
| VAEs | 变分自编码器 | 自回归模型 |
| Autoregressive | Models | 流模型 |
| Flow-based | Models | 多模态生成架构 |
| DALL-E | Bert | GPT |
| ChatGPT | XLM | ERINE |
| Vit | 讯飞星火大模型 | 通义千问 |
| 文心一言 | Lenet | AlexNet |
| ResNet | Mobilenet | Catalyst |
| TFX | EfficientNet | transformers |
| Horovod | Luminous | DETR |
| GRU | Torch | Bloom |
| CTRL | GLM | 盘古大模型 |
| 混元大模型 | LSTM | DGL |
| Caffe2 | CPM | Pythia |
| LLaMA | 百川大模型 | T5 |
| CPT | OPT | MPT |
| OpenFlamingo | mPLUG-Owl | KOSMOS-2 |
| ImageBind |
四、数据来源
A股上市公司1999–2024年年报文本;结合研究团队自建分词词典与停用词表进行规范化处理;关键词表与年报文本可随样本扩展与口径迭代及时更新。
五、参考文献
[1] 乔朋华, 杜鑫, 韩先锋. 生成式人工智能如何提升制造业企业韧性?[J/OL]. 科学学与科学技术管理, 1–22 [2025-11-05].
六、下载数据
如需下载生成式人工智能水平数据,可以通过以下两种方式进行下载:
- 方式1:点击文章标题旁的“进入数据库”进入数据下载页面。
- 方式2:下载地址:s.macrodatas.cn/data/sh/?id=1301