上市公司数字技术风险暴露数据(2007-2024年)
创始人
2025-12-10 16:32:55
0

上市公司数字技术风险暴露数据(2007-2024年)

上市公司数字技术风险暴露数据(2007-2024年)

上市公司数字技术风险暴露数据(2007-2024年)

上市公司数字技术风险暴露数据(2007-2024年)

一、上市公司数字技术风险暴露数据下载地址

1.先在百度搜索以下图片的内容:

上市公司数字技术风险暴露数据

2.然后到数据目录里找“上市公司数字技术风险暴露数据

二、上市公司数字技术风险暴露数据介绍

采用FinBERT 大语言模型对企业年度报告中的管理层讨论与分析(Management Discussion and Analysis,以下简称MD&A)部分涉及数字技术安全的相关论述进行文本情感识别,从而构建企业—年份层面的数字技术风险指标。

大语言模型是指用于处理自然语言信息的大型人工智能模型,其中,FinBERT是国内首个在金融领域大规模语料上训练的开流模型。这类模型利用注意力机制,得出对每个词上下文敏感的表示,能够捕获文本中的长距离依赖性和复杂关系,从而更细致地理解和生成语言。

选择企业年度报告MD&A部分的文本作为识别数字技术风险暴露程度的信息基础基于以下两方面的考虑:第一,大量文献证实MD&A部分具有客观有效的信息含量,存在风险揭示功能,并能增强财务报告的有用性。我们发现在MD&A中,部分企业会以独立段落重点写明企业面临的技术风险。例如,某企业指出:“公司技术革新风险:公司互联网视频业务对互联网的依赖程度较高,运营的安全易受到电讯故障、黑客攻击、病毒等因素的影响。”第二,基于MD&A部分信息识别企业风险暴露情况的做法在国内外众多文献中已经得到应用。

企业数字技术风险暴露变量的具体构造方式如下:

1.抓取数字技术风险相关的文本论述

首先从MD&A 部分的大量文本中识别出与数字技术风险相关的论述。对此,先构建出数字技术风险相关的关键词列表,并将关键词所在的句子提取出来作为后文训练和预测的基础。我们从技术风险的两大来源(数据风险和网络风险)分别选取了相关关键词。关键词的选取基础参考《工业和信息化领域数据安全风险信息报送与共享工作指引》(试行)和国家互联网信息办公室印发的《国家网络安全事件应急预案》中对数据风险和网络风险的定义和具体分类。此外,考虑到企业应用数字技术类型的差异,还包括了各种数字技术的具体风险。为提高关键词的普适性,还采用Word2vec模型扩展每个子类中涉及的关键词词典。

2.标注训练集

我们从经过关键词筛选后的句子论述中随机抽取了10% 的样本进行标注,以判断每条论述是否反映出企业在数字技术风险方面的暴露或采取了相应的防范措施,从而为下一步模型的预训练提供数据支持。为了提高标注的效率和准确性,采用GPT 和人工标注相结合的办法。考虑到语言差异因素,选取美国OpenAI公司的ChatGPT 和国内智谱清言公司的ChatGLM两种人工智能模型对数据进行识别分析。在标注过程中,通过提问“该论述是否反映了企业面临数字技术风险的暴露?”和“该论述是否反映了企业采取措施对数字技术风险进行了防范?”来获取ChatGPT 和Chat⁃GLM 的判断结果。对于两种人工智能模型判断不一致的句子或给出“不确定”判断的句子,我们进行了人工复核,以提高最终标注的准确性。我们将涉及因数字技术风险而可能对公司运营产生负面影响的相关论述界定为数字技术安全风险暴露,并同时将反映企业采取的数字技术风险防范措施的论述纳入变量计算过程。

3.模型预训练和预测识别

我们首先将标注的数据转化为适用于情感分类模型的训练集。具体来说,对于标注结果为“风险暴露”的文本赋值为-1,表示“负面”情感;对于标注结果为“风险防范”的文本赋值为1,表示“正面”情感。我们将数据按0.6∶0.4 划分为训练集和验证集,以此对模型进行预训练。模型的参数设置参考以往研究。在此基础上,设置模型评价的一系列指标,训练得到最终模型,并对预测集进行预测,得到全部数据的标注结果。

4.构建数字技术风险暴露程度指标

企业数字技术风险的最终暴露程度取决于以下两方面的差值:一是企业所披露的数字技术的最大风险点,即企业在数字技术应用中可能遭遇的最严重风险;二是企业在应对这些风险方面所积累的防范能力,这有助于降低其整体的数字技术风险水平,从而在一定程度上减少潜在的负面影响。我们将企业数字技术风险暴露(Digi_Risk_Exposure)定义为企业每年MD&A部分涉及数字技术风险的文本中,负面文本的负面情感概率最大值与正面文本的正面情感概率平均值之间的差值。这一构造使用最大风险点来捕捉企业的极端技术风险敞口,使用平均风险防范水平衡量企业的整体应对能力。进一步地,根据文本涉及的关键词差异,构建了数据安全风险(Data_Risk_Exposure)和网络安全风险(Cyber_Risk_Exposure)两个次级指标,为后文提供了细化的分析基础。

为了检验数字技术风险暴露指标的有效性,我们采用了以下方法:一是验证技术风险暴露与其他风险的相关性。数字技术风险不仅直接影响企业的生产和服务能力,还与其整体运营、财务结构和市场环境相互交织,从而对经营稳定性带来深远影响。我们发现技术风险暴露与企业财务风险、经营风险等其他风险之间存在显著正向关联。二是验证算法的准确率。我们在涉及数字技术风险的文本中多次随机抽取样本进行标注,并对模型判断结果进行人工审核,发现模型在处理数字技术风险相关的情感分析任务中表现出较高的准确性,尤其是在情感倾向明显的句子中。

相关内容

热门资讯

A股有色金属板块冲高 每经AI快讯,有色金属板块冲高,中色股份、豫光金铅涨逾6%,西部材料、洛阳钼业、湖南黄金等涨幅居前。...
原创 湖... 湖北银行和汉口银行哪个实力更强,取决于股权背景,资产规模,业务机构,盈利能力,资产质量,网点覆盖,战...
字节跳动 - 张一鸣的创业故事 张一鸣,一个80后的“技术宅”,在中国互联网行业中赫赫有名,作为字节跳动的创始人,他带领公司从一款新...
小红书矩阵号申请攻略:详细步骤... 小红书矩阵号申请全攻略 作为国内知名生活方式分享平台,小红书已成为品牌和个人扩大影响力的关键渠道。想...
原创 2... 2024年,全国各大城市的GDP榜单犹如一幅波澜壮阔的经济画卷,缓缓展开在世人面前,其中温州的异军突...
原创 银... 2025年银行迎来了新的一项变革,瞬间感觉到温暖了许多! 针对60岁及以上的老人提供了贴心的服务! ...
为什么许多小微企业选择助贷平台... 在现代社会,越来越多的个人和企业面临资金周转的问题,尤其是当银行贷款因信用记录不佳、缺乏担保或其它原...
贷款到账后,结果以“不是本人意... 明明都签了居间合同,贷款也帮客户拿到了,到收贷款中介费时,客户却以“《贷款居间合同》不是本人签署、协...
小红书账号如何更改领域?详细步... 如何调整小红书账号领域方向 在小红书运营过程中,许多创作者会遇到内容方向与个人定位不符的情况,及时调...