1999-2023年供应链风险感知、企业风险感知数据
从巨潮资讯网抓取沪深A股上市公司1999-2023年度报告,利用OCR转换为结构化TXT文本。对文本进行清洗剔除非中文内容及冗余字符,采用Jieba中文分词模块进行文本切分,保留有效语义单元。
基于国内外权威研究确定风险与供应链领域核心种子词词典构建与语义扩展,运用Word2Vec模型计算种子词余弦相似度,挖掘上下文关联的近义词群,结合词频统计与人工校验,确保词典覆盖度与语义准确性。
采用共现频率分析法,量化供应链词汇与风险词汇在文本窗口内的共现频次。
本文测算供应链词汇与风险词汇出现在上下文15词内的频次作为主要的核心解释变量,在稳健性中,以上下文5词、10词、20词进行检验。为了使回归结果更加直观,本文将供应链风险感知指标数值乘100。对于量纲的处理不影响回归结果显著性。
数据名称:供应链风险感知、企业风险感知
数据年份:1999-2023年
数据指标
证券代码 年份 总词数 基础Risk指标(5词窗口) 扩展Risk指标(5词窗口) 基础Risk指标(10词窗口) 扩展Risk指标(10词窗口) 基础Risk指标(15词窗口) 扩展Risk指标(15词窗口) 基础Risk指标(20词窗口) 扩展Risk指标(20词窗口)
数据截图

下载地址:
付费查看下载地址
“1999-2023年供应链风险感知、企业风险感知数据” 的相关文章
新质生产力是区别于传统生产力的先进生产力,它强调以科技创新为核心驱动力,追求高质量、高效率、可持续的发展模式。新质生产力是中国经济高质量发展的重要着力点。新质生产力代表了对传统生产力模式的超越,旨在应对全球科技变革和产业变革的挑战,推动经济结构优化升级,实现经济社会发展的新飞跃。本数据库基于生产力三...
CCAD(浙大卡特-企研中国涉农研究数据库)是一个针对“三农”领域学术研究及智库建设而倾力打造的涉农企业微观数据库,旨在促进中国农业经济研究的发展,服务国家“三农”发展战略。该数据库包含多个涉农微观数据子库,其中关于肥料、农药、绿色食品、农业重点排污企业的子库。数据名称:CCAD涉农微观数据子库(肥...
中国各区县新型城镇化试点DID(Difference-in-Differences,即双重差分法)数据主要来源于国家发展和改革委员会等官方机构发布的试点名单及相关政策文件。DID方法常用于经济学和社会科学研究中,通过比较实验组(即试点区县)和对照组(即非试点区县)在政策实施前后的变化,来评估政策效果...
企业风险承担水平是指企业在其生产经营活动中所承受的潜在可遭受损失的威胁程度。参考Johnetal.(2008)、余明桂等(2013)的研究,将公司Roa减去年度行业均值得到Adi_Roa,以缓解行业及周期的影响。由于中国制造业上市公司数量较多,观测值超过全样本的70%,因此对制造业企业的行业分类细化...
技术交易活跃度是一个衡量技术市场交易频繁程度和活跃性的指标。它反映了市场参与者对技术交易的热情和交易频率,是衡量市场交易活跃程度的重要工具。技术交易活跃度的评估对于投资者、企业以及政策制定者都具有重要意义。对于投资者而言,了解技术交易活跃度有助于他们更好地把握市场趋势、评估交易策略以及预测市场波动。...
万家企业是指年综合能源消费量 1 万吨标准煤以上以及有关部门指定的年综合能源消费量 5000 吨标准煤以上的重点用能单位。初步统计,2010 年全国共有 17000 家左右,因此称为“万家企业”。万家企业能源消费量占全国能源消费总量的 60%以上,是节能工作的重点对象。抓好万家企业节能管理工作,是实...