当前位置:首页 > 全国数据 > 正文内容

2007-2024年上市公司-投资者情绪数据

admin8个月前 (09-22)全国数据145

根据任晓松、孙莎、马茜(2024)提出的方法体系,投资者情绪指标的构建可遵循以下系统化流程:

步骤一数据获取:定向采集2007至2024年间财经网络社区(包括股票主题贴吧及行业论坛)发布的全部股票相关帖子,提取发帖人标识、发布时间、标题文本、阅读量等结构化信息。

步骤二文本预处理:对采集的原始文本实施系列净化操作:首先过滤无效及重复内容,随后采用jieba分词工具进行中文分词处理,剔除通用及领域特定停用词,最终通过TF-IDF算法将文本数据转换为机器可识别的数值向量。

步骤三情感分类与日度情绪计算:采用朴素贝叶斯分类模型将帖子划分为乐观、中性、悲观三类情感倾向。针对上市企业i,依据第n日乐观帖子数(posi,n)与悲观帖子数(negi,n)构建情绪因子:

smi,n=ln(1+negi,n1+posi,n)

该公式通过加1平滑处理保障数值稳定性,对数变换实现数据分布规范化。

步骤四年度情绪指标构建:以自然年为观测周期,对周期内所有交易日的情绪因子smi,n进行算术平均,形成衡量企业i在第t年投资者情绪水平的综合指标senti,t,有效捕捉市场参与者的中长期情感特征。

该指标体系通过整合网络文本大数据与机器学习技术,为量化分析投资者心理偏差对资本市场的影响提供可操作的测量工具。

数据名称:上市公司-投资者情绪数据

数据年份:2007-2024年

相关数据

股票代码、年份、 s_in、sent_(i,t)。

数据截图

下载地址:

付费查看下载地址


扫描二维码推送至手机访问。

版权声明:本文由一窝数据网发布,如需转载请注明出处。

本文链接:http://www.yiwoshuju.com/1833.html

“2007-2024年上市公司-投资者情绪数据” 的相关文章

2004-2022年交通事故相关数据

交通事故相关数据涉及多个方面,包括事故发生数量、死亡人数、受伤人数、直接经济损失以及交通事故率。交通事故是一个严重的社会问题,对人民群众的生命财产安全构成威胁。为了减少交通事故的发生,需要政府、社会和个人共同努力,加强交通管理、提高交通安全意识、改善道路条件、完善交通设施等。同时,也需要加强交通事故...

2000-2023年上市公司-企业产能利用率数据

产能利用率是指实际产出与生产能力(均以价值量计量)的比率,这个比率反映了公司生产设备、生产人员等资源的利用情况。是衡量企业生产效率的重要指标之一。如果产能利用率过高,可能说明公司的产能规划过于保守,或者市场需求超过了预期。而如果产能利用率过低,则可能表示公司的生产设备、人员等资源存在较大...

2000-2023年全国及30个省资本存量测算数据

资本存量是一个经济学概念,它指的是一个国家、地区或企业在一个特定时间点上所积累的全部资本资产的价值总和。资本存量是衡量一个国家或地区经济实力和生产能力的重要指标之一。它反映了长期投资积累的结果,对于经济增长、技术进步和生产力提升具有重要影响。以2000年为基准年份的基年资本存量的准确-引用单豪杰(2...

2000-2022年地级市-促进科技和金融政策(DID)数据

促进科技创新:地级市通过制定相关政策,旨在鼓励和支持科技创新活动,包括新技术、新产品、新工艺的研发和应用。金融资源优化配置:通过政策引导,实现金融资源向科技创新领域的优化配置,为科技企业提供更多的融资渠道和更低的融资成本。本数据参考《中国软科学》马凌远(2019)老师的做法,使用交乘项 Treat...

1985-2022年各省、地级市数字经济专利数据

数字经济专利数量是指在一个特定时期(如一年、五年或更长时间)内,与数字经济领域直接相关的专利申请或授权的总数。这些专利通常涵盖了一系列与数字技术、互联网、大数据分析、云计算、人工智能(AI)、区块链、物联网(IoT)等相关的创新成果。数字经济专利数量是衡量一个国家或地区在数字经济领域创新能力和技术发...

2008-2023年上市公司-环境绩效相关数据

上市公司作为经济社会的中坚力量,积极承担环境保护责任,不断提升环境绩效,已成为社会共识和必然要求。在此,我们详细展示上市公司在环境绩效方面的具体项目,彰显上市公司的绿色实力和持续努力。1、能源利用与节能2、温室气体排放3、废水管理4、固体废物管理5、废气排放控制6、噪声污染控制7、生态保护与恢复8、...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。