当前位置:首页 > 全国数据 > 正文内容

2007-2024年上市公司-投资者情绪数据

admin6个月前 (09-22)全国数据95

根据任晓松、孙莎、马茜(2024)提出的方法体系,投资者情绪指标的构建可遵循以下系统化流程:

步骤一数据获取:定向采集2007至2024年间财经网络社区(包括股票主题贴吧及行业论坛)发布的全部股票相关帖子,提取发帖人标识、发布时间、标题文本、阅读量等结构化信息。

步骤二文本预处理:对采集的原始文本实施系列净化操作:首先过滤无效及重复内容,随后采用jieba分词工具进行中文分词处理,剔除通用及领域特定停用词,最终通过TF-IDF算法将文本数据转换为机器可识别的数值向量。

步骤三情感分类与日度情绪计算:采用朴素贝叶斯分类模型将帖子划分为乐观、中性、悲观三类情感倾向。针对上市企业i,依据第n日乐观帖子数(posi,n)与悲观帖子数(negi,n)构建情绪因子:

smi,n=ln(1+negi,n1+posi,n)

该公式通过加1平滑处理保障数值稳定性,对数变换实现数据分布规范化。

步骤四年度情绪指标构建:以自然年为观测周期,对周期内所有交易日的情绪因子smi,n进行算术平均,形成衡量企业i在第t年投资者情绪水平的综合指标senti,t,有效捕捉市场参与者的中长期情感特征。

该指标体系通过整合网络文本大数据与机器学习技术,为量化分析投资者心理偏差对资本市场的影响提供可操作的测量工具。

数据名称:上市公司-投资者情绪数据

数据年份:2007-2024年

相关数据

股票代码、年份、 s_in、sent_(i,t)。

数据截图

下载地址:

付费查看下载地址


扫描二维码推送至手机访问。

版权声明:本文由一窝数据网发布,如需转载请注明出处。

本文链接:http://www.yiwoshuju.com/1833.html

分享给朋友:

“2007-2024年上市公司-投资者情绪数据” 的相关文章

2008-2021商业银行年度数据国有股份城商农商城镇民营银行汇总表

商业银行2008-2021年度数据包括国有银行、股份制银行、城市商业银行、农村商业银行、城镇银行、民营银行、农村合作银行、农村信用社等1700多家银行总共有2w多条数据。数据来源:银行年报、中国人民银行、中国银保监会变量包括:证券简称、年份、资产总计、负债合计、所有者权益合计、利润总额、净利润、贷款...

CCAD涉农微观数据子库(肥料、农药、绿色食品)

CCAD(浙大卡特-企研中国涉农研究数据库)是一个针对“三农”领域学术研究及智库建设而倾力打造的涉农企业微观数据库,旨在促进中国农业经济研究的发展,服务国家“三农”发展战略。该数据库包含多个涉农微观数据子库,其中关于肥料、农药、绿色食品、农业重点排污企业的子库。数据名称:CCAD涉农微观数据子库(肥...

2001-2023年上市公司-企业广告支出数据

广告支出是指企业为了宣传自己的商品或服务而在广告活动中的花费。根据销售费用明细项目,筛选出广告费、广告宣传费等与广告支出相关的项目,汇总计算得到总额。本数据包含原始数据、运行代码、最终结果(Excel 和 Dta)、 参考文献。数据名称:上市公司-企业广告支出数据数据年份:2000-2022年参考文...

2001-2023年上市公司-权益资本成本-PEG模型

权益资本成本是企业为获取和使用普通股资本而必须支付给股东的报酬率,它等于股利收益率加资本利得收益率,即股东的必要收益率。这一成本反映了股东对投资风险的补偿要求,是公司融资时必须考虑的重要因素。PEG比率越低,说明相对于其盈利增长速度,公司的股价被市场低估,因此可能具有较高的投资价值。数据名称:上市公...

2008-2022年农村集体产权制度改革试点

农村集体产权制度改革试点是我国农村改革的一项重要内容,旨在解决农村集体资产产权归属不清晰、权责不明确、保护不严格等问题,激活农村各类生产要素潜能,建立符合市场经济要求的农村集体经济运营新机制。农村集体产权制度改革试点地区以及试点开展时间来源于国家发展和改革委员会网站历年公布的改革试点名单。数据名称:...

中国行政村级区划代码及经纬度

随着时代的进步,中国的行政区划体系不断完善,每一个行政村级单位都拥有其独特的区划代码。中国行政村级区划的经纬度数据,更是精准地描绘了每一个村落的地理位置。从北国的雪域高原到南疆的热带雨林,从东部的浩瀚大海到西部的广袤戈壁,每一个村落都以其独特的经纬度坐标,镶嵌在祖国的版图上。数据名称:中国行政村级区...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。