金融研究 | 央行货币政策文本相似度计算与可视化

本文利用金融情感词典和文本分析技术,分析中国人民银行货币政策执行报告的**文本情绪、文本相似度和文本可读性**等多维文本信息,刻画央行货币政策执行报告的文本特征,探究货币政策报告的文本信息与宏观经济和股票市场的关系。**实证研究发现,货币政策报告的文本情绪的改善会引起显著为正的股票市场价格反应, 报告文本相似度的增加会引起股票市场波动性的显著降低, 报告可读性对公布后股票市场的波动性影响不显著**。货币政策报告文本情绪还与诸多宏观经济指标显著相关。进一步研究发现,引起股票市场显著反应的是报告文本情绪中反映货币政策指引的部分,而反映宏观经济历史状态的部分对股票市场的影响不显著。本文从文本大数据分析角度证明了我国央行沟通的有效性,对国内央行沟通相关研究形成了有益补充。This paper uses text analysis techniques to analyze 71 Monetary Policy Implementation Reports ( hereinafter referred to as“the reports”) of PBOC,calculates the text sentiment ( tone) ,the similarity and readability and other text indicators of the reports,and explores the relationship between these text indicators and the macro economy and the stock market. Based on the Chinese financial sentiment dictionary developed by Jiang et al. ( 2020) ,this paper uses the sentiment unit method to calculate the tone of the reports. In addition,this paper uses TF - IDF weighted cosine similarity to characterize the similarity of the reports,and uses average sentence length to characterize the readability of the reports. The paper then uses correlation analysis to examine the relationship between the tone of the reports and macroeconomic indicators such as economic growth,inflation, and interest rates. With reference to Ehrmann and Fratzscher ( 2009) ,Zhang and Hu ( 2014) ,this paper adds tone,similarity and readability to the EGARCH model to explore whether textual indicators of the reports affect stock market returns and the volatility on the trading day after the release. Furthermore,this paper decomposes the content of the reports into two parts: economic and financial fundamentals and central bank policy guidelines,calculates the tone of the two parts and examines their impacts on the stock market respectively....

2023-01-10 · 2 min · 大邓

转载 | 大数据驱动的「社会经济地位」分析研究综述

大数据和机器学习技术的发展极大地促进了社 会经济地位的分析以及相关应用。 本文对应用于推断社会属性的大数据方法进行了全面的回顾,并系统地介绍了相应方法以及得到广泛使用的基准测试程序以及资源。 本文旨在提供 一份简洁、清晰的大数据方法应用于社会经济属性分析的概述,其不仅可以为对该方面感兴趣的读者提供帮助,而且可以为继续在该领域工作的研究人员和工程技术人员提供参考。

2022-12-30 · 1 min · 么晓明;丁世昌;赵涛;黄宏;罗家德;傅晓明

BERTopic | 使用推特数据构建动态主题模型

在本文中将使用BERTopic库,对美国前总统Trump推特数据集,构建动态主题模型DTM(Dynamic Topic Modeling),可视化文档数据集中不同主题随时间的演变(变迁)。...

2022-12-04 · 4 min · 大邓

JM2022 | 梳理营销领域使用网络爬虫技术的研究

Journal of Marketing 2022年一篇关于营销领域使用网络爬虫收集数据的文献...

2022-12-03 · 4 min · Boegershausen

社会学研究 | 社会计算驱动的社会科学研究方法

一篇关于计算社会学方法论的综述性论文

2022-12-03 · 1 min · 周涛