管理世界 | 政府与市场心理因素的经济影响及其测度

本文益处

阅读此文可以对以下几个方面有新的收获

经济主体预期理论
测度经济主体心理因素方法论基础
测度经济政策不确定性、央行沟通与预期管理、通胀预期、预期冲击、经济主体信心与情绪等方面的应用
非结构化大数据测度心理因素及其影响所面临的主要困难与问题
非结构化大数据实证研究主要方法论的发展趋势和研究重点
……

洪永淼,刘俸奇,薛涧坡. 政府与市场心理因素的经济影响及其测度[J].管理世界,2023,39(03):30-51.

摘要: 政府与市场关系是经济学的世界性难题，也是中国特色社会主义市场经济的核心问题。在政府政策制定与实施过程中，经济主体会基于自己掌握的信息和认知能力，学习、解读政策含义，形成对政策影响的预期，并基于自身利益最大化原则做出最优决策，从而影响宏观经济运行。因此，研究政府政策背景下各类经济主体的预期等心理因素的产生原因与形成过程，以及经济主体心理因素对经济运行与政策效应的影响机制，是深刻认识政府与市场关系的一个重要视角。本文提出利用人工智能特别是机器学习方法，从海量非结构化大数据提取政府政策变化与各类经济主体对政策变化的反应等信息，从理论和实证两个层面分析经济政策与经济主体的互动关系，以及经济主体心理因素如何影响经济运行与政策效应，并探讨发展非结构化大数据计量经济学，推动形成分析经济政策背景下经济主体心理因素及其影响的实证研究范式，以深入研究政府与市场关系。

关键词：政府与市场关系心理因素文本数据非结构化大数据政策传导机制

一、引言

本文提出一个基于政府政策背景下济主体心理因素的产生、形成与变化来研究政府与市场关系的研究思路。经济政策的落脚点是经济主体，通过影响经济主体决策发挥作用。而经济主体具有主观意识与前瞻性思维，在政府制定、实施政策过程中，经济主体会基于自己掌握的信息和认知能力，学习、解读政策含义，形成对政策影响的预期，并基于自身利益最大化原则，做出最优决策。在政府政策的传导机制中，经济主体的预期以及由预期衍生的情绪等心理因素发挥着重要作用。在社会经济活动中，心理因素比比皆是，包括福利经济学的幸福感、市场营销学的客户满意度、金融学的投资者情绪、微观经济学的企业家精神与风险偏好、宏观经济学的政策不确定性、社会学的社会信任与社会声誉、新闻学的社会舆情与媒体关注度、教育学的学生学习压力、政治学的群体政治倾向，以及人文学的文化因素（文化是长期实践中形成的比较稳定的社会或群体心理，如企业文化）等。在金融市场中，流动性陷阱、羊群效应、资产与房地产泡沫、金融传染病等现象，都与投资者情绪特别是与偏离经济基本面的乐观或悲观情绪相关（席勒，2001）。马克思主义认为，社会存在决定社会意识，同时社会意识对社会存在具有反作用。经济主体心理因素是对客观经济现实的主观反映，由客观因素决定。另一方面，经济主体心理因素会影响经济主体决策，从而影响政府政策效应与宏观经济运行。

长期以来，由于测度心理因素所面临的困难与挑战，研究者大多只能采用定性分析方法研究经济主体心理因素及其影响。随着大数据革命和数字经济时代的来临，各级政府与各类经济主体在数字经济活动中产生海量经济大数据。大数据特别是非结构化大数据，如文本、图像、音频、视频等数据，包含传统结构化数据没有的信息，包括政府政策变化（如语调变化）与各类经济主体对政策变化的反应等。使用人工智能特别是机器学习技术，可从非结构化大数据中提取各类经济主体心理信息，构建心理变量，将原来的定性分析转变为符合现代经济学实证研究范式的定量分析。由于非结构化大数据包含政府政策变化、重要事件冲击以及各类经济主体对政策变化与重要事件冲击的反应等信息，经济学家可基于非结构化大数据从经济主体心理因素视角研究政府与市场关系。近年来，随着自然语言处理技术的迅速发展，利用文本数据测度经济主体心理因素及其影响，已成为经济学、金融学、会计学、社会学以及政治学等学科的一个热门领域（格里默、斯图尔特， 2013；埃文斯、阿希维斯，2016；洛克伦、麦克唐纳，2016；根茨科等，2019）。本文的主要目的是提出基于非结构化大数据提取政府政策变化与各类经济主体对政策变化反应等信息的研究思路，分析政府政策变化如何影响各类经济主体的预期等心理因素，从而影响经济运行与政策效应，探讨如何发展非结构化大数据计量经济学，推动形成分析政府政策背景下经济主体心理因素及其影响的实证研究范式，以深入研究政府与市场关系。

二、预期、情绪与经济政策：理论视角

预期在经济活动中发挥着重要作用，预期管理是宏观经济管理的一个重要手段。

2.1 预期与预期形成机制

经济学与自然科学的一个根本区别在于，经济主体决策具有前瞻性（埃文斯、洪卡波希亚，2001）。宏观经济学中，预期发挥着关键性作用。虽然经济学家对预期重要性有一定共识，但对预期形成机制却有不同理解。目前，宏观经济学有 3 种主要假设解释预期的形成机制，分别是适应性预期、理性预期以及适应性学习。

适应性预期可追溯至计量经济学先驱者之一费雪（费雪，1911），在 20 世纪 60~70 年代流行于宏观经济学，其核心思想是，经济主体利用一部分历史信息预测经济未来趋势，属于后顾行为。在适应性预期假设下，未来的政策变化不一定能够影响经济主体当前的行为决策，因此宏观经济学模型的预测能力也极为有限。

理性预期概念由穆斯（1961）正式提出，假设经济主体能够充分利用所获得的全部信息对未来进行预期，其主观期望与客观的数学期望相一致，不存在系统性预期偏差，且具有前瞻性。 1995 年诺贝尔经济学奖获得者卢卡斯（1976）指出，不确定性市场条件下经济主体的理性预期对政策效应有重要影响。例如，理性预期的经济主体能够预见政府货币政策对未来经济的影响，形成对货币政策的正确预期，并且根据预期提前做出反应，最终会导致货币政策失效，即货币是中性的。这是著名的“卢卡斯批判”。此后，以理性预期为基础的动态随机一般均衡模型成为现代宏观经济学政策分析的一种主流方法。

虽然理性预期理论广泛应用于政策分析，但其没有考虑经济主体形成预期的动态过程，也没有考虑经济主体在收集、处理信息以及认知能力等方面的局限性。首先，理性预期假设经济主体不存在系统性认知偏差，这种理想状态需要长期反复试错才能实现。理性预期可被理解为经济运行过程中的一种长期均衡状态。事实上，实证研究表明，货币政策并不是中性的（克里斯蒂诺等，1999）。其次，理性预期理论存在某些缺陷（阿克洛夫等，2000；席勒，2014），例如理性预期假设较为严苛，要求经济主体具备同质性，信念一致且具有充分信息，完全了解模型的结构、外生参数以及政策实施前后的经济特征。但是，神经经济学研究揭示了经济主体认知水平的有限性（卡默勒等，2005），且经济主体异质性是一个普遍现象（李戎等，2022）。例如，中国目前有超过 1.6 亿个市场主体，其中，国有企业、民营企业、个体工商业者、港澳台企业、外资企业存在巨大异质性。

基于上述原因，宏观经济学在理性预期基础上提出一个新的预期理论，即适应性学习（萨金特，1993， 1999；埃文斯、洪卡波希亚，2001），假设经济主体能够感知长期均衡状态下的经济运行规则，利用其所有可得信息采用最小二乘法估计上述规则，并随数据集的更新不断改进预期效果。由于经济主体在适应性学习过程中利用了其所有信息，经济政策能够通过不断改变市场预期而影响经济运行（埃文斯等，2009）。

适应性学习可视为有限理性的一种表现形式。 1978 年诺贝尔经济学奖获得者西蒙（1982）认为经济主体获取信息存在成本，且经济主体处理信息的能力有限，不能充分利用其所获得的信息。在有限理性基础上， 2011 年诺贝尔经济学奖获得者西姆斯（2003）提出理性疏忽概念，认为经济主体在获得、吸收与处理信息时需要一定成本，只能从完全信息中选取部分形成预期。由于获得的信息有限，经济主体不会对政策信号给予足够关注，因此政府通过市场预期影响经济运行的效果受到限制。除了理性疏忽外，涉及有限理性的理论还有不完全信息理论与粘性预期理论等（安吉雷托斯、连，2018）。随着计算技术的发展，有限理性由于更贴近现实而在财政与货币政策领域得到广泛应用，成为当前宏观经济学的一个研究热点。

2.2 预期与经济波动

政府释放的政策信号会影响经济主体预期，产生乐观或悲观情绪，继而影响其决策（凯恩斯，1936）。经典文献认为经济主体预期可分为两部分，一部分是与宏观经济基本面相关的理性估算，另一部分是与宏观经济基本面无关的“动物精神”或情绪因素（巴斯基、西姆斯，2012）。本节描述经济政策消息冲击、经济政策不确定性冲击与经济政策情绪冲击影响经济主体心理的形成机制以及经济波动的传导渠道。其中，经济政策消息冲击和经济政策不确定性冲击与经济基本面相关，而经济政策情绪冲击与经济基本面无关，属于非理性因素。

经济政策消息冲击

“消息冲击”（也称“预期冲击”）的概念最早由庇古（1927）提出。庇古指出，当公众获得未来经济景气的消息并形成乐观预期时，为应对总需求增加，公众会提前进行资本积累，从而造成当前经济繁荣，这被称为“庇古周期”。与传统实际冲击的区别在于，消息冲击不会影响当前经济基本面，但有可能改变未来经济基本面。

经济政策消息冲击产生的客观原因是经济政策存在内部时滞与外部时滞（利珀等，2013）。内部时滞是指经济政策变动从提出草案到确定实施之间存在时滞。

理性预期是经济政策消息冲击形成的理论基础。经济主体信息集包含了其在当前可获得的全部信息。在经济政策实施之前，经济主体就捕获到了未来经济政策变动的消息，对其当前行为做出相应调整，从而引起经济波动。实证研究表明，预期冲击是产生经济波动的重要原因，甚至比经济政策实际冲击更重要（施密特· 格罗赫、乌里韦，2012）。利好的经济政策消息冲击会引起当前经济扩张，这为政府利用预期调控经济提供理论基础与经验支撑。

经济政策不确定性冲击

经济政策不确定性是指经济主体无法预见未来政策发生变化的可能性（奈特，1921），这是经济主体形成预期的重要因素。经济政策不确定性包括经济政策能否出台、何时出台、执行力度以及执行效果等（居伦、伊昂，2016）。贝克等（2016）构建的经济政策不确定性指数将经济政策不确定性细化为政策制定者、政策制定时间与政策内容变化的不确定性。

经济政策的模糊性或噪音可用来刻画经济政策不确定性。假设经济主体获得的经济政策变化的信息集包含政策变化消息与政策噪音两部分，其中政策噪音的方差测度经济政策不确定性的大小。经济主体感知到的经济政策不确定性程度随噪音方差的增大而提高。当噪音方差趋于 0，即不存在经济政策不确定性时，经济主体将完全依照获得的经济政策变化信息做出决策；当噪音方差趋于无穷大时，经济主体认为接收到的经济政策变化信息都是噪音，将不会做出任何反应。因此，经济政策不确定性直接作用于经济主体信息集，影响其预期形成，从而影响经济主体决策（费沃、皮特伦蒂，2016）。为了抑制经济政策不确定性的消极影响，里科等（2016）认为政府与经济主体之间应该加强政策沟通协调。

经济政策情绪冲击

经济政策情绪冲击是指与未来政策基本面无关的乐观或悲观情绪冲击。这一思想最早源于凯恩斯的“动物精神”，认为经济主体行为与经济基本面无关，乐观与悲观情绪是驱动经济波动的主要力量。经济主体许多情绪是从其预期衍生出来的。例如，由于宣布某个重大利好政策，经济主体改善了对未来经济增长的预期，由此产生一种乐观情绪。反之，如果出现一个重大负面冲击，经济主体将下调对未来经济增长的预期，由此产生一种悲观情绪。一个人的情绪也可能受其他因素影响，如受其他经济主体的情绪传染（席勒，2001，2019）。

“动物精神”是非理性心理因素，但现代宏观经济学尝试从理性预期视角讨论经济政策情绪冲击，并使用“预期自我实现”概念刻画情绪冲击对政策效应的影响。例如，施密特·格罗赫和乌里韦（1997）分析了平衡预算法则下征收个人所得税产生“预期自我实现”均衡的可能性。当政府财政支出总量不变时，经济主体减税预期会形成乐观情绪，提高劳动供给，产生扩张效应。由于经济总量增加而政府支出规模不变，政府减税成为可能，从而实现了经济主体最初的减税预期。情绪冲击还应用于货币政策研究（黄等，2009）。但鲜有理论刻画政府政策提升经济主体信心的作用机制，吉马良斯等（2016）通过理论模型说明政府财政支出增加会引发经济主体对社会投资的乐观情绪而提振信心，实现经济扩张，为财政政策提振经济主体信心奠定微观理论基础。

2.3 情感因素

经济主体情感因素也会影响其决策。情感因素包括人天生拥有的攀比、妒忌与信任等本能心理因素。新古典经济学认为经济主体是完全理性，忽视了由人性产生的复杂情感体验（卡默勒等，2005）。神经经济学、认知经济学与基因经济学证实经济主体情感因素的存在。例如，多曼等（2011）利用核磁共振神经影像技术，比较经济主体血氧水平变化来研究经济主体是否存在攀比效应。布鲁尼洛等（2020）发现，经济主体的基因会影响其性格等心理因素，从而影响经济主体行为。

经济政策如何通过经济主体情感因素影响宏观经济是当前一个研究热点。在现代经济中，服务业特别是消费性服务业是经济主体情感产生、交流与传递的过程，情感因素对服务业的发展有重要影响。传统政策分析建立在理性预期基础上，但随着行为经济学与实验经济学提供日益丰富的实证证据，越来越多的学者关注经济主体情感因素对经济政策传导机制的影响。行为经济学通过洞察经济主体心理活动分析经济主体的行为决策，为经济学理论创新提供心理学证据。经济政策与经济主体心理因素相互结合，催生了行为财政学与行为货币经济学，奠定了宏观经济政策分析的微观行为基础，为研究政府与市场关系提供了全新分析框架。

行为财政学最早由麦卡弗里和斯莱姆罗德（2006）提出，将传统经济学基本原理的“理性”部分与行为经济学的“非理性”部分（或心理因素）结合起来，研究财政政策传导机制。财政支出可通过经济主体同群效应这一外部性因素影响宏观经济运行。 同群效应是指经济主体效用函数不仅取决于自身条件，还受其所处社会地位（用消费、收入或工作时间等衡量）的影响。在消费层面，政府支出可通过经济主体之间的攀比效应对产出产生扩张效应（黄等，2022b）。具体机制是，政府支出增加能够提高社会平均财富，具有攀比心理的人会增加工作时间来追赶其他人的消费水平，从而推动产出扩张。同群效应的另一表现形式是经济主体工作时间的“内卷”，费沃等（2013）发现政府支出增加能够提高社会平均工作时间，由于存在“内卷”心理，个体观测到别人增加工作量后也将努力工作，最终促进产出扩张。

在财政收入端，现有文献认为存在“税收遵从之谜”，即传统理性经济人假设认为经济主体依法纳税程度会随着税务机关逃税处罚力度加大而增强，但实证研究发现两者存在负相关。这涉及经济主体心理因素的作用机制：当处罚力度过大时，经济主体会感受到不公平或出现逆反心理，从而产生税收不遵从行为（温策尔， 2003）。同样，政府可利用经济主体心理因素增强其税收遵从能力，丹尼夫等（2021）发现，税务部门采用威慑手段可增强征税能力。此外，财政幻觉理论认为，由于经济主体存在认知偏差，经济主体感受到的纳税负担会小于实际纳税负担，从而降低其逃税动机，减少规避政府税收的影子经济规模（布恩等，2012）。

行为货币经济学由罗瑟利（2015）提出，将心理要素纳入传统货币政策分析框架中，探讨货币政策通过心理因素发挥作用的传导机制。例如，信任对货币政策效应具有重要影响。布尔西安和法亚（2018）发现，经济主体对央行信任下降会恶化货币政策实施效果。史蒂文森和沃尔弗斯（2011）和李新荣等（2014）发现，经济主体对中央银行的信任程度会影响通胀预期。当经济繁荣时，经济主体对央行有较强的信任度，从而产生较低的通胀预期。

经济主体心理因素也可解释现代货币政策理论中的悖论。德尔内格罗等（2015）发现新凯恩理论存在 “前瞻性指引之谜”，即央行发布未来名义利率变化会引起产出与通胀波动，基于理论模型估算的波动率大于实际数据的波动率。为解决上述难题，艾劳多（2020）将经济主体面临的诱惑和自控力等心理因素加入效用函数，发现修正后的新凯恩斯理论结果与经验证据一致，较好解释了传统理论模型存在的“前瞻性指引之谜”。

三、经济学心理因素测度：非结构化大数据视角

经济学理论分析，特别是经济学建模，是理解经济主体心理因素及其影响的理论基础。第二节的各种预期理论为人们理解政策变化如何影响经济主体预期，以及经济主体预期如何影响政策效应提供了学理基础。更一般地，经济主体的心理活动，如预期、信心、情绪、情感等的产生、形成与变化，具有规律性，可通过经济学建模，包括使用数学模型，结合经济学与心理学理论进行研究。例如，人工神经网络模型就是根据认知科学关于人脑认知理论而提出的一个模仿人脑认知过程的数学模型或非参数模型，可用于近似任何未知平滑函数，具有所谓泛逼近性质（怀特，1992），已成为机器学习的一个重要方法。反过来，可借助数学模型研究经济主体的心理活动规律。例如，人工智能特别是机器学习可用于研究经济主体预期的产生、形成与演变过程。相对于宏观经济学中基于最小二乘法估计的适应性学习机制，基于机器学习的适应性学习不必假设经济主体能够感知均衡状态下的经济运行规则，机器学习能够充分利用经济主体所获得的信息，捕捉预期形成与变化过程中各种线性与非线性动态特征，最终趋近未知的经济运行规则。

任何经济理论都建立在一定的假设基础之上，这些假设是否与经济现实相吻合、经济理论能否解释经济现象，都是需要回答的重要问题。解决这些问题的关键是通过基于数据的实证研究，检验从经济理论推导出的可实证的重要预测或结论是否正确。从实证研究视角分析政策变化如何影响经济主体预期等心理因素从而传导到经济运行的一个关键问题是，如何测度反映政府与市场互动关系的经济主体心理因素。长期以来，心理因素测度一直面临诸多挑战与困难，甚至有人质疑心理因素是否可以测度。例如，经济统计学鼻祖威廉· 配第认为，经济主体心理因素是不可测度的，他在 1672 年出版的代表作《政治算术》中说：“ 至于那些从某些人的容易变动的思想、意见、胃口和情绪为依据的原因，则留待别人去研究。这里我敢明白地、老实说，以这些因素（容易变动的思想等等）为依据（即使这些因素可以叫做依据）的原因是不能谈得透彻的。”（配第，2014）。

事实上，现代心理学与实验经济学对经济主体心理因素能否测度的问题，已提供了肯定的答案。现代心理学有一门方法论学科叫心理计量学，该学科依据心理学理论，使用科学方法与工具测度人的能力、人格以及心理健康等心理特征与行为。常用方法包括观察法、访谈法、问卷法、实验法、心理物理法等。心理测度著名的例子包括对智商和情商的测度。但是，心理学与实验经济学对心理因素及其影响的测度，大多通过实验室、观察访谈或统计调查等方式，其研究的深度、广度与抽样频率不可避免受到各种限制与约束。例如，经济主体幸福感是福利经济学一个非常重要的心理变量。人们常采用问卷调查形式评估调查对象对于家庭、健康、安全、价值观、自由、幸福以及生活满意度等多方面的“表述性偏好”，以此构建指数测度幸福感（班杰明等， 2014）。美国家庭调查数据库通过问卷调查测度经济主体幸福感。受访者以七分制回答问题：“你认为这些天的情况如何？”，其中数值“1”定义为“非常不开心”，数值“7”为“非常开心”，中间取值没有明确定义。中国家庭追踪调查也包含有关个人幸福感的问卷问题。但这种自我报告的幸福感指数无法有效进行跨群体比较（邦德、兰格，2014），并且由于幸福感测度结果还依赖于回答者（包括其所处环境）以及问题的措辞，因此自我报告的幸福感指数的真实性存在一定质疑（迪顿、斯通，2013）。

随着互联网、移动互联网、物联网以及数字经济的蓬勃发展，各级政府与各类经济主体在数字经济活动中产生海量大数据，这些经济大数据包含政府政策变化、重要事件冲击以及各类经济主体对政策变化与重要事件冲击的反应等信息。人工智能技术的发展和大数据可获得性的提升，为实证研究政府与市场关系提供了一个可行方法。大数据，特别是文本、图像、音频与视频等非结构化大数据，包含很多传统结构化数据没有的信息，如政府政策的语调变化与经济主体的预期、信心、情绪、情感等，特别是，语言是人类进行信息传递、情感交流与沟通的最主要工具，因此文本数据包含大量各类经济主体的心理信息，可通过自然语言处理技术提取。文本数据以及其他非结构化大数据的来源主要是社交数字平台、电商平台、上市公司财务报告、新闻报纸与其他新闻媒介、各级政府工作报告、会议纪要、公告、声明、谈话，以及政府领导人公开发表的文章等。文本数据可分为正式文本数据与非正式文本数据。正式文本数据主要包括政府工作报告、政策文件、官方新闻媒体报道与上市公司披露文件等官方文本；非正式文本数据包括社交网络文本（如微博、微信公众号等）与网络论坛文本（如股吧）等个人文本。在形式上，正式文本具有内容规范、表述相对客观以及信息密度高的特点；非正式文本信息密度较低，但包含大量口语与俚语等非正式语言，提供额外信息。从文本数据中构建心理变量后，可代入计量经济学模型中，定量研究其经济影响。这样，原来只能进行定性分析的问题，可转化为较严谨的定量实证研究。这种研究范式通常称为文本回归。

与观察访谈、统计调查以及实验方法相比，基于海量非结构化大数据的心理因素测度具有更广泛的样本代表性，可在较大程度上减少样本选择偏差。非结构化大数据具有高频性或实时性，可构建心理变量时间序列数据，甚至高频时间序列数据，用来刻画经济主体心理变量的动态特征。海量微观行为大数据还包含经济主体之间互动关系信息，有助于研究情绪等心理因素如何在经济主体中相互传染。但是，大数据不是统计调查数据，而是数字经济活动的数字化记录或观测数据。大数据特别是非结构化数据种类繁多，结构复杂，来源不一。因此，从这些非结构化大数据中提取经济主体心理信息并对其进行实证建模分析，在方法与技术上具有相当挑战性。在第四节和第五节中，我们先介绍目前经济学、金融学、会计学等学科使用文本数据测度经济主体心理因素及其影响的实证研究成果，然后讨论如何构建基于非结构化大数据分析政府政策变化与经济主体心理因素互动关系的实证研究范式。

四、文本数据与经济主体心理因素测度：实证视角

文本数据分析是当前经济学、金融学、会计学等学科的一个主流实证研究范式，其中自然语言处理是最主要的文本数据信息提取技术，常用方法包括词典法、主题模型、词向量法等。具体步骤为：

使用分词技术对文本数据进行分词处理，生成文本矩阵，通常采用独热表示法将上述矩阵转化为高维稀疏数据矩阵，然后再使用词嵌入技术进行降维处理，最终将非结构化数据转化为数据矩阵。
采用统计方法将数据矩阵转化为目标信息，根据是否存在训练集，可分为词典法或主题分类模型等无监督学习方法，以及包含深度神经网络与卷积神经网络等新兴深度学习技术的有监督学习方法（沈艳等，2019）。

在这一节，我们讨论如何基于文本数据测度 经济政策不确定性、央行沟通与预期管理、通胀预期、预期冲击、以及经济主体信心与情绪。

4.1 经济政策不确定性的测度

经济政策不确定性是研究政府与市场关系的一个重要内容。相关实证研究涉及财政政策不确定性、货币政策不确定性、贸易政策不确定性等。在现实经济中，政策不确定性在不同程度上与不同范围内一直存在，影响经济主体行为决策与经济运行。传统方法基于时间序列计量经济学模型，将经济政策波动性视为不确定性。由于经济政策与产出等变量相互影响，基于时间序列模型的经济政策不确定性包含宏观经济不确定性，因此，这种方法存在内生性问题（凯利等，2016）。为解决此问题，有学者将非经济虚拟变量作为代理变量测度经济政策不确定性，例如朱利欧和约克（2012）采用选举变量测度经济政策不确定性，但其缺点是所测度的政策不确定性时变性较差。除计量经济学建模方法外，有文献基于调查数据构建经济政策不确定性指数，但这种指数仅能刻画某一政策不确定性，或政策不确定性的某一方面，不能全面刻画经济政策不确定性。此外，接受调查人员可能存在样本选择偏差或系统性预测误差，导致政策不确定性测度的主观性较大（朱拉多等， 2015）。

文本数据分析能够捕捉经济主体对经济政策不确定性的真实感知，已成为测度经济政策不确定性的主流方法。贝克等（2016）在这方面做出开创性贡献，他们选取美国最具影响力的 10 家报纸，统计了每月包含经济、政策与不确定性等关键词频数，构建了美国经济政策不确定性指数。随后，黄和陆（2020）采用中国大陆报纸测度中国经济政策不确定性月度指数。陈和钟（2019）开发了新的机器学习算法（包括单词嵌入、多层感知器和递归神经网络等），根据《人民日报》中文文本数据构建了中国政策变化指数。

贝克等（2016）的方法可用于构建各种分类政策不确定性指数。例如，赫斯特德等（2020）基于《华盛顿邮报》《华尔街日报》以及《纽约时报》测度了美国货币政策不确定性。汉德利和利茂（2017）以及卡尔达拉等（2020）构建了美国贸易政策不确定性指数。李和徐（2019）测度了美国地方税收政策不确定性指数。朱军（2017）基于汉语语境特征分析中国财政政策不确定性。陈英楠等（2022）利用中国六家主流报纸构建了房地产政策不确定性指数。部分学者还从经济主体主观感受角度构建政策不确定性指数。邦坦皮等（2016）基于经济主体在其谷歌搜索时使用与经济政策不确定性相关的词汇量构建了美国政策不确定性指数。聂辉华等（2020）利用中国 A 股上市公司年报测度了中国企业对经济政策不确定性的主观感受。本古里亚等（2022）基于中国上市公司年报构建了中国企业视角下贸易政策不确定性指数。

4.2 央行沟通与预期管理

在现实经济中，中央政府与各级地方政府之间、不同政府部门之间以及政府与各类经济主体之间的信息传递经常遇到障碍，导致政策在从中央到地方政府传导过程中，被曲解或层层加码，或者在从政府向经济主体传导过程中，引起经济主体过度反应。例如，2021 年，政府有关部门相继出台了一些反垄断措施，规范数字经济平台、资本市场以及文化市场有序发展，以保障国家数据安全与经济安全，保护劳动者、消费者、中小企业等社会弱势群体的合法权益，同时还出台促进共同富裕的远景目标与政策措施。这些政策在方向上是正确的，但却引起了部分市场主体的不安情绪，导致国内外市场波动。这在一定程度上反映了政策不确定性的客观存在，同时也反映了政府与市场在政策沟通过程中存在堵点，有待化解、改进（洪永淼，2021）。在这方面，一些国家央行在出台前瞻性货币政策时，通常会与市场主体密切沟通，尽量减少市场波动，这值得借鉴与学习。

央行传统预期管理注重实际政策措施，而现代预期管理则强调央行与经济主体的沟通交流（莫里斯、茜恩，2018）。 2008 年金融危机后，受零利率下限约束，以调节名义利率为基础的通胀预期管理失效，央行无法通过利率渠道影响消费与投资，央行沟通便成为一个重要的新型货币政策工具（伯南克，2020）。所谓央行沟通是指央行向经济主体公布货币政策目标与规则、经济展望以及货币政策走向等相关信息的过程（布林德等， 2008）。央行沟通可释放货币政策变化消息，降低经济主体所感知的货币政策变化中的噪音成分，促使经济主体形成比较一致的预期，这已成为央行通过预期调节经济运行的一个重要方式，甚至比实际货币政策操作还重要（汉森、麦克马洪，2016）。央行沟通通过释放经济展望与前瞻性指引等信息改变经济主体预期，因此央行沟通文本数据包含经济主体关于货币政策预期的丰富信息。 评估央行沟通效果已成为当前宏观经济学与金融学研究的一个热点，也为丰富货币政策预期管理理论提供实证基础。虽然中国尚未受零利率下限的影响，但央行沟通在引导中国经济主体预期方面也发挥着重要作用。易纲在《人民日报》发文指出，建设现代中央银行制度要使货币政策沟通制度化，有效管理和引导市场预期（易纲，2022）。

目前，中国央行沟通语料库包括口头沟通与书面沟通。口头沟通主要包括央行领导人讲话、采访、新闻发布会、窗口指导等；书面沟通主要包括每季度定期发布的《货币政策执行报告》以及《金融稳定报告》和央行货币政策委员会的会议纪要等。书面沟通相较于口头沟通更为正式，沟通也更加常态化。 如何从口头与书面沟通文本数据获得经济主体所感知的政策语调是现有研究的难点，林建浩等（2021）根据中国央行沟通特有的表达习惯，将自建词典与通用词典相结合，采用栅栏分布式多项回归模型解决文本数据的高维性和稀疏性问题，测度中国央行沟通指数。 目前测度央行沟通的方法有叙事法、主观赋值法、措辞提取法以及机器学习方法。与前 3 种方法相比，机器学习方法在提取央行沟通信息方面具有明显优势，这种方法可构建文本情绪、文本相似性以及文本可读性等指数。在文本情绪方面，现有文献通常使用哈佛大学通用调查词典（第四版）等特定词典构建美联储沟通情绪指数（杰加迪西、吴，2015；施默林、瓦格纳，2019），以及测度欧洲央行货币政策立场（皮考特、雷诺，2017），而姜富伟等（2021a）基于中文文本分词方法与情绪词典构建中国央行沟通情绪指数。 文本相似度是指不同的央行沟通文本数据在遣词造句或表达含义上的相近程度，可反映政策发布者信息公布的谨慎程度。现有文献大多使用词频向量的余弦相似性测度文本相似度（埃尔曼、塔勒米，2020）。 文本可读性是指经济主体阅读与理解央行沟通文本的难易程度。洛克伦和麦克唐纳（2014）使用弗莱什易读指数刻画了美联储货币政策文本可读性。费拉拉和安吉诺（2022）使用有监督与无监督的机器学习方法从欧洲央行演讲与推文等文本中提取主题信息，也采用弗莱什易读指数系统刻画欧洲央行沟通清晰度。

4.3 通胀预期的测度

通胀预期在现代宏观经济学特别是货币政策研究中占有重要地位，影响经济主体投资决策和政府政策制定。在新凯恩斯理论中，央行货币政策规则从盯住当前市场的通货膨胀率，逐渐发展为包含通胀预期的前瞻性规则（黄等，2009）。因此，精准测度并管理通胀预期决定了货币政策的有效性。由于传统计量经济学模型可能包含过多噪音，通过构建计量经济学模型提取金融市场有效信息来预测通胀的效果并不理想（鲍尔、麦卡锡，2015）。大型机构关于通胀预期的调研数据似乎是更好选择。现有研究表明基于调查数据的通胀预期预测结果优于计量经济学模型的预测（安等，2007；福斯特、赖特，2013），但调查数据本身存在不少缺点。例如，受成本限制，调查群体仅包含市场中的小部分个体且抽样频率过低。此外，调查获得的专家与居民两组通胀预期数据在预测未来通胀能力方面差异较大，央行在制定货币政策时需要对两组通胀预期数据赋予不同权重（利齐亚克、盛，2021）。

电话、报纸与网络等媒体是经济主体理解政策与市场的重要中介，经济主体通常从媒体间接获得通胀预期信息，而不是直接在市场中花费大量时间追踪信息（卡罗尔，2003）。因此可从文本数据构建通胀预期数据。例如，加布里埃良等（2019）基于在线新闻数据构建英国日度通胀预期数据，比较准确反映通胀预期。这种方法可推广到测度其他国家的通胀预期。例如，安基利科等（2022）基于意大利推特数据，采用机器学习方法构建日度通胀预期数据；中岛等（2022）通过日本内阁办公室经济调查文本数据，采用机器学习方法构建了日本价格情绪指数。目前，鲜有研究基于文本数据构建中国通胀预期数据。

4.4 经济政策预期冲击的识别

财政政策与货币政策预期冲击或消息冲击对宏观经济波动有重要影响。由于计量经济学模型的信息集通常小于经济主体所获得的信息集，传统向量自回归模型无法识别预期冲击对经济波动的影响（杨，2005；利珀等， 2013），因此，扩展计量经济学模型信息集成为研究经济政策预期冲击的一个重要问题，其中一个办法是寻找预期的代理变量。传统方法分别将金融市场信息（与政府支出相关行业股价）和调查数据作为经济政策预期的代理变量，但这两种测度方法均存在不足之处。金融市场信息存在较大噪音，且仅反映金融市场参与者对经济政策的预期。调查数据仅覆盖小样本群体，且抽样频率较低。因此，采用叙事法获得经济主体对经济政策的预期是一个较好选择。在政府收入消息冲击方面，罗默和罗默（2010）利用美国总统演讲与国会记录中税收变化信息，构建税收消息变量，考察税收变化对宏观经济波动的影响。在政府支出消息冲击方面，雷米（2011）利用商业报刊报道的国防支出数据，发现国防预期支出扩张可增加宏观经济产出与劳动力投入，降低消费与投资。

主流文献认为，罗默和罗默（2010）与雷米（2011）的叙事方法能够有效识别财政支出预期冲击。但是，贾西姆等（2022）认为叙事法构建的指标存在明显不足，例如，没有充分考虑消息包含的噪音成分，且经济主体预期可能随时间发生变化等，因此，采用文本数据分析可能是更好选择。拉森和托斯鲁德（2019）使用潜在狄利克雷分配主题模型，构建了挪威全要素生产率消息冲击数据，发现全要素生产率消息冲击带来产出扩张。贾西姆等（2022）采用半监督文本分析方法准确区分了增税与减税新闻，通过美国总统演讲文本中关于税收变化消息的重复度确定税收消息是否实现，他们发现税收变化消息对产出具有显著的延迟性影响。这是未来研经济政策预期冲击如何影响宏观经济波动的一个重要方向。

4.5 经济主体信心、情绪与情感的度量

现有文献大多采用调查数据测度经济主体信心，但调查数据仅反映部分群体信心指数，而且由于调查成本较高、抽样频率低，调查数据不能充分、及时地反映经济主体信心变化趋势。相比之下，文本数据可更好测度经济主体信心与情绪。

经济主体情绪包含正面与负面、乐观与悲观、积极与消极、看涨与看跌等心理因素，文本数据分析也常用“语调”刻画情绪。由于文本数据规模大、频率高，测度情绪已成为文本数据在金融学的一个重要应用（姜富伟等，2021b）。目前，测度情绪的方法主要有以词典法为主的无监督学习和以机器学习为主的有监督学习。词典法是依据事先给定的情绪词典，通过分析文本数据中积极与消极词汇出现的频数来测度经济主体情绪。由于词典法依赖各个字典所选择的单词，且仅包含与情感相关的词汇，因此可能无法捕获全部情感信息。近年来，机器学习越来越受到研究者的青睐（根茨科等，2019）。有监督的机器学习方法把情感测度视为一个文本分类问题，将有标签的文本数据集划分为训练集与测试集，利用训练集来训练模型，最后将训练模型用于测试集进行预测。主要机器学习方法包含基于概率论的朴素贝叶斯分类器（布尔迈尔、泽希纳，2021）和支持向量机（李等，2019）等。对没有预定词典的文本数据而言，机器学习方法是较好的选择，但是与词典法相比，机器学习的训练集往往需要通过人工选择，因此耗时成本较大且分类结果因人而异，导致研究结论可复制性不高。

经济主体情绪显著影响宏观经济运行。张成思等（2021）采用中国 A 股上市公司年报测度了中国企业宏观经济感知程度，分析表明，当央行实施积极货币政策时，对宏观经济感知更乐观的企业会积极响应政策刺激，增加投融资行为。范小云等（2022）使用中国 32 家知名报刊 175 万条新闻数据，将所开发的词典与机器学习方法相结合，提出一种混合式情绪分析方法，发现新闻媒体情绪可通过提振经济主体信心来扩张消费与产出。夏皮诺等（2022）基于美国 16 家主要报纸近 24 万条经济金融新闻文本数据，将现有词典与专门构建的新词典相结合测度美国市场情绪，发现其构建的美国市场情绪指数与经济周期和经济事件显著相关，基于文本数据的高频情绪指数能预测美国市场情绪调查数据，且乐观情绪冲击能引起产出与消费的显著扩张。现有文献也发现基于文本数据得到的经济主体情绪指数可改进宏观经济预测。例如，阿吉拉尔等（2021）基于西班牙报纸构建了日度市场情绪指数，该指数与经济信心调查数据高度相关，但在预测 GDP 变化时优于调查数据。孔索莱等（2021）从意大利与西班牙经济新闻中构建新闻媒体情绪指数，发现这一指数有助于预测意大利与西班牙主权债券收益率利差。

除了与预期相关的信心与情绪等心理因素，行为财政学与行为货币经济学理论表明，情感因素（如攀比、嫉妒、内卷等）对经济主体决策同样重要。在行为财政学中，为提高经济主体税收遵从度，增强国家税收征收与公共服务供给能力，现有文献从经济政策威慑性视角研究政策宣传的有效传导渠道。例如，为了测度税法对经济主体的威慑性，毛捷等（2022）通过中国知网报刊获取 2.15 万条税法宣传报道，借助机器学习方法研究威胁性宣传效果，即通过曝光违法犯罪行为达到警示与宣传效果，他们发现税法宣传可降低经济主体侥幸心理，提升其税收遵从意愿。在行为货币经济学中，理论模型通常认为经济主体对经济政策的信任是货币政策发挥作用的重要因素，但如何测度经济主体信任度是一个实证研究难点。余等（2021）基于推特评论文本数据，采用深度学习方法测度新闻可信性，发现金融报刊的新闻可信度对股票价格有正向影响。

鲜有文献测度经济主体的攀比、嫉妒和内卷等情感因素，主要是在测度方法上存在一定困难。例如，在研究经济主体消费是否存在同群效应时，需要寻找周围群体消费水平的代理变量，目前国内研究基于调查数据构建区县层面同群组，代表周围群体消费水平（宋泽、邹红，2021），美国学者则构建了州层面同群组（伯特兰、莫尔斯，2016），如此宏观层面的划分很难准确测度周围群体消费水平对经济主体消费的影响。但随着网络技术的发展与普及，可直接从微博与贴吧等文本数据提取经济主体对周围群体消费变化的态度与看法等信息，用于研究经济主体是否存在同群效应。

五、问题、挑战与展望：方法论视角

目前，经济学、金融学与会计学等学科在利用文本数据测度经济主体心理因素及其影响方面，已获得一系列重要实证发现，凝炼了一些经验典型特征事实，为深刻理解政府政策背景下经济主体心理因素的重要作用提供了很多洞见。同时，基于非结构化大数据的经济学实证研究尚处在初级阶段，还存在不少困难与问题，需要进一步改进、完善基于非结构化大数据的实证研究，特别是发展新的研究方法与分析工具，形成一个系统的研究范式。

5.1 非结构化大数据实证研究面临的困难

5.1.1 因果推断问题

经济学研究最主要目的是识别经济因果关系，揭示经济运行规律。因果关系是指在其他因素保持不变的条件下，通过改变某个变量（如政策变量或心理变量），观测结果变量是否随之变化。一个经济理论是否具有深刻解释力取决于它能否揭示可被验证的经济因果关系。目前，文本数据实证研究发现，经济主体心理因素对宏观经济与金融市场有重要影响，但这种影响大多体现为相关性，而不是因果关系。例如，贝克等（2016）发现，他们构建的美国经济不确定性指数与美国就业和产出变化存在负相关关系，与美国股票市场波动程度则呈现正相关关系，但这些相关关系不能被解释为因果关系。推动政府政策背景下经济主体心理因素与经济变量之间的因果分析是未来政府与市场关系研究的一个重点。在实验科学中，可通过实验手段控制其他因素不变，识别并测度所关注变量之间的因果关系。但在经济学与社会科学中，很多情形难以实现可控实验，导致推断心理变量与经济变量的因果关系面临很大困难。经济主体心理因素的因果分析的难点首先在于，海量经济大数据本质上是非实验性观察数据，很难甚至不可能控制其他因素保持不变。更重要的是，经济主体决策时的前瞻性思维，具有“反身性”特征，容易形成双向、复杂的互动关系。 因此，在研究经济主体心理因素的因果关系时，需要与有关经济政策传导机制的经济理论结合起来，借助经济学理论甚至心理学理论指导。此外，还需要应用计量经济学、统计学与机器学习的新方法、新工具帮助推断因果关系。例如，众所周知，机器学习样本外预测比很多传统计量经济模型要精准得多，机器学习精准预测能力不是基于经济学因果关系，而是基于大数据中的变量特征与变量之间的统计关系（如相关关系或预测关系）。但是，机器学习可用来改进基于观测数据的因果关系推断。例如，虚拟事实估计是使用观测数据识别与测度经济因果关系的一个重要方法（珀尔，2009；瓦里安，2016）。通过挖掘大数据中变量之间的相关性或预测关系，机器学习可精准估计或预测虚拟事实结果，即假设经济政策没有实施时经济运行的潜在结果。然后对比虚拟事实结果与实际结果的差别，便可识别经济政策或心理因素与经济结果之间的因果关系，并精准测度政策效应或心理因素影响的大小。

5.1.2 经济主体的异质性与社会性问题

现有文本数据实证研究大多假设经济主体是同质且独立的个体，通过简单加总得到宏观心理变量的测度，然后应用计量经济学方法推断宏观心理变量与宏观经济变量间的数量关系。这种研究缺乏微观经济理论基础，且存在由于经济主体异质性而导致信息失真的可能性。现实经济中的经济主体通常呈现显著的异质性特征，例如，在中国市场主体中，企业分为国有企业与非国有企业，非国有企业又分为民营企业与外资企业，此外还有混合所有制企业与合资企业，以及大量个体工商业者。这些企业具有明显不同的组织结构和行为方式，表现出巨大异质性。地方政府之间在经济社会治理方面也存在显著差异。在政策从中央政府向地方政府传导过程中，地方政府由于认知、理解以及实际困难等各种原因，对中央政府政策的执行与响应程度存在差别。此外，不同经济主体对同一政策的反应不一样，同一政策对不同经济主体的影响也是不一样的。文本等非结构化大数据可提供各类异质性地方政府与经济主体的动态行为信息，从而更准确测度政策背景下经济主体心理因素及其影响，特别是经济政策对不同行业、不同地区、不同群体的动态分布效应。

另一方面，互联网等信息技术的快速进步与广泛应用，使经济主体之间结成复杂社会网络，这种网络会强化产生共情、情绪传染等现象的趋势，通过乘数效应放大或者收缩经济政策效应或重要事件冲击的影响。 2021 年初，美国股票市场大量散户在一家叫做“游戏驿站”的美国游戏零售公司股票交易中，抱团与对冲基金激烈博弈，他们受社交网络平台以及美国主流媒体报道传播的情绪感染，形成一股强大的乐观情绪，使该公司股价在不到一个月上涨 20 倍，迫使做空的机构投资者不断爆仓，充分显示了社交网络平台情绪传染的巨大威力。海量经济行为大数据包含大量微观经济主体互动关系信息，可用于研究政府与经济主体以及各类经济主体之间的情绪传染机制，因此在研究经济主体心理因素时，不仅要注意经济主体异质性的影响，还要考虑经济主体社会性的影响，重视宏观经济心理因素的微观行为基础。

5.1.3 经济主体心理因素的测度误差问题

从非结构化大数据提取信息，主要依靠人工智能与机器学习技术，如分析文本数据的自然语言处理技术，分析图像与视频数据的计算机视觉技术，以及分析音频数据的计算机语音识别技术等。 从统计学角度看，这些非结构化数据分析技术，本质上都是统计模型，这些模型大多是误设模型，因此所构建的心理变量存在不同程度的测度误差，虽然这些测度误差随着人工智能与机器学习技术的进步而不断减少。目前实证研究在使用文本数据测度经济主体情绪时，大多使用词典法，通过关键词频数测度心理变量，这种方法显然没有将词与词的关系考虑在内，这将不可避免产生信息遗漏与测度误差。从计量经济学视角看，心理变量测度误差的存在，对计量经济学推断将造成一定影响。例如，当解释变量包含测度误差时，普通最小二乘法估计将产生偏差，需要使用工具变量法（如二阶段最小二乘法）才能获得一致估计。 事实上，基于自然语言处理技术构建的心理变量的测度误差，并不满足统计意义上的独立同分布假设，可能还包含着重要的心理遗漏信息。但是，目前基于文本数据的实证研究都没有考虑这些问题及其产生的影响。

利用文本数据特别是中文文本数据进行定量分析的技术难度较高。英文文本数据的信息提取在现有研究文献中已有标准方法，其经济类管理类词典也已比较完善。常用英文词典有哈佛大学通用调查词典、亨利词典（亨利，2008）、文辞乐观与悲观词汇词典和洛克伦-麦克唐纳词典（洛克伦、麦克唐纳，2011）等（唐国豪等， 2016）。不同英文词典的应用范围和功能有所差异，例如哈佛大学通用调查词典（第四版）主要涉及心理学与社会学领域的正面和负面词汇，亨利词典是第一本金融文本词典，但其词汇量较为匮乏，而洛克伦-麦克唐纳词典涵盖的金融情绪词汇较为全面且准确。由于中英文语言结构差异，中文文本数据需要相对复杂的处理方法。中文文本数据分析刚起步不久，在经济学、管理学领域还缺乏比较全面、完善的词典。中文文本数据的分词位置会影响对文本真实含义的理解，一些关键词的词性（如名词与动词）随着上下文语境的变化而变化，一些常用词的语义还会随着时代变化而产生截然不同的理解，特别是在互联网时代，中文语言进化速度加快，完全相同的词汇，其含义可能在短短几年内便发生巨大变化，大量新的网络语言不断涌现，具有强烈的时代特征，无法按照常规中文语言含义进行分析。此外，不同的中文文本来源在叙述同一事情或现象时经常采用不同的词汇与叙事方式，使用同一词典可能会产生严重的测度偏差。所有这些差异与困难，意味着不能照搬照抄英文文本数据分析方法，必须根据中文文本结构特点，开发适合中文文本数据的分析方法与技术。 如何从海量中文文本数据中提取经济主体心理因素等信息是中国经济学一个重要的学术前沿问题。在这方面，已取得一定进展。王靖一和黄益平（2018）、姚加权等（2021）、姜富伟等（2021b）、范小云等（2022）等开发了中文文本情绪词典。针对词典法与传统机器学习方法没有考虑语言结构、没有关注文档整体信息等缺陷，范等（2022）提出因子增强正则化预测模型，这个方法考虑了词汇之间的逻辑关系，能够提取文本的隐藏主题，从而弥补现有研究的不足。也有文献引入自然语言前沿处理方法提升数据信息分析质量，例如黄等（2022a）拓展目前自然语言处理领域流行的 BERT 模型，构建能充分利用财务文本上下文信息的 FinBERT 模型，并证明其在情绪分类方面显著优于洛克伦-麦克唐纳词典以及其他传统机器学习技术。

5.2 构建非结构化大数据实证研

5.2.1 充分利用各种类型的非结构化经济大数据

目前有关经济主体心理因素的研究主要基于文本数据，相对较少使用其他非结构化数据，例如图像、音频、视频数据等。事实上，其他非结构化大数据也包含丰富的关于各类经济主体的心理信息，例如人们常说 “一图胜千言”，包括社交网络平台上各种常见的“表情包”。随着计算机视觉与人工视觉网络等机器学习技术的发展，已有政治学学者从图像数据中挖掘经济主体信息。例如，王等（2016）利用推特个人资料照片分析了美国总统选举中民主党与共和党总统候选人支持者的人口构成。查克拉波蒂（2017）使用上述方法分析美国社会与政治活动发起人的特征。在经济学领域，阿罗米和克莱门茨（2021）基于政策制定者、交易员、公司经理等在媒体上发布的照片构建他们的面部表情指数与情绪指数。奥贝德和普图通（2022）采用卷积神经网络方法对《华尔街日报》照片进行分类，依据每日新闻照片传递的悲观情绪图像所占比例，构建了投资者情绪指数。 图像信息挖掘技术在管理学中也有应用（布兰克斯普尔等，2017）。目前，基于音频与视频数据的实证研究大多集中在技术层面，政策应用还不多见。例如，埃德曼斯等（2022）根据音乐平台的热门音乐所传递的正面情感测度投资者情绪。库雷西和阿格沃尔（2022）基于视频数据提出一种利用卷积神经网络与深度学习技术测度经济主体情绪的方法。常和彭（2022）基于抖音国际版产生的流行短视频，收集了每日 500 个最受欢迎短视频数据，并应用深度视觉音频注意力网络技术构建了各个国家的股票市场情绪指数。 上述研究仅使用单模态数据，即对非结构化大数据进行单独分析，没有考虑融合文本、图像、音频或视频等多模态数据蕴含的更为丰富信息。例如，经济主体在微博等社交媒体传达情绪时，往往会通过文字搭配图片方式发表评论；视频数据包含文字、音频和图像等各类非结构化数据。分析多模态数据的难点在于如何融合不同类型非结构化大数据，巴尔特鲁沙炎等（2018）对多模态数据融合（特征融合、决策融合和混合融合）进行综述，为使用多模态数据测度经济主体心理因素提供参考。除图像、音频、视频等非结构化大数据外，一些学者利用卫星遥感技术测度夜间灯光、天气、地形、农业以及城市用地、种植作物、建筑类型与自然资源等图像，并应用于经济学分析（唐纳森、斯托里加德，2016）。作为一种最有代表性的遥感数据，夜间灯光数据能够比较客观反映人类社会生产生活状况，一些学者因此将夜间灯光数据作为地方经济活动的代理变量，使用夜间灯光数据估计、调整与修正国民生产总值（亨德森等， 2012），或研究各种经济问题（王贤彬、黄亮雄，2018；吉布森等，2020）。李等（2022）使用海事卫星遥感数据测度公海上国际贸易货船二氧化碳排放量，填补了全球碳排放测度研究的一个空白。陈等（2022）利用城际运输卡车物流遥感数据定量评估上海新冠肺炎疫情管控政策对上海乃至长三角地区经济的影响。毫无疑问，各种非结构化大数据包含很多结构化数据所没有的信息，这些信息远没有充分挖掘出来，需要整合、集成并综合利用各种不同类型的非结构化大数据。

5.2.2 系统构建政府政策数据库与各类经济主体心理数据库

与结构化大数据相比，非结构化大数据包含更丰富的各级政府政策变化、各种重要事件冲击以及各类经济主体对政府政策变化与重要事件的反应等信息，因此在研究政府与市场关系时，必须重视非结构化经济大数据库建设。非结构化大数据种类繁多、结构复杂、来源不同，收集、清洗、处理、整合、分析各种非结构化大数据，并将其转化为结构化数据，是一项非常艰巨但又非常重要的基础设施建设工程。非结构化大数据是高维或超高维数据，将非结构化大数据转化为结构化数据，特别是构建经济政策变量与经济主体心理变量的结构化数据，本质上是一个降维问题。应该加强与计算机科学和计量语言学的交叉融合，将这些学科用于非结构化数据分析的方法与工具，如自然语言处理技术、计算机视觉技术、计算机语言技术、计量语言学模型等，应用并普及到经济学实证研究中，以加快构建系统性、结构化政府政策数据库与经济主体心理数据库。

除各种非结构化大数据外，还应重视使用其他方式与渠道，例如采用统计调查方法搜集与整理经济主体心理数据。例如，美国统计学会与美国国家经济研究局于 1968 年开创的，1990 年由美联储费城分行接手的 “美国专业预测者调查”，按季度发布专业预测者对美国主要宏观经济变量的预测结果。里科等（2016）根据该调查数据，通过考察不同个体对美国政府支出的预测差异来测度未来政府支出变化不确定性。从 20 世纪 40 年代开始，美国密歇根大学调查中心基于对 500~600 名成年人的原始调查数据，编制并于每月第 10 天发布“密歇根消费者信心指数”，反映美国消费者对当前以及未来经济的信心强弱，成为预测美国经济走势与消费趋向的一个先行指标。美国管理与组织实践调查是美国第一次大规模管理实践调查，涵盖超过 1 万家公司的 3 万个工厂，调查企业管理层对当年与未来一年销售量的主观概率分布预测。布卢姆等（2022）基于该调查数据，测度企业管理层真实感受到的销售不确定性，即企业主观不确定性。在中国，国家统计局编制的中国消费者信心指数与企业家信心指数，通过对城市消费者、法人企业以及依照法人单位进行统计的产业活动单位负责人进行问卷调查，以指数形式综合反映经济主体对宏观经济环境的主观感受与信心。此外，中国国家统计局中国经济景气监测中心的“中国百名经济学家信心调查”，中国人民银行的未来物价预期指数、未来就业预期指数与企业家信心，中国银联的银行卡消费信心指数等，都是通过统计调查获得的中国经济主体预期数据。

5.2.3 大力发展非结构化大数据计量经济学

除政府政策数据库与经济主体心理数据库建设外，非结构化大数据的分析、变量构建、模型设定、估计、推断与预测等具有较高技术门槛，需要大力发展非结构化大数据计量经济学，系统性形成非结构化大数据信息提取、建模、估计、检验、预测的计量经济学理论、方法与工具。大数据与人工智能特别是机器学习的发展给计量经济学带来了许多机遇与挑战（瓦里安，2014；洪永淼、汪寿阳，2021a，2021b）。近年来，结构化大数据计量经济学理论与方法创新取得了巨大进展，包括高频与时变时间序列建模与预测、实时预测、高维计量经济学建模、新型结构化数据（如函数数据、区间数据、矩阵数据、符号数据等）建模，以及基于机器学习的因果推断（阿西，2019）等。相比之下，非结构化大数据计量经济学理论与方法创新则处于起步阶段。一方面，计算机科学关于各种非结构化大数据的分析技术突飞猛进，但这些先进技术尚未广泛应用于分析非结构化经济大数据，在经济学领域存在明显的“应用时滞”。另一方面，除构建非结构化大数据库外，还需要发展适合于分析非结构化大数据的计量经济学理论与方法，并与计算机科学和计量语言学关于非结构化大数据的分析方法与技术有机融合起来。

毫无疑问，在非结构化大数据被转化为结构化数据之后，很多现有计量经济学理论与方法可发挥重要作用。但是，基于非结构化大数据构建而成的结构化数据，需要深入研究其经济含义与统计性质。例如，基于非结构化大数据构建而成的经济主体情绪变量时间序列数据，是否为非平稳随机过程？有无存在结构性变化？是具有结构突变还是平稳结构变化？是短记忆过程还是长记忆过程？研究这些问题对理解情绪指数的心理学、经济学含义及其计量经济学建模与推断具有重要意义。例如，如果所构建的时间序列情绪变量是计量经济学意义上的非平稳一阶单整 I（1）过程，则可能会出现时间序列计量经济学中所谓的伪回归现象；而如果时间序列情绪变量是一个局部平稳过程，则需要发展新的计量经济学建模、估计、推断与预测理论与方法。王等（2022）使用具有时变波动性的随机游走模型刻画中国股市投资者情绪指数，并发现投资者情绪对股票定价没有长期影响。也有研究发现，美国投资者情绪指数具有显著的结构突变特征（姚，2022）。此外，由于经济主体情绪是不可观测的潜在变量，因此计量经济学的潜在因子模型，包括高维时变因子模型，适合于对经济主体情绪进行建模。新型数据需要新的分析方法与工具。随着非结构化数据可获得性的提升与广泛使用，迫切需要创新非结构化大数据计量经济学理论与方法。

5.2.4 促进跨学科系统性交叉研究

基于非结构化大数据的经济主体心理变量测度与建模涉及多学科理论与方法，包括经济学、心理学、社会学、社会心理学、语言学、认知科学、计量经济学、统计学、数据科学、计算机科学、计量语言学、复杂性科学等。其中，

心理学、社会心理学、认知科学与语言学有助于理解经济主体心理因素及其变化规律。
计量经济学、统计学、数据科学、计算机科学、计量语言学以及复杂性科学能够为提取非结构化大数据中的心理信息提供方法论指导与技术支撑。
经济学、心理学、社会学、社会心理学则为经济主体心理变量的经济学解释提供理论指导。

应打破学科壁垒，促进不同学科的交叉融合，推动经济学与其他社会科学（包括心理学、社会学、社会心理学、政治学、法学、历史学、文化学等）的跨学科系统性研究。

六、结论

在研究政府与市场关系过程中，需要重视各类经济主体心理因素，如预期、信念、信心、情绪、情感等。这些心理因素的产生、形成与变化有其客观原因。由于其“反身性”特征，经济主体心理因素对政府政策传导机制有重要影响。经济主体通过学习、领会、解读政策含义，形成对政策的预期，然后根据自身利益最大化原则做出最优决策，从而影响宏观经济运行。因此，测度经济主体心理因素及其影响是研究政府政策传递机制的一个重要思路。

如何科学测度经济主体心理因素在方法论上面临巨大困难与挑战。虽然现代心理学与实验经济学为定量分析心理因素提供了一些分析工具，例如观察访谈、统计调查以及实验方法等，但其研究的深度、广度与抽样频率受到各种限制与约束。人工智能技术的发展与非结构化大数据可获得性的提升，为测度经济主体心理因素及其影响，提供了一个可行方法。非结构化大数据包含大量关于政府政策变化（如语调变化）、重要事件冲击以及经济主体对政策变化与重要事件冲击的反应等信息，特别是语言是人类表达思想与情感，进行沟通交流的最主要工具，可从文本等数据中提取、测度各类经济主体心理因素及其影响。这样，原来的定性分析可转变为严谨的定量实证分析，从而打破经济学中定性分析与定量分析的界限，并使经济学与其他社会科学跨学科系统性研究成为可能。由于中国巨大的人口规模与经济规模，新的信息技术及其应用层出不穷，数字经济发展具有巨大潜力与规模优势，中国即将成为全球最大的数据生产国。大数据资源中，相当大一部分是非结构化大数据，这些数据包含许多传统结构化数据无法反映的重要信息，特别是各种政府政策变化与重要事件冲击、以及各类经济主体对政策变化与重要事件冲击的反应等信息。中国庞大的数据资源与政府的重要作用，使中国拥有全球最大且独一无二的“政策数据库”这一富矿，在研究政府与市场关系方面具有天然优势。我们应该积极推动学科交叉，大胆借鉴心理学、社会心理学、认知科学、计算机科学、计量语言学以及复杂性科学等理论与方法，发展新的研究方法与工具，形成新的研究范式，构建具有深厚学理基础关于政府与市场关系的原创性自主经济理论，以指导中国式现代化建设与全球化实践 ① 。

本文益处#

一、引言#

二、预期、情绪与经济政策：理论视角#

2.1 预期与预期形成机制#

2.2 预期与经济波动#

2.3 情感因素#

三、经济学心理因素测度：非结构化大数据视角#

四、文本数据与经济主体心理因素测度：实证视角#

4.1 经济政策不确定性的测度#

4.2 央行沟通与预期管理#

4.3 通胀预期的测度#

4.4 经济政策预期冲击的识别#

4.5 经济主体信心、情绪与情感的度量#

五、问题、挑战与展望：方法论视角#

5.1 非结构化大数据实证研究面临的困难#

5.1.1 因果推断问题#

5.1.2 经济主体的异质性与社会性问题#

5.1.3 经济主体心理因素的测度误差问题#

5.2 构建非结构化大数据实证研#

5.2.1 充分利用各种类型的非结构化经济大数据#

5.2.2 系统构建政府政策数据库与各类经济主体心理数据库#

5.2.3 大力发展非结构化大数据计量经济学#

5.2.4 促进跨学科系统性交叉研究#

六、结论#

广而告之#