Nature | 通用中英文六维语义情感词典

来自心理学和认知神经科学的证据表明,人类大脑的语义系统包含几个特定的子系统,每个子系统都代表语义信息的特定维度。对这些不同语义维度上的词语评分可以帮助研究语义维度对语言处理的行为和神经影响,并根据人类认知系统的语义空间建立语言含义的计算表示。现有的语义评分数据库提供了数百到数千个词语的评分,但这无法支持对自然文本或语音的全面语义分析。本文报告了一个大型数据库——六维语义数据库(SSDD, 后文「数据库」均用「词典」代替),其中包含对 17,940个常用汉语词语在六个主要语义维度上的主观评分:视觉、运动、社交、情感、时间和空间。此外,使用计算模型学习主观评分和词嵌入之间的映射关系,我们在SSDD中包括了1,427,992个汉语和1,515,633个英语词语的估计语义评分。SSDD将有助于自然语言处理、文本分析和大脑中的语义表示研究。...

2023-03-20 · 1 min · 大邓

正念爱好者的推特语言风格有何不同

在《逻辑哲学论》中,维特根斯坦(1961)著名地写道:我的语言的限制意味着我的世界的限制(The limits of my language mean the limits of my world!)”(第23页)。作为表达思想和感情的符号系统,语言和词语揭示了我们的重要信息。我们如何表达自己反映了我们是谁,我们如何感受,我们如何处理信息以及我们关心什么。例如,经历积极情绪的人使用更多的积极情感词汇和感叹号(Hancock等人,2007),而那些处于痛苦中的人则倾向于关注自己并使用更多的第一人称单数代词(Rude等人,2004)。因此,语言和词语的研究可以帮助理解人类心理。...

2023-03-20 · 1 min · 大邓

PNAS | 历史文本中的语言积极性反映了动态的环境和心理因素(含Python代码)

Linguistic positivity in historical texts reflects dynamic environmental and psychological factors历史文本中的语言积极性反映了动态的环境和心理因素...

2023-03-13 · 4 min · Tiffany

基于词嵌入技术的心理学研究: 方法及应用

词嵌入是自然语言处理的一项基础技术。 其核心理念是根据大规模语料中词语和上下文的联系, 使用神经网络等机器学习算法自动提取有限维度的语义特征, 将每个词表示为一个低维稠密的数值向量(词向 量), 以用于后续分析。 心理学研究中, 词向量及其衍生的各种语义联系指标可用于探究人类的语义加工、认知判断、发散思维、社会偏见与刻板印象、社会与文化心理变迁等各类问题。 未来, 基于词嵌入技术的心理 学研究需要区分心理的内隐和外显成分, 深化拓展动态词向量和大型预训练语言模型(如 GPT、BERT)的应用, 并在时间和空间维度建立细粒度词向量数据库, 更多开展基于词嵌入的社会变迁和跨文化研究。 As a fundamental technique in natural language processing (NLP), word embedding quantifies a word as a low-dimensional, dense, and continuous numeric vector (i.e., word vector). Word embeddings can be obtained by using machine learning algorithms such as neural networks to predict the surrounding words given a word or vice versa (Word2Vec and FastText) or by predicting the probability of co-occurrence of multiple words (GloVe) in large-scale text corpora. Theoretically, the dimensions of a word vector reflect the pattern of how the word can be predicted in contexts; however, they also connote substantial semantic information of the word. Therefore, word embeddings can be used to analyze semantic meanings of text. In recent years, word embeddings have been increasingly applied to study human psychology, including human semantic processing, cognitive judgment, divergent thinking, social biases and stereotypes, and sociocultural changes at the societal or population level. Future research using word embeddings should (1) distinguish between implicit and explicit components of social cognition, (2) train fine-grained word vectors in terms of time and region to facilitate cross-temporal and cross-cultural research, and (3) apply contextualized word embeddings and large pre-trained language models such as GPT and BERT. To enhance the application of word embeddings in psychology。

2023-03-10 · 1 min · 包寒吴霜等

转载 | 国外会计文本信息实证研究述评与展望

近年来,文本信息逐渐成为国外会计实证研究的热点,许多学者开始致力于 运用文本分析方法来解决会计与财务问题,并取得了众多有价值的研究成果。与之相比,国 内的此类研究却相当缺乏。为了弥补国内研究的不足,本文对国外近十年来取得的研究成果 进行了系统的梳理和述评。首先,系统阐述了会计文本信息的定义、特征及其测量方法;其 次,从不同层面出发,总结并分析了会计文本信息的影响因素及其作用结果;再次,指出了 现今国外研究中存在的不足。在此基础上,本文提出了一个未来研究的框架,分别从基础、 引入、拓展三个方向来展望国内研究,具体包括如何构建适合中文会计语言的文本分析方 法、国外现有理论与问题在我国的本土化检验以及在中国情境下可以拓展的独创性研究。In recent years, text information has gradually become a hot spot in foreign accounting empirical research. Many scholars have begun to use text analysis methods to solve accounting and financial problems, and have achieved many valuable research results. In contrast, such research in China is quite lacking. In order to make up for the lack of domestic research, this paper systematically sorts out and reviews the research achievements abroad in the past ten years. Firstly, it systematically expounds the definition, characteristics and measurement methods of accounting textual information; secondly, it summarizes and analyzes the influencing factors and results of accounting textual information from different levels; thirdly, it points out the deficiencies in current foreign research . On this basis, this paper proposes a framework for future research, looking forward to domestic research from the three directions of foundation, introduction, and expansion, including how to construct a text analysis method suitable for Chinese accounting language, and the existing foreign theories and problems in my country. Indigenous testing and original research that can be extended in the Chinese context.

2023-01-12 · 1 min · 肖浩,詹雷,王征