在《逻辑哲学论》中,维特根斯坦(1961)著名地写道:我的语言的限制意味着我的世界的限制(The limits of my language mean the limits of my world!)”(第23页)。作为表达思想和感情的符号系统,语言和词语揭示了我们的重要信息。我们如何表达自己反映了我们是谁,我们如何感受,我们如何处理信息以及我们关心什么。例如,经历积极情绪的人使用更多的积极情感词汇和感叹号(Hancock等人,2007),而那些处于痛苦中的人则倾向于关注自己并使用更多的第一人称单数代词(Rude等人,2004)。因此,语言和词语的研究可以帮助理解人类心理。


文献

Rivera, C.E., Kaunhoven, R.J. & Griffith, G.M. How an Interest in Mindfulness Influences Linguistic Markers in Online Microblogging Discourse. Mindfulness (2023). https://doi.org/10.1007/s12671-023-02098-4

下载本文


摘要

这项研究旨在探究在Twitter上对正念(mindfulness)感兴趣的人们是否在他们的推文中使用了与其他人不同的语言。将用户分为正念组和非正念组,含19732位推特用户的1873万条推文。作者使用LIWC(Linguistic Inquiry and Word Count, LIWC)来查看推文中与正念、情感过程、社交取向和“存在模式”相关的语言标记。研究发现,对正念感兴趣的人在Twitter上更频繁地使用与正念、积极情感、幸福和社交取向相关的语言标记,并且使用与消极情感、过去、现在和未来焦点、家庭和友谊取向相关的标记更少。这表明,推特上对正念感兴趣的人使用了特定的语言标记,这可以为开发更自然的评估正念的方法提供可能的途径。


数据

19732位推特用户的1873万条推文。构建研究数据的方法

  • 正念爱好组数据
    • 找正念的大V,获取大V的粉丝列表fans_list
    • twitter api每15分有900次访问权限,最终获得 10,347 粉丝的个人数据
  • 控制组用户数据,从数Kaggle公开Sentiment140 数据集随机抽取9385位用户的数据

分析

作者主要比较了正念爱好者、非正念爱好者,两组群体推特以下 5 个角度测量语言风格,测试是否正念与语言风格是否有显著性(0.001的显著性水平)

  • 正念 ,例如:curious、open、accepting。

  • 情感过程 happy, sadly, yay - 快乐,例如:nice、nasty。
    - 积极情绪,例如:sweet。
    - 消极情绪,例如:hurt、ugly。

  • 社交定向 interact, talk, everyone - 家庭定向,例如:daugher、dad、aunt

    • 朋友定向,例如:buddy、neighbour
  • 思维模式 does had will

    • 聚焦于现在,例如:I’m, now, use
    • 聚焦于过去,例如:were、walked, had。
    • 聚焦于将来,例如:will, going to
  • 时间 例如:since、wait、clock。

研究发现,对正念感兴趣的人在Twitter上更频繁地使用与正念、积极情感、幸福和社交取向相关的语言标记,并且使用与消极情感、过去、现在和未来焦点、家庭和友谊取向相关的标记更少。


关于LIWC

LIWC(Linguistic Inquiry and Word Count, LIWC),其实就是词典法文本分析,统计文本中体现构念信息的相关词语出现次数多寡或频繁的程度。之前分享过 LIWC vs Python | 文本分析之词典词频法略讲(含代码) ,感兴趣可以阅读一下, 更好的了解 LIWC 和 Python 。


广而告之