2023 | 文本分析在经管研究中的应用

报告以文本分析方法为例,围绕着文本产生、作用、算法、编程四个方面展开。报告人结合自己的最新研究对大数据时代文本分析方法在管理领域的应用展开讨论,介绍文本编码常见算法,诸如词典法、文档向量化、词向量等,分享此类研究的过程和要点。Application of Text Analysis in Economics and Management Research 西安交通大学管理学院孙少龙老师。...

2023-11-05 · 3 min · 大邓

LLM数据标注:是否胜过人类?

数据科学家花费 80% 以上的时间来准备数据,这其中主要是数据清洗、数据标注。随着 GPT-4 等大型语言模型 (LLM)的兴起,现在我们可以更高效的准备工作。在本文中,我们将探讨如何使用 LLM 进行数据标注,以提高文本注释的准确性、效率和可扩展性,并最终为 ML 项目带来更好的结果。 Data scientists spend over 80% of their time preparing data, including data labeling. With the rise of Large Language Models (LLMs) like GPT-4, we now have the tools to streamline this process significantly.In this article, we’ll explore how to use LLM for data labeling to enhance the accuracy, efficiency, and scalability of text annotations and ultimately drive better outcomes for ML projects....

2024-08-04 · 2 min · Yuliia Kniazieva

arXiv2024 | 使用大语言模型自动进行定性研究中的扎根理论开发

在当今的学术界,定性研究因其深入挖掘现象背后的原因和逻辑而备受重视。然而,定性数据的分析往往耗时且成本高昂。现在,随着chatGPT这类大语言模型的问世,这一局面可能即将改变。AcademiaOS是一个创新的开源平台,它利用大型语言模型(LLMs)的能力,自动化地进行地面理论的发展,为定性研究带来了新的视角。AcademiaOS is a first attempt to automate grounded theory development in qualitative research with large language models. Using recent large language models’ language understanding, generation, and reasoning capabilities, AcademiaOS codes curated qualitative raw data such as interview transcripts and develops themes and dimensions to further develop a grounded theoretical model, affording novel insights. A user study (n=19) suggests that the system finds acceptance in the academic community and exhibits the potential to augment humans in qualitative research. AcademiaOS has been made open-source for others to build upon and adapt to their use cases....

2024-08-02 · 2 min · Übellacker Thomas

数据集 | 聚焦美股企业社会责任CSR Wire网站新闻数据集(1999-2024)

CSRWire(CSRwire)是一个成立于1999年的数字媒体平台,专注于提供有关企业社会责任(CSR)和可持续性的最新新闻、观点和报告。CSRWire是3BL网络的一部分,致力于帮助组织创建和分享与关键利益相关者(包括投资者、消费者、评级机构、非政府组织等)的可持续性和影响力内容。...

2024-07-19 · 2 min · 陈世强

数据集(英文) | CBS News新闻数据集(1998 ~ 2024)

新闻数据集研究价值大, 您可从中提取丰富的指标,包括但不限于经济政策不确定性指数EPU 、 媒体关注度指数、文本相似度、情感分析。而且可训练词向量,构建新的词典,开发新的指标指数。计算机自然语言处理、经济学、管理学、新闻传播学、公共管理等领域均可使用。...

2024-07-13 · 2 min · 大邓