数据集| NOS.nl荷兰新闻数据集(2015~2025.2.28)

媒体数据集研究价值大, 您可从中提取丰富的指标,包括但不限于经济政策不确定性指数EPU 、 媒体关注度指数、文本相似度、情感分析。而且可训练词向量,构建新的词典,开发新的指标指数。计算机自然语言处理、经济学、管理学、新闻传播学、公共管理等领域均可使用。...

2025-03-05 · 2 min · 大邓

数据集 | 536w条「上证e互动、深证互动易」问答记录(2011-2024.12.31)

「上证e互动、深证互动易」问答记录数据集是研究中国资本市场信息披露、投资者关系管理及市场行为的重要非结构化数据源。...

2025-03-03 · 1 min · 大邓

数据集 | 1998-2023年中国基金年度报告

...

2025-02-25 · 1 min · 大邓

实验 | 使用大模型从图片中提取结构化数据

在快速发展的人工智能领域,将视觉功能集成到大型语言模型中,**可以用于解读图片语义, 从图片中提取出结构化数据**。...

2025-02-22 · 2 min · 大邓

PNAS | GPT 是多语言心理文本分析的有效工具

许多领域(包括心理学、社会学、通信、政治学和计算机科学)都使用计算方法来分析文本数据。但是,现有的文本分析方法存在许多缺点。字典方法虽然易于使用,但与最近的方法相比通常不是很准确。机器学习模型虽然更准确,但可能难以训练和使用。我们证明,大型语言模型 GPT 能够使用简单的提示准确检测 12 种语言文本中的各种心理结构(由手动注释者判断),无需额外的训练数据。因此,GPT 克服了现有方法中存在的局限性。GPT 在几种较少使用的语言中也很有效,这可以促进来自研究不足的环境中的文本分析研究。...

2025-02-17 · 1 min · 大邓