数据(付费) | 使用cctv新闻联播文稿构造面板数据

cctv新闻联播文稿数据集,可使用Python对其进行挖掘,借助文本挖掘技术研究鸿观经济政策、社会学、传播学等领域。...

2023-12-16 · 3 min · 大邓

相关性分析 | 从模型预测出发挖掘更多特征之间的关系

...

2023-11-25 · 2 min · Spectator

tomotopy | 速度最快的LDA主题模型

接近C的速度,比市面的sklearn、gensim快十几倍...

2023-04-25 · 5 min · 大邓

Nature | 通用中英文六维语义情感词典

来自心理学和认知神经科学的证据表明,人类大脑的语义系统包含几个特定的子系统,每个子系统都代表语义信息的特定维度。对这些不同语义维度上的词语评分可以帮助研究语义维度对语言处理的行为和神经影响,并根据人类认知系统的语义空间建立语言含义的计算表示。现有的语义评分数据库提供了数百到数千个词语的评分,但这无法支持对自然文本或语音的全面语义分析。本文报告了一个大型数据库——六维语义数据库(SSDD, 后文「数据库」均用「词典」代替),其中包含对 17,940个常用汉语词语在六个主要语义维度上的主观评分:视觉、运动、社交、情感、时间和空间。此外,使用计算模型学习主观评分和词嵌入之间的映射关系,我们在SSDD中包括了1,427,992个汉语和1,515,633个英语词语的估计语义评分。SSDD将有助于自然语言处理、文本分析和大脑中的语义表示研究。...

2023-03-20 · 1 min · 大邓

免费可用的chatGPT镜像站点清单

免费好用的ChatGPT镜像站

2023-03-16 · 1 min · xx025