R语言 | 使用word2vec词向量模型

R语言训练和使用词向量word2vec模型...

2022-10-12 · 4 min · 大邓

nlp-roadmap | 文本分析知识点思维脑图

文本分析(社科领域中与Python相关的),对应于计算机领域是自然语言处理,两者范畴高度重叠,关系密切。但相关术语脉络比较庞杂,nlp-roadmap项目为我们梳理了相关概念,更有助于快速掌握文本分析。...

2022-10-08 · 1 min · Tae Hwan Jung

EmoBank | 中文维度情感词典

中文情绪银行 (Chinese EmoBank)是由人工标注产生的 中文维度情感词典,含效价valence和唤醒度arousal两个维度。...

2022-07-16 · 3 min · 大邓

chinese-converter | 中文繁简互换Python库

中文繁简互换

2022-07-11 · 1 min · 大邓

2022暑期工作坊 | Python实证指标构建与文本分析

在前大数据时代,一般使用实验法、调查问卷、访谈或者二手数据等方式,将数据整理为结构化的表格数据,之后再使用各种计量分析方法,对这些表格数据进行分析。但大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的两个问题:网络爬虫技术 解决如何从网络世界中高效地采集数据?文本分析技术 解决如何从杂乱的文本数据中抽取实证指标(情绪、不确定、态度、认知等变量)...

2022-07-10 · 3 min · 大邓