R语言 | 使用word2vec词向量模型

R语言训练和使用词向量word2vec模型...

2022-10-12 · 4 min · 大邓

NLP资源 | 汽车、金融等9大领域预训练词向量模型下载资源

本文主要开放汽车、房产、教育、社会、娱乐、体育、金融、科技、游戏等9大领域预训练词向量,以及字符、依存、拼音与词性4类预训练向量地址,供大家一起使用...

2022-05-25 · 2 min · 刘焕勇

cntext库 | Python文本分析包更新

扩展词典、情感分析、可阅读性,内置9种情感词典,涵盖中英文...

2022-05-09 · 7 min · 大邓

sentence-transformer库 | 句子语义向量化

使用sentence-transformer库BERT技术,将句子语义向量化...

2022-05-09 · 1 min · 刘焕勇

转载 | 从符号到嵌入:计算社会科学的两种文本表示

如何有效地表示数据以挖掘我们想要的计算社会科学的含义?为了探索答案,我们对 CSS 中文本和网络的数据表示进行了彻底的回顾,我们将现有的表示总结为两个方案,即基于符号的表示和基于嵌入的表示。How to efficiently represent data to mine the implications we want for computational social science? To explore the answer, we conduct a thorough review of data representations for text and the web in CSS, and we summarize existing representations into two schemes, symbol-based and embedding-based...

2022-04-25 · 1 min · FamouseGuys