cntext库 | Python文本分析包更新

扩展词典、情感分析、可阅读性,内置9种情感词典,涵盖中英文...

2022-05-09 · 7 min · 大邓

sentence-transformer库 | 句子语义向量化

使用sentence-transformer库BERT技术,将句子语义向量化...

2022-05-09 · 1 min · 刘焕勇

转载 | 从符号到嵌入:计算社会科学的两种文本表示

如何有效地表示数据以挖掘我们想要的计算社会科学的含义?为了探索答案,我们对 CSS 中文本和网络的数据表示进行了彻底的回顾,我们将现有的表示总结为两个方案,即基于符号的表示和基于嵌入的表示。How to efficiently represent data to mine the implications we want for computational social science? To explore the answer, we conduct a thorough review of data representations for text and the web in CSS, and we summarize existing representations into two schemes, symbol-based and embedding-based...

2022-04-25 · 1 min · FamouseGuys

中文词向量资源汇总 & 使用方法

数十种中文词向量模型资源下载&使用方法。Dozens of Chinese word vector model resource downloads & usage methods...

2022-04-21 · 4 min · FamouseGuys

豆瓣影评 | 探索词向量妙处

使用cntext训练、使用词向量。...

2022-04-21 · 3 min · 大邓