转载 | 从符号到嵌入:计算社会科学的两种文本表示

如何有效地表示数据以挖掘我们想要的计算社会科学的含义?为了探索答案,我们对 CSS 中文本和网络的数据表示进行了彻底的回顾,我们将现有的表示总结为两个方案,即基于符号的表示和基于嵌入的表示。How to efficiently represent data to mine the implications we want for computational social science? To explore the answer, we conduct a thorough review of data representations for text and the web in CSS, and we summarize existing representations into two schemes, symbol-based and embedding-based...

2022-04-25 · 1 min · FamouseGuys

中文词向量资源汇总 & 使用方法

数十种中文词向量模型资源下载&使用方法。Dozens of Chinese word vector model resource downloads & usage methods...

2022-04-21 · 4 min · FamouseGuys

将年报数据汇总至xlsx文件中

分散在各处的pdf很难分析,如何将pdf汇总至excel。本文将pdf汇总与excel分析结合。...

2022-04-21 · 1 min · 大邓

豆瓣影评 | 探索词向量妙处

使用cntext训练、使用词向量。...

2022-04-21 · 3 min · 大邓

推荐 | Python文本分析与会计(视频)

会计Python文本分析, 文本是如何产生,信息的发布者与接收者如何相互影响,分析师为了预测还是解释现象。为了开展研究,如何获取数据,如何测量文本中的态度、偏见、情感分析。。Accounting Python text analysis, how the text is generated, how the publisher and receiver of the information interact, and whether the analyst predicts or explains the phenomenon. How to get data, how to measure attitudes, biases, sentiment analysis in texts in order to conduct research. ....

2022-04-16 · 4 min · 大邓