置顶推荐 | 社科(经管)文本分析资料汇总

如何从网络世界中高效地采集数据?是否能从文本中挖掘出人类的偏见等认知信息?如何从杂乱的文本数据中抽取文本信息(变量)?本文汇总的列表将让你对文本、对Python文本分析个全面的了解...

2022-04-16 · 3 min · 大邓

B站 | "高铁互殴"视频词云图绘制

...

2023-05-11 · 1 min · 大邓

tomotopy | 速度最快的LDA主题模型

接近C的速度,比市面的sklearn、gensim快十几倍...

2023-04-25 · 5 min · 大邓

文本分析 | 词典法的两种代码实现

但这周末,我使用1.4G的mda数据集, 5w条记录。尝试计算某类词的出现次数, 该词典含几百个词。在我的96G内存的macbook中,运行了十几个小时都没结果。于是同一个问题,本文分享了两种实现方法。一般情况下,使用「方法一」即可。当第一种方法运行不出结果,可以尝试「方法二」。...

2023-04-17 · 2 min · 大邓

不要当真 | 词云图看婚姻的本质是什么

...

2023-04-14 · 2 min · 大邓