CAR2023 | 文本分析在会计中的应用

...

2023-08-26 · 1 min · 大邓

Pandas库 | 对高管数据xlsx中的简介字段做文本分析

...

2023-08-07 · 3 min · 大邓

B站 | "高铁互殴"视频词云图绘制

...

2023-05-11 · 1 min · 大邓

tomotopy | 速度最快的LDA主题模型

接近C的速度,比市面的sklearn、gensim快十几倍...

2023-04-25 · 5 min · 大邓

文本分析 | 词典法的两种代码实现

但这周末,我使用1.4G的mda数据集, 5w条记录。尝试计算某类词的出现次数, 该词典含几百个词。在我的96G内存的macbook中,运行了十几个小时都没结果。于是同一个问题,本文分享了两种实现方法。一般情况下,使用「方法一」即可。当第一种方法运行不出结果,可以尝试「方法二」。...

2023-04-17 · 2 min · 大邓