词向量(付费) | 使用1985年-2025年专利申请摘要训练Word2Vec模型

...

2023-11-10 · 3 min · 大邓

bidict库 | Python双向映射功能,让字典更好用

...

2023-11-09 · 1 min · 大邓

Pandas库 | 对高管数据xlsx中的简介字段做文本分析

...

2023-08-07 · 3 min · 大邓

可视化 | 使用groupby或resample按月份分组绘制高管违规量趋势图

...

2023-05-31 · 2 min · 大邓

文本分析 | 词典法的两种代码实现

但这周末,我使用1.4G的mda数据集, 5w条记录。尝试计算某类词的出现次数, 该词典含几百个词。在我的96G内存的macbook中,运行了十几个小时都没结果。于是同一个问题,本文分享了两种实现方法。一般情况下,使用「方法一」即可。当第一种方法运行不出结果,可以尝试「方法二」。...

2023-04-17 · 2 min · 大邓