Pandas库 | 对高管数据xlsx中的简介字段做文本分析

...

2023-08-07 · 3 min · 大邓

可视化 | 使用groupby或resample按月份分组绘制高管违规量趋势图

...

2023-05-31 · 2 min · 大邓

文本分析 | 词典法的两种代码实现

但这周末,我使用1.4G的mda数据集, 5w条记录。尝试计算某类词的出现次数, 该词典含几百个词。在我的96G内存的macbook中,运行了十几个小时都没结果。于是同一个问题,本文分享了两种实现方法。一般情况下,使用「方法一」即可。当第一种方法运行不出结果,可以尝试「方法二」。...

2023-04-17 · 2 min · 大邓

数据集 | 3.9G 全国POI地点兴趣点数据集

POI是英文"Point of Interest"的缩写,中文翻译为"兴趣点"或"兴趣地点"。在地理信息系统(GIS)和位置服务领域中,POI通常指代一些在地图上显示的特定地点或地理位置,例如商店、餐厅、公园、景点等。...

2023-04-12 · 2 min · 大邓

Pandas库 | 使用 df.query 字符串表达式进行数据筛选

数据分析中筛选是一个很重要的操作,在pandas.DataFrame中如何进行筛选,今天简单分享一下。在query方法中传入字段表达式...

2023-01-30 · 4 min · 大邓