使用流水线pipeline模式设计并处理数据

在jupyter内进行数据分析,大家都有一种流水线的感觉。从上往下,每一行(坨)代码会解决一个小问题,最终联合在一起解决一个大问题。拆解成三个**环节函数**,并组织成一个流水线。可读性和代码可扩展性大大提高,能轻松应对不同复杂度任务。代价仅仅是多写几行代码。首先需要安装一个实现流水线功能的fastcore库。...

2023-01-30 · 1 min · 大邓

CheatSheet | Python文本数据处理速查表

对于需要清洗、处理和分析文本数据的Python用户来说,本文是您处理文本数据的终极资源。该速查表提供了Python常用的处理文本数据的函数和库,以及详细的示例和解释。...

2023-01-27 · 3 min · 大邓

Pandas库 | DataFrame类常用知识点总结

pandas是最有用的Python数据分析库, 两个数据类型DataFrame和Series,值的我们反复接触、学习和实验,逐渐的将pandas独特的语法掌握。...

2023-01-27 · 5 min · Willems

NiceGUI库 | 简单易懂的Web GUI开发包; 可开发数据标注工具、心理学实验工具等

简单易懂的Web GUI开发包; 可开发数据标注工具、心理学实验工具等...

2023-01-21 · 1 min · 大邓

R语言 | 绘制文本数据情感历时趋势图

使用R语言,基于卫报数据、LSD2015词典,绘制文本数据情感历时趋势图...

2023-01-20 · 2 min · 大邓