个人感觉博客 textdata.cn 文本分析代码案例都集中在这里了,我将内容按大类分成

- Python语法
- 数据采集
- 数据处理&Pandas
  - 正则表达式
  - pandas常用方法
  - pandas性能优化
  - 其他操作
- 文本分析
  - 概览
  - 词典法
  - 词向量
  - 大语言模型
- 数据标注&机器学习
  - 数据标注
  - 监督机器学习
  - 非监督机器学习
- 可视化
- R语言
- 其他



一、Python语法



二、数据采集



三、数据处理&Pandas

3.1 文本处理

使用正则表达式可以筛选文本数据,做数据预处理(数据清洗)


3.2 常用方法


3.3 性能优化&其他操作



四、文本分析

4.1 概览


4.2 词典法


4.3 词向量


4.4 大语言模型



五、提取特征&机器学习

5.1 监督机器学习


5.2 非监督机器学习



六、可视化



七、R语言



八、其他



九、工具



广而告之

  • 长期征稿
  • 长期招募小伙伴
  • 付费视频课程 | Python实证指标构建与文本分析
    • 大邓每年会有4场直播,五一、十一、寒、暑假,如果时间点接近,可考虑报名参与直播课
    • 如果只意性价比,且已迫不及待想学,可以考虑直接报名大邓的录播课
    • 如果不想学,也可以考虑外包。更建议找淘宝,如果找我咨询,请先阅读有偿说明