2025年  20

3月  13

数据集 | Layline美股内幕交易数据集

2025-03-11 · 2 min · 大邓

推荐 | 如何处理远超电脑内存的 csv 文件

2025-03-10 · 2 min · 大邓

代码 | 使用5112w专利申请数据集构造面板数据

2025-03-08 · 4 min · 大邓

数据集 | 5112万条专利申请数据集(1985-2025)

2025-03-07 · 4 min · 大邓

数据集 | 上市公司招聘数据(2014~2023)

2025-03-06 · 2 min · 大邓

数据集 | 应届生招聘数据集(2014~2024.12)

2025-03-06 · 2 min · 大邓

数据集 | 消费者金融投诉数据集(2011 ~ 2025.3)

2025-03-06 · 1 min · 大邓

数据集 | 纽约时报新闻数据集(2000~2025.3.1)

2025-03-06 · 2 min · 大邓

数据集 | 1500w+消费者投诉数据集(2018 ~ 2024.8)

2025-03-05 · 2 min · 大邓

数据集| NOS.nl荷兰新闻数据集(2015~2025.2.28)

2025-03-05 · 2 min · 大邓

爬虫代码 | 使用Python采集黑猫投诉数据

2025-03-04 · 4 min · 大邓

数据集 | 4628w条全球手机蜂窝基站数据(2006~2024.5)

2025-03-03 · 2 min · 大邓

数据集 | 536w条「上证e互动、深证互动易」问答记录(2011-2024.12.31)

2025-03-03 · 1 min · 大邓

2月  7

数据集 | 1998-2023年中国基金年度报告

2025-02-25 · 1 min · 大邓

实验 | 使用大模型从图片中提取结构化数据

2025-02-22 · 2 min · 大邓

PNAS | GPT 是多语言心理文本分析的有效工具

2025-02-17 · 1 min · 大邓

教程 | 使用大模型将文本数据转化为结构化数据

2025-02-14 · 4 min · 大邓

实验 | 使用本地大模型预测在线评论情感类别和分值

2025-02-07 · 4 min · 大邓

实验 | 如何使 Ollama 结构化输出 JSON 样式的结果

2025-02-07 · 2 min · 大邓

教程 | 如何使用 Ollama 下载 & 使用本地大语言模型

2025-02-07 · 4 min · 大邓

2024年  62

12月  2

使用 Word2Vec 和 TF-IDF 计算五类企业文化

2024-12-31 · 3 min · 大邓

如何用图嵌入(网络思维和嵌入思维)表征企业,表征高管的职业经历

2024-12-31 · 3 min · 大邓

8月  4

实验 | 使用 Crewai 和 Ollama 构建智能体(AI Agent)帮我撰写博客文章

2024-08-05 · 4 min · 大邓

LLM数据标注:是否胜过人类?

2024-08-04 · 2 min · Yuliia Kniazieva

实验 | 使用本地大模型从论文PDF中提取结构化信息

2024-08-03 · 4 min · 大邓

arXiv2024 | 使用大语言模型自动进行定性研究中的扎根理论开发

2024-08-02 · 2 min · Übellacker Thomas

7月  6

数据集 | 聚焦美股企业社会责任CSR Wire网站新闻数据集(1999-2024)

2024-07-19 · 2 min · 陈世强

数据集(英文) | CBS News新闻数据集(1998 ~ 2024)

2024-07-13 · 2 min · 大邓

数据集 | ChinaDaily 新闻数据集(2008 ~ 2024)

2024-07-12 · 2 min · 大邓

数据集 | 企业家 Entrepreneur 杂志数据集(1996 ~ 2024)

2024-07-12 · 2 min · 大邓

实验 | 使用Ollama本地大模型DIY制作单词书教案PDF

2024-07-10 · 3 min · 大邓

Open Sanctions | 使用该网站可查询被制裁的个人、企业组织等制裁清单

2024-07-08 · 1 min · 大邓

6月  11

科学上网违法吗

2024-06-30 · 1 min · 大邓

转载 | 人生认知有层次

2024-06-30 · 2 min · 谢春霖

数据集 | 2012年-2023年港股ESG报告数据集

2024-06-26 · 1 min · 大邓

数据集(英文)| USA Today新闻数据集(2012~2024)

2024-06-22 · 2 min · 大邓

代码 | 如何用Python计算知识宽度(赫芬达尔—赫希曼指数)

2024-06-20 · 2 min · 大邓

MOR | 使用md&a测量企业民族主义指标

2024-06-18 · 3 min · 大邓

网络爬虫 | 使用scrapegraph-ai(大模型方案)自动采集网页数据

2024-06-16 · 3 min · 大邓

实验 | 使用本地大模型从文本中提取结构化信息

2024-06-14 · 3 min · 大邓

可视化 | 如何在matplotlib中显示中文

2024-06-05 · 2 min · 大邓

数据集 | 30w条「问政湖南」留言&回复数据(2010-2024)

2024-06-05 · 2 min · 大邓

播客数据集 | 30w播客(Podcast)的560w条评论数据(2005-2023)

2024-06-03 · 4 min · 大邓

5月  10

新闻数据集 | 1102w条纽约时报(1920-2020)

2024-05-30 · 1 min · 大邓

新闻数据集(中文) | 含 人民日报/光明日报/参考消息/经济日报 等 120 家媒体(2024.06)

2024-05-30 · 9 min · 大邓

图文 | PyCharm专业版下载&安装&激活

2024-05-27 · 1 min · 大邓

博客新增留言交流功能

2024-05-17 · 1 min · 大邓

cntext2.x | 新增读取pdf/docx| 提取MD&A | 文本可视化等功能

2024-05-14 · 3 min · 大邓

推荐 | 文本分析库cntext2.x使用手册

2024-05-13 · 14 min · 大邓

代码 | 使用地方gov工作报告生成某类概念词词频「面板数据」

2024-05-11 · 3 min · 大邓

数据集 | 国、省、市三级政府工作报告文本(1954-2024)

2024-05-11 · 2 min · 大邓

数据集 | 2001-2023年A股上市公司年报&管理层讨论与分析

2024-05-08 · 1 min · 大邓

数据集 | 2006年-2023年A股企业社会责任报告/环境报告书/可持续发展报告

2024-05-08 · 2 min · 大邓

4月  16

金融研究 | 使用Python测量关键审计事项的「信息含量」

2024-04-30 · 3 min · 宋建波;冯晓晴

管理世界2024 | 使用管理层讨论与分析测量「企业人工智能指标」

2024-04-29 · 3 min · 大邓

代码 | 使用 MD&A文本测量「企业不确定性感知FEPU」

2024-04-25 · 4 min · 大邓

管理世界 | 使用md&a数据中计算 「企业融资约束指标」

2024-04-24 · 7 min · 大邓

中国工业经济 | 使用Python测量MD&A信息含量指标

2024-04-21 · 7 min · 大邓

管理世界 | 使用 经营讨论与分析 测量 企业数字化

2024-04-20 · 2 min · 大邓

数据集 | 上市公司董监高人员的个人特征/教育背景/任职情况

2024-04-18 · 2 min · 大邓

数据集 | 使用3394w条豆瓣书评数据集

2024-04-17 · 2 min · 大邓

数据集 | 使用1000w条豆瓣影评训练Word2Vec

2024-04-16 · 4 min · 大邓

数据集| A股上市公司基本信息2000-2023

2024-04-16 · 2 min · 大邓

LIST | 社科(经管)数据挖掘文献资料汇总

2024-04-15 · 2 min · 大邓

LIST | 可供社科(经管)领域使用的科研数据集清单

2024-04-15 · 2 min · 大邓

LIST| 文本分析代码资料汇总

2024-04-15 · 3 min · 大邓

文献&代码 | 使用Python计算语义品牌评分(Semantic Brand Score)

2024-04-12 · 3 min · 大邓

数据集 | 372w政府采购合同公告明细数据(2024.03)

2024-04-10 · 3 min · 大邓

数据集 | 众筹金融投资平台kiva借贷数据

2024-04-10 · 2 min · 大邓

3月  1

pandas技巧 | DataFrame的四则运算

2024-03-29 · 1 min · 大邓

2月  1

ANCW | 4030词的中文情感词典(效价、唤醒度、主导度、具体性)

2024-02-27 · 2 min · 大邓

1月  11

使用 Langchain-Chatchat 搭建本地知识库问答系统

2024-01-31 · 1 min · 大邓

可视化 | 使用umap对200维词向量的进行降维和可视化

2024-01-23 · 2 min · 大邓

opencc | 中文简体、繁体转换库

2024-01-21 · 1 min · 大邓

可视化 | 使用 DataMapPlot 绘制数据地图

2024-01-21 · 1 min · 大邓

数据集 | 港股年报文本数据集(2007 ~ 2023.12)

2024-01-21 · 2 min · 大邓

数据集 | 用来练习pandas的招聘数据

2024-01-19 · 1 min · 大邓

数据集 | 三板上市公司年报2002-2023.12

2024-01-18 · 2 min · 大邓

cpca库 | 中国省、市区划匹配库

2024-01-16 · 1 min · 大邓

数据集 | 美股年报10-K、20-F数据(2000-2023.12)

2024-01-13 · 8 min · 大邓

如何设计好 lambda 函数 ?

2024-01-03 · 3 min · 掘金社区

数据集 | 36330条上市公司仲裁数据(2000-2021)

2024-01-03 · 1 min · 大邓

2023年  132

12月  12

数据集 | 2024年中国全国5级行政区划(省、市、县、镇、村)

2023-12-29 · 2 min · 大邓

数据集 | 行政区划代码历史沿革数据集

2023-12-29 · 1 min · 大邓

可视化 | 人民日报语料反映七十年文化演变

2023-12-28 · 5 min · 大邓

词向量 | 使用人民网领导留言板语料训练Word2Vec模型

2023-12-28 · 4 min · 大邓

Polars库 | 最强 Pandas 平替来了

2023-12-27 · 7 min · 大邓

代码 | 使用gov工作报告生成数字化词频「面板数据」

2023-12-27 · 2 min · 大邓

数据集 | 人民网地方领导留言板原始文本(2011-2023.12)

2023-12-22 · 3 min · 大邓

代码 | 使用「新闻数据」构造概念词提及量「面板数据」

2023-12-17 · 3 min · 大邓

代码 | 使用「新闻数据」测量 「经济政策不确定性EPU」指标

2023-12-17 · 4 min · 大邓

数据(付费) | 使用cctv新闻联播文稿构造面板数据

2023-12-16 · 3 min · 大邓

数据集 | 上市公司 208 万条专利数据集 (1991-2022)

2023-12-07 · 3 min · 大邓

数据集 | 2.49亿条中国工商注册企业信息(23.9更新)

2023-12-03 · 2 min · 大邓

11月  22

使用 Ruptures 识别时间序列数据中的变化点

2023-11-26 · 2 min · 大邓

使用patchwork包进行多图排版

2023-11-25 · 1 min · 大邓

相关性分析 | 从模型预测出发挖掘更多特征之间的关系

2023-11-25 · 2 min · Spectator

2T数据集 | 使用GH Archive获取Github社区用户数据

2023-11-22 · 2 min · 大邓

54G数据集 | 1000万个 Github 用户数据

2023-11-22 · 1 min · 大邓

TechWeekly-20 每周有趣有用的技术分享

2023-11-22 · 1 min · 大邓

以聚类为例 | 使用大语言模型LLM做文本分析

2023-11-20 · 2 min · 大邓

使用3751w专利申请数据集按年份(按省份)训练词向量

2023-11-20 · 7 min · 大邓

pandarallel库 | 多核运行提升pandas速度

2023-11-18 · 2 min · 大邓

失败案例 | 使用裁判文书数据集逐年训练年份词向量

2023-11-18 · 3 min · 大邓

Modin,只需一行代码加速你的Pandas

2023-11-17 · 2 min · 大邓

Word Embeddings、Transformer与GPT:一文揭示三者关系

2023-11-16 · 4 min · 7号床

代码 | 使用LDA预测文本的话题类型

2023-11-14 · 2 min · 大邓

不可不防的大模型“人肉搜索”能力

2023-11-13 · 1 min · Robin Staab, Mark Vero, Mislav Balunović, and Martin Vechev

词向量 | 使用1亿B站用户签名训练word2vec词向量

2023-11-12 · 3 min · 大邓

词向量(付费) | 使用1985年-2025年专利申请摘要训练Word2Vec模型

2023-11-10 · 3 min · 大邓

bidict库 | Python双向映射功能,让字典更好用

2023-11-09 · 1 min · 大邓

关于「滥用原创」, 大邓的一些说明

2023-11-07 · 1 min · 大邓

TechWeekly-17 每周有趣有用的技术分享

2023-11-05 · 1 min · 大邓

2023 | 文本分析在经管研究中的应用

2023-11-05 · 3 min · 大邓

OS2022 | 概念空间 | 词嵌入模型如何为组织科学中的测量和理论提供信息

2023-11-03 · 7 min · Pedro Aceves

MS2022 | 使用语言差异性测量团队认知差异性

2023-11-02 · 2 min · 大邓

10月  9

案例代码 | 使用正则表达式判别微博用户mbti类型

2023-10-30 · 2 min · 大邓

GTE中文通用文本向量表示模型

2023-10-27 · 1 min · 等

心理科学进展 | 语义距离与创造性思维关系的元分析

2023-10-18 · 3 min · 李亚丹等

数据集 | 谷歌地图美国区域内poi、评论信息等信息

2023-10-18 · 3 min · Tianyang Zhang

JMR | 测量消费者的语言确定性

2023-10-16 · 2 min · Matthew

网络爬虫 | 采集穷游网某城市旅游景点

2023-10-13 · 2 min · 大邓

管理世界 | 机器学习如何赋能管理学研究?——国内外前沿综述和未来展望

2023-10-11 · 1 min · 刘景江,郑畅然,洪永淼

管理科学学报 | 使用LDA算法计算政策扩散速度与扩散程度

2023-10-10 · 1 min · 张楠,黄梅银,罗亚,马宝君

企业ESG行为的文本度量法

2023-10-07 · 1 min · Mansouri S, Momtaz P P

9月  2

中国管理科学 | 使用业绩说明会文本数据测量上市公司前瞻性信息

2023-09-08 · 5 min · 大邓

数据集 | 84w条业绩说明会问答数据(2005-2023)

2023-09-08 · 1 min · 大邓

8月  7

可视化 | 2021年幸福指数&人口数据可视化最佳实践

2023-08-31 · 2 min · JOSH

可视化 | 使用geopandas可视化地图数据

2023-08-31 · 2 min · 大邓

可视化 | ggparliament包绘制议会图

2023-08-29 · 2 min · 大邓

可视化 | PyWaffle绘制华夫图

2023-08-29 · 3 min · 大邓

可视化 | Netflix 数据可视化最佳实践

2023-08-28 · 10 min · JOSH

CAR2023 | 文本分析在会计中的应用

2023-08-26 · 1 min · 大邓

Pandas库 | 对高管数据xlsx中的简介字段做文本分析

2023-08-07 · 3 min · 大邓

7月  2

免费下载 | 进阶Python学习资料

2023-07-19 · 1 min · 大邓

2个免费可用的chatGPT替代产品

2023-07-12 · 1 min · 大邓

6月  2

mercury | 在jupyter notebook中创建Web应用程序

2023-06-12 · 1 min · 大邓

可视化 | 使用ggdag包绘制有向图

2023-06-02 · 1 min · 大邓

5月  10

可视化 | 使用groupby或resample按月份分组绘制高管违规量趋势图

2023-05-31 · 2 min · 大邓

文本分析 | 使用「软余弦相似度」测量业绩说明会「答非所问程度」

2023-05-24 · 2 min · 大邓

可视化 | 微博用户群体情绪随时间变化趋势

2023-05-18 · 2 min · 大邓

实验数据 | 194城市楼市政策梳理(2010-2022)

2023-05-17 · 1 min · 大邓

数据集 | 上市公司高管违规数据(2008-2022)

2023-05-17 · 1 min · 大邓

网络爬虫 | 批量采集话题「如何评价淄博烧烤?」的回答

2023-05-12 · 4 min · 大邓

B站 | “高铁互殴"视频词云图绘制

2023-05-11 · 1 min · 大邓

数据集 | B站/哔哩哔哩 1 亿用户脱敏数据

2023-05-10 · 1 min · 大邓

数据集 | 中国裁判文书网(2010-2021)

2023-05-07 · 2 min · 大邓

网络爬虫 | 使用Python披露采集Up主视频列表详情信息

2023-05-07 · 3 min · 大邓

4月  18

从3571w条专利数据集「匹配」上市公司的专利信息

2023-04-26 · 3 min · 大邓

实验 | 互联网黑话与MD&A

2023-04-26 · 1 min · 大邓

数据集 | 3.3万 Instagram Influencer的 1018万条推文数据

2023-04-26 · 1 min · Seungbae Kim

数据集| 07-21年上市公司「委托贷款公告」

2023-04-26 · 1 min · 大邓

tomotopy | 速度最快的LDA主题模型

2023-04-25 · 5 min · 大邓

数据分析 | 知乎热门话题「全职儿女」

2023-04-23 · 3 min · 大邓

网络爬虫 | 使用Python采集B站弹幕和评论数据

2023-04-23 · 1 min · 大邓

网络爬虫 | 使用Python采集豆瓣小组组员信息

2023-04-23 · 4 min · 大邓

数据集| 2014年-2023年监管问询函

2023-04-17 · 2 min · 大邓

文本分析 | 词典法的两种代码实现

2023-04-17 · 2 min · 大邓

不要当真 | 词云图看婚姻的本质是什么

2023-04-14 · 2 min · 大邓

prettymaps库 | 绘制绝美地图

2023-04-13 · 1 min · 大邓

数据集 | 3.9G 全国POI地点兴趣点数据集

2023-04-12 · 2 min · 大邓

叙事经济学:揭示经济中的叙事

2023-04-08 · 1 min · 大邓

管理世界 | 政府与市场心理因素的经济影响及其测度

2023-04-07 · 3 min · 洪永淼刘俸奇薛涧坡

语言相对性论 | 语言是否决定/影响人的思维和认知

2023-04-07 · 1 min · 大邓

中文心理词典,含具体性、可成象性等指标

2023-04-05 · 1 min · 大邓

可视化 | 文本数据分成n等份、词云图、情绪变化趋势、相似度变化趋势

2023-04-03 · 3 min · 大邓

3月  19

PNAS | 14000+篇心理学顶刊论文可复现性调研

2023-03-31 · 2 min · 大邓

硬核 | 使用Poetry发布Python库到PyPi的方法

2023-03-31 · 2 min · 大邓

在 Jupyter Notebook 内使用 ChatGPT 服务

2023-03-26 · 1 min · 大邓

词向量 | 使用MD&A2001-2023语料训练Word2Vec模型

2023-03-24 · 4 min · 大邓

可视化 | 睡前消息的科学社会、科学技术、社会化抚养话题可视化

2023-03-22 · 2 min · 大邓

Nature | 通用中英文六维语义情感词典

2023-03-20 · 1 min · 大邓

正念爱好者的推特语言风格有何不同

2023-03-20 · 1 min · 大邓

word_in_context | 查看某类词的上下文,更好的理解文本数据

2023-03-19 · 2 min · 大邓

免费可用的chatGPT镜像站点清单

2023-03-16 · 1 min · xx025

借助chatGPT更高效地学习「Python实证指标构建与文本分析」

2023-03-15 · 1 min · 大邓

词嵌入技术在社会科学领域进行数据挖掘常见39个FAQ汇总

2023-03-15 · 2 min · 大邓

采购合同数据集 | 政府采购何以牵动企业创新

2023-03-15 · 2 min · 大邓

Latex | 将 .cls 更新到本地 Tex 发行版的搜索路径

2023-03-13 · 1 min · 大邓

PNAS | 历史文本中的语言积极性反映了动态的环境和心理因素(含Python代码)

2023-03-13 · 4 min · Tiffany

数据分析 | 使用决策树分析小红书帖子数据(含代码)

2023-03-11 · 3 min · huzujun

基于词嵌入技术的心理学研究: 方法及应用

2023-03-10 · 1 min · 包寒吴霜等

EDGAR | 25年数据的预训练词向量模型

2023-03-08 · 2 min · 大邓

数据集 | 马前卒工作室睡前消息文稿汇总

2023-03-06 · 1 min · 大邓

可视化 | 词嵌入模型用于计算社科领域刻板印象等信息(含代码)

2023-03-03 · 5 min · 大邓

2月  16

TechWeekly-19 每周有趣有用的技术分享

2023-02-26 · 1 min · 大邓

simpleT5 库 | 根据英文摘要内容生成标题

2023-02-23 · 4 min · 大邓

如何在一行代码中实现if-elif-else三分支语句

2023-02-18 · 1 min · 大邓

知乎话题 「毕业五年, 存款 5000」

2023-02-16 · 1 min · 大邓

“使用 chatGPT 写 Python 网络爬虫”

2023-02-15 · 3 min · 大邓

如何注册chatGPT账号

2023-02-14 · 1 min · 大邓

Latex | 文本框底纹填充样式

2023-02-13 · 1 min · 默存

正则表达式 | 词频统计、情感分析、融资约束

2023-02-13 · 2 min · 大邓

转载 | 大数据时代的「计算文化心理学」

2023-02-13 · 3 min · 吴胜涛等

数据清洗 | 借助 chatGPT 设计正则表达式

2023-02-12 · 1 min · 大邓

pynimate库 | 绘制动态可视化图

2023-02-09 · 1 min · 量子位

使用 chatGPT 做词频统计&词云图

2023-02-09 · 2 min · 大邓

使用虚拟信用卡,国内用户升级为chatGPT plus会员

2023-02-09 · 1 min · 大邓

在巨型语言模型时代竞争:OpenAI vs 谷歌

2023-02-09 · 2 min · chatGPT

使用 chatGPT 撰写 Python 文本分析代码

2023-02-01 · 1 min · chatGPT

科学上网工具v2net

2023-02-01 · 1 min · vnet

1月  13

12个优雅的python代码使用案例

2023-01-30 · 3 min · 大邓

Pandas库 | 使用 df.query 字符串表达式进行数据筛选

2023-01-30 · 4 min · 大邓

使用流水线pipeline模式设计并处理数据

2023-01-30 · 1 min · 大邓

CheatSheet | Python文本数据处理速查表

2023-01-27 · 3 min · 大邓

Pandas库 | DataFrame类常用知识点总结

2023-01-27 · 5 min · Willems

NiceGUI库 | 简单易懂的Web GUI开发包; 可开发数据标注工具、心理学实验工具等

2023-01-21 · 1 min · 大邓

R语言 | 绘制文本数据情感历时趋势图

2023-01-20 · 2 min · 大邓

Rath | 自动化数据分析工具

2023-01-18 · 1 min · kanaries

近年《经济研究》中「文本分析」相关论文

2023-01-16 · 1 min · 大邓

转载 | 国外会计文本信息实证研究述评与展望

2023-01-12 · 1 min · 肖浩,詹雷,王征

金融研究 | 央行货币政策文本相似度计算与可视化

2023-01-10 · 2 min · 大邓

5个你或许不知道的pandas数据导入技巧

2023-01-08 · 2 min · 大邓

tqdm库 | Python中实现进度条的几种方式

2023-01-06 · 1 min · 大邓

2022年  134

12月  8

转载 | 大数据驱动的「社会经济地位」分析研究综述

2022-12-30 · 1 min · 么晓明;丁世昌;赵涛;黄宏;罗家德;傅晓明

1850万条 | 世界地图POI兴趣点数据集

2022-12-10 · 1 min · 大邓

LovelyPlots库 | 格式化科学论文、论文和演示文稿的可视化图形

2022-12-10 · 1 min · 大邓

数据集 | 80w知乎用户问答数据(脱敏)

2022-12-10 · 4 min · 大邓

12G数据集 | 23w条Kickstarter项目信息

2022-12-04 · 4 min · 大邓

BERTopic | 使用推特数据构建动态主题模型

2022-12-04 · 4 min · 大邓

JM2022 | 梳理营销领域使用网络爬虫技术的研究

2022-12-03 · 4 min · Boegershausen

社会学研究 | 社会计算驱动的社会科学研究方法

2022-12-03 · 1 min · 周涛

11月  14

可视化 | 绘制《三体》人物关系网络图

2022-11-29 · 17 min · 大邓

Faker库 | 生成实验数据

2022-11-25 · 1 min · 大邓

数据集 | 90w条中国上市公司高管数据

2022-11-25 · 2 min · 大邓

训练&使用Glove语言模型, 可度量刻板印象等

2022-11-22 · 2 min · 大邓

FinBERT | 金融文本BERT模型,可情感分析、识别ESG和FLS类型

2022-11-16 · 3 min · Yang Yi

如何正确读入文本数据不乱码(解决文本乱码问题)

2022-11-16 · 1 min · 大邓

转载 | 金融学文本大数据挖掘方法与研究进展

2022-11-16 · 1 min · 姚加权

PNAS | 使用语义距离测量一个人的创新力(发散思维)得分

2022-11-14 · 2 min · 大邓

魔搭 | 中文AI模型开源社区

2022-11-09 · 1 min · 大邓

DomainWordsDict | 领域词库构建方法与68领域、916万级专业词库分享

2022-11-07 · 2 min · 刘焕勇

十万级 | 多领域因果事件对数据集对外开源

2022-11-07 · 1 min · 刘焕勇

小规模金融并购、投资事件图谱设计概述与数据构成解析

2022-11-07 · 1 min · 刘焕勇

预训练词向量模型的方法、应用场景、变体延伸与实践总结

2022-11-07 · 5 min · 刘焕勇

数据集 | 使用Python对招股说明书进行文本分析

2022-11-02 · 1 min · 大邓

10月  12

gdown库 | 从googleDriver下载大体积文件

2022-10-31 · 1 min · 大邓

使用textstat库计算文本可读性

2022-10-22 · 2 min · 大邓

1.5G数据集 | 200万条Indiegogo众筹项目信息

2022-10-16 · 1 min · 大邓

Python | 词移距离(Word Mover’s Distance)

2022-10-16 · 1 min · 大邓

数据集 | 2007-2021年A股上市公司年度报告(txt文件)

2022-10-16 · 1 min · 大邓

数据集 | 多语言对齐词向量预训练模型

2022-10-16 · 2 min · 大邓

R语言 | 使用word2vec词向量模型

2022-10-12 · 4 min · 大邓

安装python包出现报错:Microsoft Visual 14.0 or greater is required. 怎么办?

2022-10-09 · 1 min · 李老师

Maigret库 | 查询某用户名在各平台网站的使用情况

2022-10-08 · 1 min · 大邓

nlp-roadmap | 文本分析知识点思维脑图

2022-10-08 · 1 min · Tae Hwan Jung

R语言 | 使用shiny的reactive表达式写应用程序

2022-10-07 · 1 min · 猫哥

R语言 | 使用stargazer包输出格式化回归结果

2022-10-07 · 1 min · 猫哥

9月  18

Google Books Ngram Viewer显示英文词汇历史使用趋势

2022-09-27 · 1 min · 大邓

R语言 | renderthis包制作讲解动画、视频

2022-09-27 · 0 min · 大邓

R语言 | 让统计更easy的easystats集合包

2022-09-21 · 4 min · 大邓

R语言 | 使用ggsci包绘制sci风格图表

2022-09-20 · 2 min · R package build

R语言 | ggpubr包让数据可视化更加优雅

2022-09-20 · 6 min · 大邓

文献汇总 | 量化历史学与经济学研究

2022-09-19 · 1 min · 大邓

转载 | 历史GIS的研究现状和发展趋势

2022-09-19 · 2 min · 赵耀龙;巢子豪

国庆直播 | Python实证指标与文本分析

2022-09-18 · 4 min · 大邓

妙言 | 轻灵的Markdown笔记本伴你写出妙言

2022-09-14 · 1 min · 汤圆&可乐

视频2022 | 文本分析在经管研究中的应用

2022-09-08 · 3 min · 大邓

ManagementScience | 使用网络算法识别创新的颠覆性与否

2022-09-07 · 4 min · 大邓

R语言 | ggplot2简明绘图之直方图

2022-09-04 · 3 min · 大邓

R语言 | ggplot2简明绘图之动态图

2022-09-04 · 5 min · 大邓

R语言 | ggplot2简明绘图之散点图

2022-09-03 · 4 min · 大邓

R语言 | 使用officedown包在Rmarkdown中制作PPT

2022-09-03 · 1 min · 大邓

R语言 | 使用posterdown包制作学术会议海报

2022-09-03 · 1 min · Shilaan

R语言 | 绘制中国地图

2022-09-03 · 1 min · 大邓

Latex | 为Rmarkdown配置tinytex环境

2022-09-01 · 1 min · 大邓

8月  2

ymlthis包 | 为Rmarkdown文件轻松设置YMAL

2022-08-27 · 1 min · 大邓

百度指数 | 使用qdata采集百度指数

2022-08-23 · 2 min · 大邓

7月  10

blogdown包 | 使用R语言维护Hugo静态网站

2022-07-29 · 1 min · 大邓

使用R将多个txt汇总到一个csv文件中

2022-07-29 · 3 min · 大邓

renv包 | R语言的项目环境管理库

2022-07-21 · 1 min · 大邓

在jupyter中显示pdf内容

2022-07-21 · 1 min · 大邓

改善matplotlib在jupyter内的渲染效果

2022-07-21 · 1 min · 大邓

天** | 使用selenium做数据采集

2022-07-17 · 2 min · 张延丰

EmoBank | 中文维度情感词典

2022-07-16 · 3 min · 大邓

chinese-converter | 中文繁简互换Python库

2022-07-11 · 1 min · 大邓

2022暑期工作坊 | Python实证指标构建与文本分析

2022-07-10 · 3 min · 大邓

Asent库 | 英文文本数据情感分析

2022-07-10 · 2 min · 大邓

6月  12

视频分享| Python数据挖掘与金融科技

2022-06-24 · 2 min · 大邓

管理世界 | 使用LM中文金融词典对年报进行语调分析

2022-06-22 · 2 min · 大邓

cntext库 | 关于DUTIR被污染解决办法

2022-06-20 · 2 min · 大邓

sklearnex库 | 让你的scikit-learn代码加速百倍

2022-06-18 · 1 min · 大邓

近年《管理世界》《管理科学学报》《金融研究》使用文本分析论文

2022-06-17 · 2 min · 大邓

长期征稿

2022-06-17 · 1 min · 大邓

机器学习实战 | 信用卡欺诈检测

2022-06-16 · 8 min · 小猴子

欢迎各位向cntext库分享情感词典

2022-06-12 · 5 min · 大邓

实战 | 构建基于客户细分的 K-Means 聚类算法!

2022-06-09 · 4 min · 大邓

文本分析 | 中国企业高管团队创新注意力

2022-06-09 · 1 min · 大邓

LIWC vs Python | 文本分析之词典词频法略讲(含代码)

2022-06-08 · 2 min · 大邓

招募小伙伴

2022-06-08 · 1 min · 大邓

5月  8

在jupyter内运行R代码

2022-05-29 · 1 min · 大邓

NLP资源 | 汽车、金融等9大领域预训练词向量模型下载资源

2022-05-25 · 2 min · 刘焕勇

Wordify | 发现和区分消费者词汇的工具

2022-05-15 · 1 min · 大邓

karateclub库 | 计算社交网络中节点的向量

2022-05-10 · 3 min · 大邓

cntext库 | Python文本分析包更新

2022-05-09 · 7 min · 大邓

sentence-transformer库 | 句子语义向量化

2022-05-09 · 1 min · 刘焕勇

PyEcharts库 | 绘制社交关系网络图

2022-05-07 · 1 min · 大邓

SimpleTransformers库 | 使用BERT实现文本向量化

2022-05-05 · 1 min · 大邓

4月  21

geopy库 | 地理编码计算距离

2022-04-28 · 1 min · 大邓

TransBigData库 | 出租车GPS数据处理

2022-04-28 · 3 min · 同济小旭学长

转载 | 从符号到嵌入:计算社会科学的两种文本表示

2022-04-25 · 1 min · 大邓

中文词向量资源汇总 & 使用方法

2022-04-21 · 4 min · 大邓

豆瓣影评 | 探索词向量妙处

2022-04-21 · 3 min · 大邓

将年报数据汇总至xlsx文件中

2022-04-21 · 1 min · 大邓

推荐 | Python文本分析与会计(视频)

2022-04-16 · 4 min · 大邓

WordBias库 | 发现偏见(刻板印象)的交互式工具

2022-04-14 · 2 min · 大邓

结构模型|DSGE|Stata实证前沿|空间计量|Python数据挖掘2022五一工作坊

2022-04-11 · 1 min · 大邓

文献汇总 | 词嵌入 与 社会科学中的偏见(态度)

2022-04-09 · 4 min · 大邓

JCR2021 | 计算文本的语言具体性

2022-04-07 · 3 min · 大邓

转载|大数据时代下社会科学研究方法的拓展——基于词嵌入技术的文本分析的应用

2022-04-07 · 5 min · 冉雅璇李志强刘佳妮张逸石

营销研究中的图像分析

2022-04-05 · 1 min · 大邓

PyPlutchik库 | 可视化文本的情绪轮(情绪指纹)

2022-04-03 · 2 min · 大邓

whatlies库 | 可视化词向量

2022-04-02 · 1 min · 大邓

TechWeekly-16 每周有趣有用的技术分享

2022-04-01 · 1 min · 大邓

营销研究中文本分析应用概述(含案例及代码)

2022-04-01 · 5 min · 大邓

cntext库 | Python文本分析包更新

2022-04-01 · 5 min · 大邓

Bloxs包 | 可在notebook中使用的交互可视化包

2022-04-01 · 1 min · 大邓

极简浏览器启动页StartPage分享

2022-04-01 · 1 min · 大邓

置顶推荐 | Python语法入门(含视频)

2022-04-01 · 1 min · 大邓

3月  11

streamlit|任务周期表生成器

2022-03-29 · 1 min · 大邓

doccano | 为机器学习建模做数据标注

2022-03-28 · 1 min · 大邓

营销科技 | 今天出门穿什么?时尚电商Stitch Fix

2022-03-27 · 1 min · 蘇宇暉&羅凱揚

使用WeasyPrint自动生成pdf报告文件

2022-03-27 · 2 min · 大邓

使用altair绘制漂亮的股票价格趋势图

2022-03-27 · 2 min · 大邓

使用streamlit制作自然语言处理发展时间线页面

2022-03-27 · 1 min · 大邓

Rembg库 | 可以去掉图片背景的

2022-03-23 · 1 min · 大邓

TechWeekly-15 每周有趣有用的技术分享

2022-03-20 · 1 min · 大邓

使用Python计算地图中两点距离及方位角

2022-03-17 · 1 min · 大邓

在Python中使用Greppo构建的地理空间仪表板

2022-03-12 · 3 min · 大邓

TechWeekly-14 每周有趣有用的技术分享

2022-03-02 · 2 min · 大邓

2月  2

如何辨别出开悟的人?

2022-02-06 · 1 min · 大邓

2022-02-05 · 1 min · 大邓

1月  16

TechWeekly-13 每周有趣有用的技术分享

2022-01-28 · 1 min · 大邓

TechWeekly-12 每周有趣有用的技术分享

2022-01-21 · 1 min · 大邓

Python妙用|给小外甥生成10以内加减运算数学做作业

2022-01-17 · 1 min · 大邓

即将开班 | 2022Python数据挖掘寒假工作坊

2022-01-15 · 3 min · 大邓

Hitomi|下载图像/视频/音乐/文本等的桌面实用程序

2022-01-15 · 1 min · 大邓

博客已更新,现支持留言功能

2022-01-15 · 1 min · 大邓

TechWeekly-11| 每周有趣有用的技术分享

2022-01-14 · 1 min · 大邓

Imageio | 读取和写入图像数据的Python库

2022-01-13 · 1 min · 大邓

pychorus | 3行代码提取音乐高潮部分

2022-01-13 · 1 min · Python实用宝典

TechWeekly-10| 每周有趣有用的技术分享

2022-01-08 · 1 min · 大邓

大邓整理的有用Python项目

2022-01-07 · 2 min · 大邓

dvt库 | 视觉文化分析的Python工具包

2022-01-03 · 1 min · 大邓

Stargazer库 | 创建漂亮可发表的多元回归表

2022-01-02 · 1 min · 大邓

PNAS | 情侣分手3个月前就有预兆!聊天记录还能反映分手后遗症

2022-01-02 · 1 min · 桃子 小咸鱼

TechWeekly-09| 每周有趣有用的技术分享

2022-01-01 · 1 min · 大邓

量化历史语言学-贝叶斯语言谱系分析

2022-01-01 · 4 min · 小云哥哥

2021年  100

12月  34

Python与文化分析入门

2021-12-31 · 1 min · 大邓

免费社科类Python编程课程列表

2021-12-31 · 1 min · 大邓

TechWeekly-08| 每周有趣有用的技术分享

2021-12-31 · 2 min · 大邓

使用文本相似度可以识别变化的时间点

2021-12-30 · 1 min · 大邓

文本数据: 展开、过滤和分块

2021-12-28 · 7 min · kkejili

神经网络textgenrnn库生成文本

2021-12-28 · 1 min · 大邓

PNAS | 文本网络分析&文化桥梁Python代码实现

2021-12-28 · 2 min · 大邓

30天Python编程学习挑战

2021-12-27 · 1 min · 大邓

PNAS|词汇熟悉度对线上参与和资金筹集的预测性效用

2021-12-27 · 1 min · 大邓

TechWeekly-07| 每周有趣有用的技术分享

2021-12-26 · 2 min · 大邓

共词矩阵 | cntext更新至1.1

2021-12-22 · 1 min · 大邓

OMNIZART: 音乐转录变得容易

2021-12-20 · 1 min · 大邓

Phonemizer音素化 Python文本语音表征包

2021-12-20 · 3 min · 大邓

音频可视化:采样、频率和傅里叶变换

2021-12-20 · 5 min · cj1128

Python自动化利器RPA爬数据so easy

2021-12-19 · 1 min · 大邓

PNAS | 历史语言记录揭示了近几十年来认知扭曲的激增

2021-12-19 · 2 min · 大邓

changedetection|自动追踪网站更新

2021-12-18 · 1 min · 大邓

TechWeekly-06 | 每周有趣有用的技术分享

2021-12-18 · 1 min · 大邓

知识广度 vs 知识深度

2021-12-13 · 1 min · 阮一峰

Top2Vec | 主题建模和语义搜索库

2021-12-13 · 16 min · 大邓

有偿数据分析服务

2021-12-12 · 1 min · 大邓

TechWeekly-05 | 每周有趣有用的技术分享

2021-12-08 · 1 min · 大邓

案例实战 | 企业信息数据采集

2021-12-08 · 2 min · 大邓

转载 | 管理决策情境下大数据驱动的研究和应用挑战

2021-12-08 · 4 min · ~

博客使用PaperMod主题改版

2021-12-07 · 1 min · 大邓

转载 | 周翔:作为法学研究方法的大数据技术

2021-12-07 · 1 min · 周翔

高质量的Newsletter汇总

2021-12-07 · 1 min · 大邓

中文金融领域知识图谱的数据集ChainKnowledgeGraph

2021-12-06 · 1 min · 刘焕勇

中文语义常用词典ChineseSemanticKB

2021-12-06 · 1 min · 刘焕勇

ashares库|A股市场历史行情数据

2021-12-05 · 1 min · 大邓

PyCatFlow库|类别数据时间序列可视化库

2021-12-05 · 2 min · 大邓

backtrader库 | 简单均线买入卖出策略

2021-12-03 · 5 min · 大邓

DataSpell数据挖掘编辑器

2021-12-01 · 1 min · 大邓

TechWeekly-04 | 每周有趣有用的技术分享

2021-12-01 · 1 min · 大邓

11月  31

在会计研究中使用Python进行文本分析

2021-11-26 · 3 min · 大邓

使用Python采集多媒体文件数据

2021-11-26 · 1 min · 大邓

pyjanitor数据分析清洁包

2021-11-25 · 2 min · 大邓

文本可读性研究及应用清单

2021-11-24 · 3 min · 大邓

TechWeekly-03 | 每周有趣有用的技术分享

2021-11-24 · 1 min · 大邓

科学绘图matplotlib

2021-11-24 · 2 min · 大邓

管理世界 | 使用文本分析&机器学习测量短视主义

2021-11-23 · 1 min · 大邓

文本分析在市场营销研究中的应用

2021-11-23 · 4 min · 大邓

文本分析在经管领域中的应用概述

2021-11-23 · 3 min · 大邓

在Rmarkdown中调用Python代码

2021-11-23 · 2 min · 大邓

科研绘图SciencePlots库

2021-11-23 · 2 min · 大邓

plotnine绘图 | python的ggplot2语法绘图包

2021-11-23 · 2 min · 大邓

读完本文你就了解什么是文本分析

2021-11-22 · 2 min · 大邓

70G上交所年报数据集

2021-11-22 · 1 min · 大邓

rpy2包 | 在Jupyter中调用R语言的代码

2021-11-22 · 2 min · 大邓

数据分析plydata库

2021-11-22 · 2 min · 大邓

YelpDataset | 酒店管理类数据集10+G

2021-11-20 · 1 min · 大邓

哈尔滨的美景

2021-11-19 · 1 min · 大邓

使用pandas_bokeh做可视化

2021-11-18 · 1 min · 大邓

Python告诉你“被动收入”的财务自由是谎言,但可扩展收入的财务自由是真的

2021-11-17 · 2 min · 大邓

TechWeekly-02 | 每周有趣有用的技术分享

2021-11-17 · 1 min · 大邓

人工智能与图数据库技术

2021-11-16 · 1 min · 大邓

使用Pandas做数据预处理

2021-11-16 · 2 min · 大邓

使用Pandas处理文本数据

2021-11-16 · 3 min · 俊欣

推荐|pandas必知必会50例

2021-11-16 · 7 min · 俊欣

推荐20个好用到爆的Pandas函数方法

2021-11-16 · 9 min · 大邓

spacy产业级自然语言处理包

2021-11-14 · 3 min · 大邓

2021最流行的8张可视化图

2021-11-10 · 1 min · 大邓

TechWeekly-01 | 每周有趣有用的技术分享

2021-11-10 · 1 min · 大邓

cntext中文文本分析库 | 值得收藏

2021-11-08 · 5 min · 大邓

Hugging Face | 自然语言处理平台

2021-11-07 · 1 min · 大邓

10月  8

如何在DataFrame中使用If-Else条件语句创建新列

2021-10-30 · 1 min · 大邓

让Python代码更简洁的pipe包

2021-10-30 · 2 min · 大邓

使用matplotlib绘制超可爱超萌化的图表

2021-10-30 · 4 min · 大邓

automa插件|无编程基础也可自动化办公

2021-10-27 · 1 min · 大邓

KeyBERT | 关键词发现

2021-10-27 · 2 min · 大邓

BERTopic库 | 使用预训练模型做话题建模

2021-10-26 · 3 min · 大邓

Shifterator库 | 词移图分辨两文本用词风格差异

2021-10-26 · 2 min · 大邓

SHAP机器学习模型解释库

2021-10-14 · 1 min · 大邓

9月  1

DataShare | 6000+个股票的每日财经新闻

2021-09-20 · 1 min · bot_developer

7月  3

tfidf有权重的情感分析

2021-07-18 · 1 min · 大邓

Label-Studio|多媒体数据标注工具

2021-07-18 · 1 min · 大邓

中文金融情感词典

2021-07-13 · 1 min · 大邓

6月  2

Clumper库|dplyr样式的Python包

2021-06-22 · 9 min · 大邓

我最喜欢的15个Typora主题

2021-06-01 · 1 min · 大邓

5月  6

深交所上交所pdf批量下载

2021-05-25 · 1 min · 大邓

Pandas小案例 | 对某公司同年的某指标批量汇总

2021-05-20 · 1 min · 大邓

使用Hugo框架建立个人网站

2021-05-13 · 1 min · 大邓

Hi Research 定义自己的科研首页

2021-05-12 · 1 min · 大邓

Jaal库~轻松绘制动态社交网络关系图

2021-05-08 · 1 min · 大邓

Kaggle数据挖掘最佳实践

2021-05-06 · 6 min · 大邓

4月  15

Python是一种语言

2021-04-22 · 2 min · 大邓

Mac电脑Python环境配置

2021-04-19 · 1 min · 大邓

Win电脑Python环境配置

2021-04-19 · 1 min · 大邓

数据类型-字符串

2021-04-17 · 2 min · 大邓

数据类型-列表元组集合

2021-04-16 · 2 min · 大邓

数据类型-字典

2021-04-15 · 2 min · 大邓

数据类型-布尔值&None

2021-04-14 · 2 min · 大邓

逻辑语句(if&for&tryexcept)

2021-04-13 · 3 min · 大邓

高级语法-列表推导式

2021-04-12 · 2 min · 大邓

高级语法-理解函数

2021-04-10 · 1 min · 大邓

常用内置函数

2021-04-09 · 4 min · 大邓

内置库-文件路径pathlib库

2021-04-07 · 2 min · 大邓

内置库-数据存储csv库

2021-04-06 · 1 min · 大邓

内置库-正则表达式re库

2021-04-05 · 2 min · 大邓

python常见错误及解决办法

2021-04-04 · 5 min · 大邓

2020年  1

2月  1

causalinference库 | 使用Python做因果推断

2020-02-09 · 3 min · 大邓

2019年  1

12月  1

文本相似 | Lazy Prices公司年报内容变动预示重大风险

2019-12-31 · 2 min · 大邓

2018年  3

6月  2

推荐系统与协同过滤、奇异值分解

2018-06-07 · 2 min · 大邓

当cnsenti遇上streamlit

2018-06-07 · 1 min · 大邓

5月  1

使用scipy实现层次聚类分析

2018-05-18 · 2 min · 大邓

  8

1月  8

LIST

6 min · 大邓

Search

0 min · 大邓

TechWeekly-18 每周有趣有用的技术分享

1 min · 大邓

关于

1 min · 大邓

归档

0 min · 大邓

支持一下

1 min · 大邓

视频课程 | Python实证指标构建与文本分析

4 min · 大邓

词嵌入测量不同群体对某概念的态度(偏见)

4 min · 大邓