一、关于我
本硕博都是管理学,一个相当不务正业的文科生^_^。
二、关于Python
文科生视角,Python与不同语言的对比
-
Python vs C, Python语法最说人话,至于运行效率,讲真的,对文科生Python已经够用了。
-
Python vs R, 如果可以,一起学。让Python做采集与清洗的脏活,让R做漂亮的图表。
-
其他语言没有系统学过,不好评述。
三、关于博客
博客阅读量惨淡,每天只有就两三个访问量,但可以整理资料,方便大家浏览及下载资料,也可留言交流,很值得去做的。
博客名大邓和他的Python,看起来挺奇怪的名字,其实在西方,公司名带有“&”、“and”字眼的都是挺大的公司,例如P&G。最初是希望把公众号做成个人品牌,输出自己对世界看法观点,同时又能分享Python技术。渐渐地发现,敲代码费脑但很享受,分享看法轻松却很无聊,遂逐渐聚焦于技术分享,这多少让公众号变的有些名不符实。
四、关于文本分析
16年刚入门Python之时,从导师所谈论的信息中,感觉经管领域蕴含着海量可供研究的文本数据,等待着大家去蒸馏出商业社会的真知灼见。
偶然间看到哲学家维特根斯一句话:“The limits of my language mean the limits of my world.",直译过来“我语言的边界就是我世界的边界”。我们的语言能力决定了我们对世界的认知和理解的范围。作为表达思想和情感的符号系统,语言和单词揭示了重要的信息。目前AI技术透过海量文本数据,已能窥探到人类认知层面的线索,如偏见(刻板印象)、群体态度、文化差异、文化变迁等。这很哇塞,涉及到方法论底层哲学,这让我很信服文本分析方法合理性和科学性。
目前文本分析相关概念有很多,如情感分析、话题分析、内容分析、文化组学(借用的基因组学)、文化变迁、语义分析、自然语言处理,所涉专业领域有自然语言处理、图书情报学、知识图谱、计算社会学、经管等。大家可以通过自己熟悉的领域接触,慢慢感受字里行间中反映出的人类认知信息。
在github上已已开源Python包有
推荐cntext,仍在更新中。
五、关于课程收费
5.1 能免费吗?
额, 这个问题回答起来比较铜臭味(人活着,需要钱)。 换个问题, 为啥买我的课程?
答: 我制作了觉得大家需要的, 正好你需要学这门文本分析课程, 而且你十分认可大邓的内容价值, 我就收到你的付费认可。嗯,情况就是这样的。 「大邓的劳动」+「你的认可」 共同决定着 「课程价值」。 如果还不够认可,没关系, 多阅读免费内容积累对大邓的认可,大邓博客里绝大多数分享都是公开免费的, 免费内容也是很赞的。
5.2 课程值的学吗?
课程价格较高, 如不从事科研,这门课不建议购买。
如果是社科类领域科研工作者,这门课是值得的学的。这门课浓缩了近7年上万小时的人类无差别一般劳动,范围聚焦python、数据采集、文本分析等技术在社会科学(经管)科研中的最新应用场景。
干货的价值 » 付出的价格 。
六、关于付费数据
5.1 数据集都是收费吗
大邓要花很多时间精力整理内容, 满足三个条件大邓会将数据集设置成收费数据集,即数据采集&清洗难度大、文本分析上手困难、科研用途价值大的数据。
- 新闻数据集 | 含 人民日报/经济日报/光明日报 等 7 家媒体(2023.12.18)
- 数据集 | 美股年报10-K、20-F数据(2000-2023.12)
- 数据集 | 2.49亿条中国工商注册企业信息(23.9更新)
- 数据集 | 3571万条专利申请数据集(1985-2022年)
5.2 为啥你的这么贵呀?
大邓的数据集除了常见的介绍(记录数、字段、价格), 还包含pandas读取、词频统计、可视化等常用代码内容, 让你买到就能马上用到。
不止是数据,更在于数据集配套的python代码教程, 如
七、期待支持
对我的支持可以有很多种, 包括不限于红包支持、转发支持、信息支持。 支持越多,我越开心😄
在博客下方有留言,我更希望各位注册一下github账号, 更方便的使用和下载github内的很多资源,顺便给大邓留下宝贵的信息支持(比如某个论文中的文本分析方法很新, 是大邓没分享过的)。