Blogs
转载 | 人生认知有层次
我相信大多数人树立「自己理想」的画面大概率都是站在五星红旗下,立下我要做共产主义接班人。但随着年龄增长,国人新的理想没有树立起来,而旧的理想也逐渐淡去。于是可怜可悲的人生开始了, 渐渐的我们变成现实的人。但现实就一定能过好这一生吗...
数据集 | 2012年-2023年港股ESG报告数据集
...
数据集(英文)| USA Today新闻数据集(2012~2024)
媒体数据集研究价值大, 您可从中提取丰富的指标,包括但不限于经济政策不确定性指数EPU 、 媒体关注度指数、文本相似度、情感分析。而且可训练词向量,构建新的词典,开发新的指标指数。计算机自然语言处理、经济学、管理学、新闻传播学、公共管理等领域均可使用。...
代码 | 如何用Python计算知识宽度(赫芬达尔—赫希曼指数)
赫芬达尔-赫希曼指数(Herfindahl-Hirschman Index)作为一种衡量市场集中度的经济指标,通常用于分析产业或市场中企业份额的分布情况。近年来有学者使用HHI算法测量专利的所涉领域的集中程度,反应专利的知识宽度。我们是否可能利用HHI来量化某个语料库中不同词汇的使用频率分布,以此来分析个人、群体或时代的语言风格、词汇丰富度、或是语言标准化与变化的趋势。如果词汇分布非常均匀,表明语言使用中的词汇多样性高,HHI值就会较低;反之,如果少数词汇占据了大部分文本空间,表明词汇使用集中,HHI值则较高。...