ESG的全称是环境(Environmental)、社会(Social)、和公司治理(Governance)。这是一个框架,用于评估企业运营对环境的影响、企业与社会的关系,以及企业的内部治理结构和流程。ESG概念广泛应用于可持续投资领域,帮助投资者理解企业在非财务指标上的表现,从而做出更加全面的投资决策。


一、ESG概况

数据集名称: 港股ESG报告数据集
语言类型: 中文、英文
记录数量
  - 中文8825
  - 英文8816
数据格式: TXT/PDF/CSV
数据体积: 97 G
会计年度: 2012 ~ 2023


声明

科研用途;需要的请加微信 372335839, 备注「姓名-学校-专业-港股ESG」



二、查看数据

TXT、PDF都是单个的文件,每个文件对应一家公司某年度的ESG报告。而 CSV 则是汇总数据文件, 一个文件内含有所有TXT的信息。

2.1 读取数据

import pandas as pd

cdf = pd.read_csv('香港ESG(中文).csv.gz')
cdf['pub_date'] = pd.to_datetime(cdf['pub_date'])
cdf


edf = pd.read_csv('香港ESG(英文).csv.gz')
edf['pub_date'] = pd.to_datetime(edf['pub_date'])
edf


2.2 统计年度报告量

from plotnine import *
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

#文泉驿微米黑.ttf位于代码同文件夹
font_prop = FontProperties(fname='文泉驿微米黑.ttf') 
data['year'] = data['year'].astype('category')

(
    ggplot(data,  aes(x='year', y='volume'))
    +geom_col()
    +geom_text(aes(label='volume'), data=data, va='bottom', color='grey', size=10)
    +theme(figure_size=(10, 6),
           text = element_text(family = font_prop.get_name()), 
           plot_title = element_text(family = font_prop.get_name(), size=14)
          )
    +labs(title='港股中文ESG报告发布数量',
          x = '年度', 
          y = '报告数')
)
  


from plotnine import *
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

#文泉驿微米黑.ttf位于代码同文件夹
font_prop = FontProperties(fname='文泉驿微米黑.ttf') 
edata['year'] = edata['year'].astype('category')

(
    ggplot(edata,  aes(x='year', y='volume'))
    +geom_col()
    +geom_text(aes(label='volume'), data=edata, va='bottom', color='grey', size=10)
    +theme(figure_size=(10, 6),
           text = element_text(family = font_prop.get_name()), 
           plot_title = element_text(family = font_prop.get_name(), size=14)
          )
    +labs(title='港股英文ESG报告发布数量',
          x = '年度', 
          y = '报告数')
)
  



广而告之