一、Kiva简介
Kiva.org 是一个成立于 2005 年的国际非营利亲社会金融投资平台,其主要工作是通过众筹贷款,并以极低的利息来发放给那些需要的人们, 以助其购买生活必需品,或是找到一份能维持生计的工作。具体来说,这一类 亲社会 金融投资平台在世界各地寻找合作伙伴,例如当地的享有盛誉的非营利组织,来筛选当地对于低息贷款有需要或生活上遭受苦难的人,并收集其资料, 然后向平台发出这些资料以请求帮助。而平台则通过众筹的方式为这些项目筹集贷款资金,投资者则可以以个人或团队的形式进行投资。
二、研究主题
- 亲社会行为心理(Pro-Social Behaviorial Psychology)
- 社会公益 ML 应用(Social Good ML Applications )
- 公平性研究(Fairness Research)
- 社会影响评估(Social Impact Assessments)
部分参考文献
Defazio, Daniela, Chiara Franzoni, and Cristina Rossi-Lamastra. “How pro-social framing affects the success of crowdfunding projects: The role of emphasis and information crowdedness.” Journal of Business Ethics 171 (2021): 357-378.
三、获取数据
网站: Kiva Tools
网址: http://kivatools.com/downloads
项目数(截止2024.4.10): 2187819
介绍: Kiva Tools 是一个帮助Kiva贷方更好地了解小额信贷和 Kiva 运营的网站。 Kiva 目前在多个国家开展业务,并生成大量数据。查看这些数据以更好地了解地理和经济是非常有教育意义的。注意:Kiva Tools不隶属于 Kiva,也不受 Kiva 认可。
声明: 科研用途,仅供展示;如有任何问题,加微信372335839,备注「姓名-学校-专业」
2024.4.10 打开 http://kivatools.com/downloads ,点击 All loans 对应的数据,进行下载,最终得到 875M 的 csv 文件。
四、查看数据
4.1 导入数据
import pandas as pd
df = pd.read_csv('all_loans.csv')
df
4.2 所含字段
所含字段包含
for col in df.columns:
print(col)
字段详情
- LOAN_ID: 贷款ID
- LOAN_NAME: Kiva贷方(出借人)姓名
- FUNDED_AMOUNT: Kiva贷方(出借人)已购买的贷款金额
- LOAN_AMOUNT: 贷款额度
- STATUS: 贷款状态包括违约、还款和已付级别,请参阅 http://build.kiva.org/docs/data/loans 了解每个级别的含义
- IMAGE_ID: 图片ID
- VIDEO_ID: 视频ID
- ACTIVITY_NAME: 活动
- SECTOR_NAME: 部门
- LOAN_USE: 借款用途
- COUNTRY_CODE: 国家代码
- COUNTRY_NAME: 国家名称
- TOWN_NAME: 城镇名称
- CURRENCY_POLICY: 货币政策
- CURRENCY_EXCHANGE_COVERAGE_RATE: 货币兑换
- CURRENCY: 货币类型
- PARTNER_ID: 当地贷款机构的现场合作伙伴 ID,请参阅http://api.kivaws.org/v1/partners.json
- POSTED_TIME: 项目发布时间
- PLANNED_EXPIRATION_TIME: 项目截止时间
- DISBURSE_TIME: 发放给借款人的时间; 请注意,在 Kiva 上发布贷款之前,这笔钱可能会支付给借款人。
- RAISED_TIME:
- LENDER_TERM: 借款人条款
- NUM_LENDERS_TOTAL: 借款人数量
- NUM_JOURNAL_ENTRIES: 借款人的日记账分录数量(Kiva 网站上的更新)。Number of journal entries (updates on the Kiva website) by borrower.
- NUM_BULK_ENTRIES:
- TAGS: 标签
- BORROWER_NAMES: 借款人姓名
- BORROWER_GENDERS: 借款人性别(有可能会存在多个借款人,所以数据类型为字符串或列表)
- BORROWER_PICTURED: 借款人是否提供了图片
- REPAYMENT_INTERVAL: 还款间隔
- DISTRIBUTION_MODEL: 分销模式
4.3 行业
import matplotlib.pyplot as plt
import matplotlib
import matplotlib_inline
matplotlib_inline.backend_inline.set_matplotlib_formats('png', 'svg')
import scienceplots
import platform
plt.style.use(['science', 'no-latex', 'cjk-sc-font'])
system = platform.system() # 获取操作系统类型
if system == 'Windows':
font = {'family': 'SimHei'}
elif system == 'Darwin':
font = {'family': 'Arial Unicode MS'}
else:
font = {'family': 'sans-serif'}
matplotlib.rc('font', **font) # 设置全局字体
plt.figure(figsize=(8, 8))
df['SECTOR_NAME'].value_counts(normalize=True).plot(kind='pie')
plt.title('Kiva项目所属行业部门分布')
plt.show()
4.4 国家项目数量
plt.figure(figsize=(8, 8))
props = df['COUNTRY_NAME'].value_counts(normalize=True)
props_ = props[props>=0.01]
props_['Others'] = props[props<0.01].sum()
props_.plot(kind='pie')
plt.title('国家Kiva项目数量分布')
plt.show()
Kiva 向菲律宾提供的贷款数量较多,按数量(递减)依次是是肯尼亚、柬埔寨、秘鲁、萨瓦尔多、乌干达等。