Faker库 | 生成实验数据 | 大邓和他的PYTHON

有时候学习新的数据分析方法时，需要构造一些小样本的实验数据，手动构造比较麻烦，这时候可以使用faker库。

安装

pip install Faker

快速上手

from faker import Faker

#设定语言，默认生成的是英文数据
#fake = Faker()
fake = Faker(locale='zh_CN')

#伪造姓名
fake.name()

## '罗辉'

生成地址数据

fake.address()

## '湖北省张家港市大东王街v座 601815'

生成公司数据

fake.company_prefix()

## '银嘉'

自定义

例如生成一个工作经历的实验数据，可以自定义公司名集合，从中随机抽取。

from faker import Faker
fake = Faker()

my_word_list = [
'华为','小米','三星',
'海尔','宝马','保洁',
'中铁','中通','京东',
'阿里','百度','腾讯']

work_experiences = fake.sentence(ext_word_list=my_word_list, nb_words=5)
work_experiences

## '京东 华为 中通.'

设定随机性

由于faker属于随机生成数据的包，如果不限定状态，每次运行相同的代码，随机生成的数据是不一样的。

from faker import Faker
fake = Faker('zh_CN')

#设定随机状态
Faker.seed(4321)

print(fake.name())

## 王鑫

安装

快速上手

自定义

设定随机性

广而告之