有时候学习新的数据分析方法时,需要构造一些小样本的实验数据,手动构造比较麻烦,这时候可以使用faker库


安装

pip install Faker


快速上手

from faker import Faker

#设定语言,默认生成的是英文数据
#fake = Faker()
fake = Faker(locale='zh_CN')

#伪造姓名
fake.name()
## '罗辉'


生成地址数据

fake.address()
## '湖北省张家港市大东王街v座 601815'


生成公司数据

fake.company_prefix()
## '银嘉'


自定义

例如生成一个工作经历的实验数据,可以自定义公司名集合,从中随机抽取。

from faker import Faker
fake = Faker()

my_word_list = [
'华为','小米','三星',
'海尔','宝马','保洁',
'中铁','中通','京东',
'阿里','百度','腾讯']

work_experiences = fake.sentence(ext_word_list=my_word_list, nb_words=5)
work_experiences
## '京东 华为 中通.'


设定随机性

由于faker属于随机生成数据的包,如果不限定状态, 每次运行相同的代码,随机生成的数据是不一样的。

from faker import Faker
fake = Faker('zh_CN')

#设定随机状态
Faker.seed(4321)

print(fake.name())
## 王鑫