有时候学习新的数据分析方法时,需要构造一些小样本的实验数据,手动构造比较麻烦,这时候可以使用faker库。
安装
pip install Faker
快速上手
from faker import Faker
#设定语言,默认生成的是英文数据
#fake = Faker()
fake = Faker(locale='zh_CN')
#伪造姓名
fake.name()
## '罗辉'
生成地址数据
fake.address()
## '湖北省张家港市大东王街v座 601815'
生成公司数据
fake.company_prefix()
## '银嘉'
自定义
例如生成一个工作经历的实验数据,可以自定义公司名集合,从中随机抽取。
from faker import Faker
fake = Faker()
my_word_list = [
'华为','小米','三星',
'海尔','宝马','保洁',
'中铁','中通','京东',
'阿里','百度','腾讯']
work_experiences = fake.sentence(ext_word_list=my_word_list, nb_words=5)
work_experiences
## '京东 华为 中通.'
设定随机性
由于faker属于随机生成数据的包,如果不限定状态, 每次运行相同的代码,随机生成的数据是不一样的。
from faker import Faker
fake = Faker('zh_CN')
#设定随机状态
Faker.seed(4321)
print(fake.name())
## 王鑫