Python 如何基于dataframe中的样本创建虚拟记录?
我有一个40条记录,大约有100列 例如: df 有没有什么方法可以让python根据每列中的数据类型来开发样本数据 因此,代码自动生成假身份证、电子邮件和电话号码。理想情况下,我可以设置我需要创建的假记录的数量,例如需要200万行,并且我可以将单词Python 如何基于dataframe中的样本创建虚拟记录?,python,python-3.x,pandas,Python,Python 3.x,Pandas,我有一个40条记录,大约有100列 例如: df 有没有什么方法可以让python根据每列中的数据类型来开发样本数据 因此,代码自动生成假身份证、电子邮件和电话号码。理想情况下,我可以设置我需要创建的假记录的数量,例如需要200万行,并且我可以将单词fake附加到像first\u name这样的列中 新df id email phone first_name ...... 1 a@a.com 123 adam 2 b@b.com 45
fake
附加到像first\u name
这样的列中
新df
id email phone first_name ......
1 a@a.com 123 adam
2 b@b.com 456 bob
3 c@c.com 789 fake_carly
4 c@c.com 789 fake_david
Python
faker
库似乎因您正在做的事情而广受欢迎
更多信息可在此处找到:
虽然它没有使用python来开发示例数据,但我发现这个站点是生成测试数据的一个很好的资源:我以前没有使用过它,但是
faker
似乎是一个使用率很高且广受欢迎的python库。看一看:@user9074332我试过mockaroo,但是我只限于1000行,但这正是我想要的。检查冒牌货谢谢。@user9074332冒牌货非常好,我会接受我的回答
id email phone first_name ......
1 a@a.com 123 adam
2 b@b.com 456 bob
3 c@c.com 789 fake_carly
4 c@c.com 789 fake_david