如何在python中从完整数据集创建缺失值率(10%、20%等)

如何在python中从完整数据集创建缺失值率(10%、20%等),python,missing-data,Python,Missing Data,有谁能告诉我如何创建缺少值的数据集,这些数据集的百分比与python中原始数据集的百分比不同,如10%、20%。10% import random a_list = range(25) print(random.sample(a_list,len(a_list) - len(a_list)//10)) 然而,它并不能维持秩序 如果你需要维持秩序 import random a_list = range(25) indexes = sorted(random.sample(range(len(a

有谁能告诉我如何创建缺少值的数据集,这些数据集的百分比与python中原始数据集的百分比不同,如10%、20%。

10%

import random
a_list = range(25)
print(random.sample(a_list,len(a_list) - len(a_list)//10))
然而,它并不能维持秩序

如果你需要维持秩序

import random
a_list = range(25)
indexes = sorted(random.sample(range(len(a_list)),len(a_list)//10),reverse=True)
for i in indexes:
    del a_list[i]
print(a_list)
这是一种方法

如果您希望有10%的几率删除任何元素

new_list = [x for x in a_list if random.random()>0.1]

请说明您迄今为止尝试了什么,并给出您正在处理的数据集的示例!