Python 单击具有大量零数据的欺诈检测

Python 单击具有大量零数据的欺诈检测,python,machine-learning,dataset,data-science,anomaly-detection,Python,Machine Learning,Dataset,Data Science,Anomaly Detection,我有一些广告出版商的数据集。出版商每点击一次广告就能赚钱。数据集由发布者列表和相应的点击次数以及它们引起的交易次数组成。问题在于出版商是否作弊并点击自己的广告来赚取更多的钱。但其中一些出版商的总点击量非常小(低于10),因此交易量为0 我的问题是,我应该如何处理这些零数据?它们实际上破坏了我的数据的高斯分布。我该怎么处理它们呢?从我的数据集中删除它们?有没有什么统计方法可以做到这一点 顺便说一下,我对数据分析非常陌生,如果答案显而易见,请原谅,但我在网上找不到答案。删除零 >>>

我有一些广告出版商的数据集。出版商每点击一次广告就能赚钱。数据集由发布者列表和相应的点击次数以及它们引起的交易次数组成。问题在于出版商是否作弊并点击自己的广告来赚取更多的钱。但其中一些出版商的总点击量非常小(低于10),因此交易量为0

我的问题是,我应该如何处理这些零数据?它们实际上破坏了我的数据的高斯分布。我该怎么处理它们呢?从我的数据集中删除它们?有没有什么统计方法可以做到这一点

顺便说一下,我对数据分析非常陌生,如果答案显而易见,请原谅,但我在网上找不到答案。

删除零

>>> x = [0,2,0,5,0,6,77,8,9]
>>> list(filter((0).__ne__, x))
[2, 5, 6, 77, 8, 9]

高斯分布的形状将发生变化。

感谢您的回复,但它不会改变分布和结果p(x)@理查德