Twitter 钓鱼或垃圾邮件推文的培训数据

Twitter 钓鱼或垃圾邮件推文的培训数据,twitter,spam,phishing,Twitter,Spam,Phishing,我想在twitter上进行钓鱼/垃圾邮件检测。 我通过twitter提供的流媒体API获得了大约500000条推文。然后,我提取这些推文中出现的url,并将它们提交到两个黑名单中——谷歌安全浏览和网络钓鱼银行,以获得是否是网络钓鱼链接的基本判断。这里的问题是,根据我的实验结果,我无法获得足够的钓鱼推文样本。 是否存在任何已被标记为恶意/正常的现有推特数据,以便我继续工作?url黑名单无法正常工作,因为存在延迟。你可以使用挂起的帐户作为标签,但你应该注意,并不是所有挂起的帐户都是钓鱼帐户

我想在twitter上进行钓鱼/垃圾邮件检测。 我通过twitter提供的流媒体API获得了大约500000条推文。然后,我提取这些推文中出现的url,并将它们提交到两个黑名单中——谷歌安全浏览和网络钓鱼银行,以获得是否是网络钓鱼链接的基本判断。这里的问题是,根据我的实验结果,我无法获得足够的钓鱼推文样本。
是否存在任何已被标记为恶意/正常的现有推特数据,以便我继续工作?

url黑名单无法正常工作,因为存在延迟。你可以使用挂起的帐户作为标签,但你应该注意,并不是所有挂起的帐户都是钓鱼帐户