Twitter 如何过滤掉不需要的/官方的推特帖子

Twitter 如何过滤掉不需要的/官方的推特帖子,twitter,filter,nlp,spam-prevention,Twitter,Filter,Nlp,Spam Prevention,我现在正在做一个NLP项目,需要twitter提供一些资源 我想让那些推文由“真人”发布,而不是任何形式的“官方账户”,包括名人、广告、机构、媒体等。比如@CNN@TodayWeather@obama@DailySale@BestPrice@FashionTrend 因此,有没有更好的方法呢 我已经考虑了很久了。通过使用twitter的API,返回的JSON包含一个名为“verified”的键。这可用于检测帐户是否为那种“官方帐户”。然而,今天,这个蓝色的“V”记号不仅仅是为那些耀眼的名人。只要

我现在正在做一个NLP项目,需要twitter提供一些资源

我想让那些推文由“真人”发布,而不是任何形式的“官方账户”,包括名人、广告、机构、媒体等。比如@CNN@TodayWeather@obama@DailySale@BestPrice@FashionTrend

因此,有没有更好的方法呢

我已经考虑了很久了。通过使用twitter的API,返回的JSON包含一个名为“verified”的键。这可用于检测帐户是否为那种“官方帐户”。然而,今天,这个蓝色的“V”记号不仅仅是为那些耀眼的名人。只要是真人,任何人都可以申请。因此,我认为使用此解决方案将排除大量宝贵资源

此外,我还考虑使用文本垃圾邮件过滤器。是的,当然,他们在大多数情况下都很好。然而,有些账户,比如@FT,他们的帖子听起来从来不像垃圾广告。但这不是我想要的

我想寻求更好的解决办法。这可能是一个长期的解决方案,例如使用NLP和神经元从标签中学习。但是,一个迅速的解决方案将是非常受欢迎的

THX