Java 减少地理参考推文

Java 减少地理参考推文,java,twitter,tweetstream,Java,Twitter,Tweetstream,在推特数据流传输过程中,我发现使用lat和lon的地理参考推特明显减少。是因为Foursquare信息集成吗?或者还有其他问题吗 非常感谢 去年,我开发了一款基于位置的社交分析应用程序。我们对twitter上的推特进行了采样,目的是使用地理位置属性来按区域确定情绪。不幸的是,我们发现,根据我们自己的调查结果,只有10-15%的推特实际上是地理标记的,这不足以提供情绪的准确描述。相反,我们选择使用位置指示标签 也就是说,这取决于样本量。我们试图确定一些地区的情绪,比如拥有少量活跃推特用户的建筑。如

在推特数据流传输过程中,我发现使用lat和lon的地理参考推特明显减少。是因为Foursquare信息集成吗?或者还有其他问题吗


非常感谢

去年,我开发了一款基于位置的社交分析应用程序。我们对twitter上的推特进行了采样,目的是使用地理位置属性来按区域确定情绪。不幸的是,我们发现,根据我们自己的调查结果,只有10-15%的推特实际上是地理标记的,这不足以提供情绪的准确描述。相反,我们选择使用位置指示标签

也就是说,这取决于样本量。我们试图确定一些地区的情绪,比如拥有少量活跃推特用户的建筑。如果你的目标是在大得多的地区(如城镇/国家)找到推文,那么10-15%可能就足够满足你的需求了

回答你最初的问题:用户通常是私有的,除非他们明确打算在某个地方签入,因此我猜测10-15%的推特位于地理位置,是由于用户忘记禁用地理位置或使用未禁用的新设备/不常使用的设备。这也可以归因于foursquare信息集成,因为我确信用户忽略了foursquare为twitter提供地理位置信息的事实

这是一本有趣的书。它概述了由SoCar大学开发的一个应用程序,它可以帮助用户识别他们是否用他们的推文分发敏感的/私人的位置信息。