Web 当类名看起来像垃圾时,如何使用jsoup清除twitter

Web 当类名看起来像垃圾时,如何使用jsoup清除twitter,web,twitter,jsoup,Web,Twitter,Jsoup,所以我想用java来清理twitter。去年,我在python项目中轻松地做到了这一点,因为时间线被封装在一个带有id时间线的div标记中,每个tweet都位于带有id流项的div中 但是现在,如果您在twitter上使用inspect元素,您会看到所有的类名都是垃圾,比如 它似乎是随机生成的,所以在使用jsoup时,我如何才能找到标记?抓取Twitter网站是违反服务条款的。有两个Java库使用官方API,您可以试试。

所以我想用java来清理twitter。去年,我在python项目中轻松地做到了这一点,因为时间线被封装在一个带有id时间线的div标记中,每个tweet都位于带有id流项的div中

但是现在,如果您在twitter上使用inspect元素,您会看到所有的类名都是垃圾,比如


它似乎是随机生成的,所以在使用jsoup时,我如何才能找到标记?

抓取Twitter网站是违反服务条款的。有两个Java库使用官方API,您可以试试。