Web scraping 我如何从一个网站(可能包括通过RSS阅读器)上抓取所有文章?

Web scraping 我如何从一个网站(可能包括通过RSS阅读器)上抓取所有文章?,web-scraping,rss-reader,Web Scraping,Rss Reader,请原谅我的无知,我是一个普通的计算机用户,对编程一无所知。无论如何,我的问题是: 是否有一种方法可以获取(即可能是“刮”编程术语)在特定科技新闻网站上发布的所有文章?我希望输出的标题和文章,可能还有日期和作者,最好以纯文本的形式出现,这样我就可以在一个名为AntConc的语料库工具中使用它,作为我个人和非盈利研究的一部分 事实上,如果我可以通过我的RSS阅读器feedly或inoreader为很多网站提供服务,那将非常方便,但这可能要求太高,所以“一个接一个”的抓取也可以 像波西亚这样的人会耍把

请原谅我的无知,我是一个普通的计算机用户,对编程一无所知。无论如何,我的问题是:

是否有一种方法可以获取(即可能是“刮”编程术语)在特定科技新闻网站上发布的所有文章?我希望输出的标题和文章,可能还有日期和作者,最好以纯文本的形式出现,这样我就可以在一个名为AntConc的语料库工具中使用它,作为我个人和非盈利研究的一部分

事实上,如果我可以通过我的RSS阅读器feedly或inoreader为很多网站提供服务,那将非常方便,但这可能要求太高,所以“一个接一个”的抓取也可以

像波西亚这样的人会耍把戏吗?请记住,我对python等一无所知,我需要任何方法都非常、非常简单和直接


谢谢

是的,如果其他网站支持此功能,则很可能从这些网站加载数据。在java/android中,我们只需创建一个简单的应用程序,将数据作为Json加载,然后使用适配器将其解析为ListView、ImageView等视图,并可能存储在缓存中

但是这里有一个关于Udemy的很棒的免费课程,你可以很快地检查一下你的梦想解决方案

或者,如果你有高达19美元的自动、高质量的RSS阅读器应用程序,而根本不需要编码,那么你可以去看看

或质量较低,简单但免费


但最好还是抽出一点时间,制作应用程序或雇佣开发人员提供服务

谢谢Vivee花时间回答!我在Udemy有一个账户,并且已经浏览了课程,但是我可能太忙了,无法真正实施它。有没有其他更快捷的方式收集所有这些内容?非常感谢。再次感谢你,薇薇,我非常感谢你的帮助!我将在一分钟内更详细地研究这些链接,但目前我仍然无法理解我自己的RSS阅读器如何使我能够下载自某个网站启动以来发布在该网站上的所有文章?简单的网页抓取不是更简单吗?只是问:/