如何使用Python从FTP服务器中刮取文本?

如何使用Python从FTP服务器中刮取文本?,python,python-3.x,ftp,python-requests,ftplib,Python,Python 3.x,Ftp,Python Requests,Ftplib,我希望从本页中提取所有信息: 我知道请求lib不适用于ftp,所以我求助于使用ftplib 然而,文档似乎只探索目录中文件的下载。如果没有“文件类型”,如何下载此文件 提前感谢。如果要将文本文件内容下载到内存中,而不使用任何临时文件,请使用: 或者使用数组: lines = [] ftp.retrlines("RETR " + filename, lines.append) 有关二进制文件,请参见。什么文本?ftp只能在directores中为您提供文件或文件列表-如果您在浏览器或其他

我希望从本页中提取所有信息:

我知道请求lib不适用于ftp,所以我求助于使用ftplib

然而,文档似乎只探索目录中文件的下载。如果没有“文件类型”,如何下载此文件


提前感谢。

如果要将文本文件内容下载到内存中,而不使用任何临时文件,请使用:


或者使用数组:

lines = []
ftp.retrlines("RETR " + filename, lines.append)


有关二进制文件,请参见。

什么文本?ftp只能在directores中为您提供文件或文件列表-如果您在浏览器或其他程序中看到更多内容,则这是此程序添加的额外信息。可能会添加有问题的屏幕截图,以显示您在屏幕截图中看到的文本。如果我不清楚,很抱歉。这是目录中的文件列表-您可以使用
ftp.retrlines('list')
查看第一个Web浏览器,仅以不同的方式重新格式化。但使用ftplib无法获得相同的结果。您只能使用Selenium控制webb浏览器,然后才能从浏览器中获取文本。若要下载,请使用FTP下载。您并不需要Python或刮削来实现这一点。不清楚“文件类型”是什么意思,也不清楚为什么您认为需要知道文件类型,但这看起来只是一个文本文件。文件是否具有扩展名并不重要。您可以使用ftplib作为任何其他文件使用Python下载它(也许您应该使用二进制模式而不是文本模式)。
lines = []
ftp.retrlines("RETR " + filename, lines.append)