用python解析HTML页面

用python解析HTML页面,python,html-parsing,Python,Html Parsing,我想在这样的网站源代码解析 If (something="<BODY>"): while (something!="</BODY>"): if (something="https") : put the word on a list 问题是我不知道解析的方法,我指的是我用来读取源代码的函数。 我有一个对象的源代码,即MyObj 哪种方法最好?是我用过的最好的HTML解析库,看一看。是我用过的最好的HTML解析库,看一看。使用HTML解析库解析HTML。

我想在这样的网站源代码解析

If (something="<BODY>"):
 while (something!="</BODY>"):
  if (something="https")   :
    put the word on a list
问题是我不知道解析的方法,我指的是我用来读取源代码的函数。 我有一个对象的源代码,即MyObj


哪种方法最好?

是我用过的最好的HTML解析库,看一看。

是我用过的最好的HTML解析库,看一看。

使用HTML解析库解析HTML。两个流行的好方法是and。

使用HTML解析库来解析HTML。两个流行的、好的是和。

有没有办法不用这两个库解析HTML文件?使用regex?@georgemano:regex不是解析HTML的正确工具。@除了使用外部库(如beautifulsoup和lxml)之外,还有其他解析方法吗?我不知道。这里有一个臭名昭著的答案,关于为什么您不应该为此使用自己的解析器/正则表达式,请参见,或者有没有一种方法可以在不使用这两个库的情况下解析HTML文件?使用regex?@georgemano:regex不是解析HTML的正确工具。@除了使用外部库(如beautifulsoup和lxml)之外,还有其他解析方法吗?我不知道。这里有一个臭名昭著的答案,关于为什么不应该尝试为此使用自己的解析器/正则表达式,请参见,或者有没有一种方法可以在不使用此库的情况下解析HTML文件?有没有一种不用这个库就能解析HTML文件的方法?用正则表达式还是什么?