用python解析HTML页面_Python_Html Parsing

用python解析HTML页面

python

用python解析HTML页面,python,html-parsing,Python,Html Parsing,我想在这样的网站源代码解析 If (something="<BODY>"): while (something!="</BODY>"): if (something="https") : put the word on a list 问题是我不知道解析的方法，我指的是我用来读取源代码的函数。我有一个对象的源代码，即MyObj 哪种方法最好？是我用过的最好的HTML解析库，看一看。是我用过的最好的HTML解析库，看一看。使用HTML解析库解析HTML。

我想在这样的网站源代码解析

If (something="<BODY>"):
 while (something!="</BODY>"):
  if (something="https")   :
    put the word on a list

问题是我不知道解析的方法，我指的是我用来读取源代码的函数。我有一个对象的源代码，即MyObj

哪种方法最好？

是我用过的最好的HTML解析库，看一看。

使用HTML解析库解析HTML。两个流行的好方法是and。

使用HTML解析库来解析HTML。两个流行的、好的是和。

有没有办法不用这两个库解析HTML文件？使用regex？@georgemano:regex不是解析HTML的正确工具。@除了使用外部库（如beautifulsoup和lxml）之外，还有其他解析方法吗？我不知道。这里有一个臭名昭著的答案，关于为什么您不应该为此使用自己的解析器/正则表达式，请参见，或者有没有一种方法可以在不使用这两个库的情况下解析HTML文件？使用regex？@georgemano:regex不是解析HTML的正确工具。@除了使用外部库（如beautifulsoup和lxml）之外，还有其他解析方法吗？我不知道。这里有一个臭名昭著的答案，关于为什么不应该尝试为此使用自己的解析器/正则表达式，请参见，或者有没有一种方法可以在不使用此库的情况下解析HTML文件？有没有一种不用这个库就能解析HTML文件的方法？用正则表达式还是什么？