Javascript 使用正则表达式分解html源代码_Javascript_Html_Regex

Javascript 使用正则表达式分解html源代码

javascript html regex

Javascript 使用正则表达式分解html源代码,javascript,html,regex,Javascript,Html,Regex,我正在尝试将每个标记从我接收的HTML源中分离出来这是一个巨大的代码块，我正在接收，我试图使它更“可读性”，为人类分析。到目前为止，我只编写了以下正则表达式代码： RegEx(<\w*>.*<\/\w*>) RegEx（.*）但这就是的要领！DOCTYPE标记并运行，直到我试图做的是独立于类型，单独选择每个标签。另外，我正在用JavaScript运行这个正则表达式任何建议都是非常受欢迎的：）解决眼前的问题是微不足道的。您需要创建通配符 i、 e.您希望将*

我正在尝试将每个标记从我接收的HTML源中分离出来

这是一个巨大的代码块，我正在接收，我试图使它更“可读性”，为人类分析。到目前为止，我只编写了以下正则表达式代码：

RegEx(<\w*>.*<\/\w*>)

RegEx（.*）

但这就是

的要领！DOCTYPE

标记并运行，直到

我试图做的是独立于类型，单独选择每个标签。
另外，我正在用JavaScript运行这个正则表达式

任何建议都是非常受欢迎的：）

解决眼前的问题是微不足道的。您需要创建通配符

i、 e.您希望将

（尽可能匹配上一个内容）更改为

*？

（尽可能少地匹配上一个内容，但仍允许您匹配下一个内容）

…但如果属性值、脚本元素或样式元素等内部存在

，则代码将中断

解析HTML并非易事。改用现有的库。

解决眼前的问题并不重要。您需要创建通配符

i、 e.您希望将

（尽可能匹配上一个内容）更改为

*？

（尽可能少地匹配上一个内容，但仍允许您匹配下一个内容）

…但如果属性值、脚本元素或样式元素等内部存在

，则代码将中断

解析HTML并非易事。改用现有的库。

这一次，我改变了思维方式，尝试用不同的方法解决问题，并找到了一个不错的库，正如您所建议的那样。Jsoup，看起来不错。尽管使用

*？

的技巧。非常感谢：这一次我改变了我的思维方式，尝试用不同的方法解决这个问题，正如你所建议的，我找到了一个很好的库。Jsoup，看起来不错。尽管使用

*？

的技巧。非常感谢：D