Javascript 使用正则表达式分解html源代码

Javascript 使用正则表达式分解html源代码,javascript,html,regex,Javascript,Html,Regex,我正在尝试将每个标记从我接收的HTML源中分离出来 这是一个巨大的代码块,我正在接收,我试图使它更“可读性”,为人类分析。 到目前为止,我只编写了以下正则表达式代码: RegEx(<\w*>.*<\/\w*>) RegEx(.*) 但这就是的要领!DOCTYPE标记并运行,直到 我试图做的是独立于类型,单独选择每个标签。 另外,我正在用JavaScript运行这个正则表达式 任何建议都是非常受欢迎的:)解决眼前的问题是微不足道的。您需要创建通配符 i、 e.您希望将*

我正在尝试将每个标记从我接收的HTML源中分离出来

这是一个巨大的代码块,我正在接收,我试图使它更“可读性”,为人类分析。 到目前为止,我只编写了以下正则表达式代码:

RegEx(<\w*>.*<\/\w*>)
RegEx(.*)
但这就是
的要领!DOCTYPE
标记并运行,直到

我试图做的是独立于类型,单独选择每个标签。
另外,我正在用JavaScript运行这个正则表达式


任何建议都是非常受欢迎的:)

解决眼前的问题是微不足道的。您需要创建通配符

i、 e.您希望将
*
(尽可能匹配上一个内容)更改为
*?
(尽可能少地匹配上一个内容,但仍允许您匹配下一个内容)

…但如果属性值、脚本元素或样式元素等内部存在
,则代码将中断


解析HTML并非易事。改用现有的库。

解决眼前的问题并不重要。您需要创建通配符

i、 e.您希望将
*
(尽可能匹配上一个内容)更改为
*?
(尽可能少地匹配上一个内容,但仍允许您匹配下一个内容)

…但如果属性值、脚本元素或样式元素等内部存在
,则代码将中断


解析HTML并非易事。改用现有的库。

这一次,我改变了思维方式,尝试用不同的方法解决问题,并找到了一个不错的库,正如您所建议的那样。Jsoup,看起来不错。尽管使用
*?
的技巧。非常感谢:这一次我改变了我的思维方式,尝试用不同的方法解决这个问题,正如你所建议的,我找到了一个很好的库。Jsoup,看起来不错。尽管使用
*?
的技巧。非常感谢:D