Javascript 带有正则表达式的trasform是html文本中的字符串
如何正确转换如下所示的字符串:Javascript 带有正则表达式的trasform是html文本中的字符串,javascript,html,regex,string,tags,Javascript,Html,Regex,String,Tags,如何正确转换如下所示的字符串: html attr = "value" attr2 = 'UnmatchInSubstrings' some \escapedTag content subtag subcontent /subtag br / /html 在: 对于我的尝试,我使用的是regex101.com 提前感谢您,如果不太容易理解,请道歉:)要做您想做的事情,您需要编写自己的映射程序。因此,简而言之,您将拥有一个关键字列表,例如html,表,您需要通过这些关键字来匹配字符串 理想情况
html attr = "value" attr2 = 'UnmatchInSubstrings' some \escapedTag content subtag subcontent /subtag br / /html
在:
对于我的尝试,我使用的是regex101.com
提前感谢您,如果不太容易理解,请道歉:)要做您想做的事情,您需要编写自己的映射程序。因此,简而言之,您将拥有一个
关键字
列表,例如html
,表
,您需要通过这些关键字来匹配字符串
理想情况下,当您找到打开/关闭标记时,您还可以在其上推送/弹出关键字。解析器还需要足够智能,以排除转义序列以及引号内的字符串,这样您就不会得到
“我知道”
。你绝对确定这是必须要做的吗?如果格式化,您是否可以控制要解析的字符串的方式?对于那些说“他正在解析的不是HTML”的人来说:相同的区别。他试图解析表示HTML的东西。同样的复杂性(甚至更糟,因为没有
),您如何知道某些
不是属性?或者br
不是内容的一部分,而是标签?我想,你需要人工智能。如果他正在解析的HTML无效,你打算如何使用HTML解析器?Manueldiior:你有权访问输入字符串的构建方式吗@瓦西里西拉基斯:这不是我要说的。我认为逐字符解析是唯一的解决方案。。这正是我想要避免的(大量代码行)。。。谢谢anyway@ManuelDiIorio字体我想一个字一个字应该就够了。将br/
替换为br/
并按空间分割也可以降低复杂性。哇,好主意!非常感谢。
<html attr = "value" attr2 = 'UnmatchInSubstrings'> some escapedTag content <subtag>subcontent</subtag> <br /> </html>
/([^\\]\S+[\s[\"|\']+\s\S[\"|\']+]*)+/g