C# 使用RegExp匹配或查找html/xml元素
使用RegExp匹配或查找html/xml元素 Regexp查找html/xml元素 在这里,我想查找具有id或不具有id属性的html或xml元素 示例html文件: 红骨髓是I-131放射性碘治疗分化型甲状腺癌的关键器官,其辐射吸收剂量不能直接测量。由于放射性碘在血液和大多数器官中的浓度相当,而且据信在红骨髓中的浓度相似,血液吸收剂量似乎是造血系统辐射吸收剂量的良好一阶近似值,是量化治疗照射量的更好方法,而不是总剂量 在上面的示例中,该示例是没有enter标记的单行,并且包含两个“ 上面的RegExp将对所有问题进行数学处理,并被认为在红骨髓中类似 但我想分别匹配如下 一, 二, 我希望你能理解我的要求 注:C# 使用RegExp匹配或查找html/xml元素,c#,jquery,html,xml,regex,C#,Jquery,Html,Xml,Regex,使用RegExp匹配或查找html/xml元素 Regexp查找html/xml元素 在这里,我想查找具有id或不具有id属性的html或xml元素 示例html文件: 红骨髓是I-131放射性碘治疗分化型甲状腺癌的关键器官,其辐射吸收剂量不能直接测量。由于放射性碘在血液和大多数器官中的浓度相当,而且据信在红骨髓中的浓度相似,血液吸收剂量似乎是造血系统辐射吸收剂量的良好一阶近似值,是量化治疗照射量的更好方法,而不是总剂量 在上面的示例中,该示例是没有enter标记的单行,并且包含两个“ 上面的R
该元素还可能包含子元素,如,,尝试将正则表达式替换为:
<a href="#([^"]*?)" id="([^"]*?)">(.*?)</a>
*符号后的问号将告诉正则表达式引擎查找尽可能少的实例
您可能会发现此页面提供了关于以下主题的信息:与所有使用正则表达式解析XML或HTML的尝试一样,这是错误的。我可以在它里面看到至少三个错误,而不需要真正尝试:它要求属性按特定顺序排列,要求属性之间的空格完全正确,并且要求属性值用双引号括起来,而不是单引号。我的答案是对OP的正则表达式模式进行简单的修改,使其适用于他的用例。当然,要使其通用化需要更多的工作: