Python 在html中使用正则表达式进行内部链接,用于预定义的文本集url
我有类似以下内容的html文本:Python 在html中使用正则表达式进行内部链接,用于预定义的文本集url,python,html,regex,pattern-matching,anchor,Python,Html,Regex,Pattern Matching,Anchor,我有类似以下内容的html文本: <p>Walmart **big data** into the DNA of Walmart.</p> <h2><strong>Social **Big Data** Solutions</strong></h2> <h2>Social Big Data Solutions</h2> <a href="big data"><strong>S
<p>Walmart **big data** into the DNA of Walmart.</p>
<h2><strong>Social **Big Data** Solutions</strong></h2>
<h2>Social Big Data Solutions</h2>
<a href="big data"><strong>Social Big Data Solutions</strong></a>
<a href="big data">Social Big Data Solutions</a>
<p>Test big data</p>
沃尔玛**大数据**融入沃尔玛的DNA
社交**大数据**解决方案
社交大数据解决方案
测试大数据
我需要为所有匹配“大数据”的文本添加内部链接,即,我需要在所有html标记中选择“大数据”,除了
我有一个正则表达式
(?!
,但将匹配
中的属性,因此内部链接成为我尝试过的。检查。但是,在实际项目中使用它之前,您应该三思而后行,使用正则表达式解析HTML是不安全的。IMHO,这听起来像是xpath而不是正则表达式的工作。我建议您发布一个类似的问题,而不是r一种使用xpath更新未包含在中的实体的方法。@WiktorStribiż查看您的解决方案是否工作正常。是的,我需要找到一个使用xpath而不是regex的解决方案。Thanks@ghwp.感谢您对xpath的建议。然后使用BeautifulSoup或任何其他HTML解析器并正确地完成这项工作。