Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/287.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在html中使用正则表达式进行内部链接,用于预定义的文本集url_Python_Html_Regex_Pattern Matching_Anchor - Fatal编程技术网

Python 在html中使用正则表达式进行内部链接,用于预定义的文本集url

Python 在html中使用正则表达式进行内部链接,用于预定义的文本集url,python,html,regex,pattern-matching,anchor,Python,Html,Regex,Pattern Matching,Anchor,我有类似以下内容的html文本: <p>Walmart **big data** into the DNA of Walmart.</p> <h2><strong>Social **Big Data** Solutions</strong></h2> <h2>Social Big Data Solutions</h2> <a href="big data"><strong>S

我有类似以下内容的html文本:

<p>Walmart **big data** into the DNA of Walmart.</p>
<h2><strong>Social **Big Data** Solutions</strong></h2>
<h2>Social Big Data Solutions</h2> 
<a href="big data"><strong>Social Big Data Solutions</strong></a>
<a href="big data">Social Big Data Solutions</a>
<p>Test big data</p>
沃尔玛**大数据**融入沃尔玛的DNA

社交**大数据**解决方案 社交大数据解决方案 测试大数据

我需要为所有匹配“大数据”的文本添加内部链接,即,我需要在所有html标记中选择“大数据”,除了


我有一个正则表达式
(?!
,但将匹配
中的属性,因此内部链接成为我尝试过的

检查。但是,在实际项目中使用它之前,您应该三思而后行,使用正则表达式解析HTML是不安全的。IMHO,这听起来像是xpath而不是正则表达式的工作。我建议您发布一个类似的问题,而不是r一种使用xpath更新未包含在中的实体的方法。@WiktorStribiż查看您的解决方案是否工作正常。是的,我需要找到一个使用xpath而不是regex的解决方案。Thanks@ghwp.感谢您对xpath的建议。然后使用BeautifulSoup或任何其他HTML解析器并正确地完成这项工作。