Python-通过字符解析清理href

Python-通过字符解析清理href,python,href,Python,Href,据我所知: 恶意用户可以在href标记内做一些调皮的事情,如果他做了以下事情: <a href "www.somesite.com" [event] = ‘code’> 其中,事件类似于鼠标悬停,代码是恶意的 我想允许使用普通href,但要删除.com之后的“和关闭href的之间的任何内容。 我正在考虑查找字符串href,计算两个引号,然后删除第二个引号和之间的所有内容 这行吗?如果行,我该如何编码?对于名为input的字符串,此表达式给出第二个双引号字符的位置: input.

据我所知: 恶意用户可以在href标记内做一些调皮的事情,如果他做了以下事情:

<a href "www.somesite.com" [event] = ‘code’>

其中,事件类似于鼠标悬停,代码是恶意的

我想允许使用普通href,但要删除
.com
之后的
和关闭href的
之间的任何内容。 我正在考虑查找字符串
href
,计算两个引号,然后删除第二个引号和
之间的所有内容


这行吗?如果行,我该如何编码?

对于名为
input
的字符串,此表达式给出第二个双引号字符的位置:

input.index('"', input.index('"')+1)
如果该值为
k
,则写入
input[:k+1]
以提取第二个双引号字符之前的所有内容

在Python解释器中尝试以下内容

input = 'href = "www.google.com" onmouseover=hax0rFunction()>'
k = input.index('"', input.index('"')+1)
input[:k+1]

您如何期望用户“在href标记内做淘气的事情”?您是否担心有人使用Greasemonkey或其他东西入侵您的服务器?您需要给出一个更具体的示例来说明您所说的内容。请注意,您也可以将其替换为