Python REGEX-查找特定XML标记并在特定点之间删除

Python REGEX-查找特定XML标记并在特定点之间删除,python,regex,xml,Python,Regex,Xml,我的xml如下所示: 作者%5773637864827/Testing-75873874hdueu47.jpg 授权%5773637864827/Testing245-75873874hdu6543u47.ts 这个XML有100行,我对标记“”感兴趣。在这个标签中,我想删除所有内容,直到它看到/为止,当它看到-时,删除所有内容,直到它看到句号为止 最终结果应该是 Testing.jpg 测试245.ts 我是一个初学者,希望能在这方面得到一些帮助。我认为也许regex是最好的方法?考虑一

我的xml如下所示:


作者%5773637864827/Testing-75873874hdueu47.jpg
授权%5773637864827/Testing245-75873874hdu6543u47.ts
这个XML有100行,我对标记“
”感兴趣。在这个标签中,我想删除所有内容,直到它看到
/
为止,当它看到
-
时,删除所有内容,直到它看到句号为止

最终结果应该是

Testing.jpg
测试245.ts
我是一个初学者,希望能在这方面得到一些帮助。我认为也许regex是最好的方法?

考虑一下,这是一种专门用于转换XML文件的语言,使用它的
子字符串在
之前和
子字符串在
之后的函数。Python的第三方模块,可以运行XSLT1.0脚本。因为XSLT是可移植的,所以它可以在Python以外的其他语言中运行:

XSLT(另存为.xsl文件,一个特殊的.xml文件)

输出

<?xml version="1.0" encoding="UTF-8"?>
<example>
   <Test_example>Testing.jpg</Test_example>
   <Test_example>Testing245.ts</Test_example>
</example>

Testing.jpg
测试245.ts

需要指出的是,我只对XML中提到的标记的位置感兴趣。这是否回答了您的问题?python不够好,所以我没有添加它。需要保留.jpg和.ts。我只是想看看如何找到一个特定的标签,删除所有内容,直到它看到一个“/”并删除所有以“-”开头的内容,直到它看到一个句号。
import lxml.etree as et

xml = et.parse('Input.xml')
xsl = et.parse('Script.xsl')

transformer = et.XSLT(xsl)
new_xml = transformer(xml)

# PRINT TO CONSOLE
print(new_xml)

# SAVE TO FILE
with open('Output.xml', 'wb') as f:
   f.write(new_xml)
<?xml version="1.0" encoding="UTF-8"?>
<example>
   <Test_example>Testing.jpg</Test_example>
   <Test_example>Testing245.ts</Test_example>
</example>