Regex 使用正则表达式从视频中提取值

Regex 使用正则表达式从视频中提取值,regex,Regex,我在下面的代码中有一大块丑陋的代码。我的问题是如何使用正则表达式提取@videoPlayer param的值 谢谢 ----一大块难看的代码---- 对不起,伙计们,这是完整的代码。在这之前会有一些javascript,所以使用XML是毫无疑问的。我需要一个正则表达式,这样就行了 更新2:好了,伙计们,如果我能得到object标记中的文本,那么我可以将它转换成XML并解析出来。但是我如何在标签中输入代码呢?一点也不?为什么不使用适合此目的的工具,如XML解析器或BeautifulSoup之类

我在下面的代码中有一大块丑陋的代码。我的问题是如何使用正则表达式提取@videoPlayer param的值

谢谢

----一大块难看的代码----


对不起,伙计们,这是完整的代码。在这之前会有一些javascript,所以使用XML是毫无疑问的。我需要一个正则表达式,这样就行了


更新2:好了,伙计们,如果我能得到object标记中的文本,那么我可以将它转换成XML并解析出来。但是我如何在标签中输入代码呢?

一点也不?为什么不使用适合此目的的工具,如XML解析器或BeautifulSoup之类的标记汤解析器?

如果您知道参数标记的名称和值属性将始终按此顺序排列(名称优先),则此正则表达式应能工作(未经测试):

标记的值部分将存储在反向引用$1中

但是这里有很多假设需要考虑。

试试这个:

/<param name="@videoPlayer" value="([^\"\']+)"/

/如果您有格式良好的XML,那么请使用XPath,例如
//myobject[id=“myE…”]/param[name=“@videoPlayer”]@value
XML的格式不好,事实上前面会有一堆蹩脚的注释和javascript。只需剪切对象部分,您就有了一个XML。如果它是有效的HTML,您可以使用HTML解析器任何一个好的HTML解析器都应该能够很容易地处理这个问题。解决了这个问题w/out regex:1)去掉围绕bla-bla的javascript 2)加载到xml文档中。从这里开始,使用XML解析函数提取@videoPlayer的值。这与我的答案基本相同。
<param.+?name=['"]@videoPlayer['"].+?value=['"]([^'"]+)['"]
<param.+?name="@videoPlayer".+?value="([^"]+)"
/<param name="@videoPlayer" value="([^\"\']+)"/