使用Python脚本仅返回特定值_Python_Regex_Ffmpeg_Findall

使用Python脚本仅返回特定值

python regex ffmpeg

使用Python脚本仅返回特定值,python,regex,ffmpeg,findall,Python,Regex,Ffmpeg,Findall,我完全是Python初学者，正在尝试编写一个脚本，在文件中查找黑色视频和无声音频，并仅返回它们发生时的时间实例我有以下代码使用ffmpeg python包装器来获取标准输出中的值，但我无法找到一种有效的方法来解析标准输出或标准输出以仅返回黑色开始，黑色结束，黑色持续时间，静音开始的实例，静默结束，静默持续时间除了ffmpeg之外，对于那些不是专家的人，我如何使用re.findall或类似的方法来定义regex以仅返回上述值 import ffmpeg input = ffmpeg.inp

我完全是Python初学者，正在尝试编写一个脚本，在文件中查找黑色视频和无声音频，并仅返回它们发生时的时间实例

我有以下代码使用ffmpeg python包装器来获取标准输出中的值，但我无法找到一种有效的方法来解析标准输出或标准输出以仅返回黑色开始，黑色结束，黑色持续时间，静音开始的实例，静默结束，静默持续时间

除了ffmpeg之外，对于那些不是专家的人，我如何使用re.findall或类似的方法来定义regex以仅返回上述值

import ffmpeg 

input = ffmpeg.input(source)
video = input.video.filter('blackdetect', d=0, pix_th=0.00)
audio = input.audio.filter('silencedetect', d=0.1, n='-60dB')
out = ffmpeg.output(audio, video, 'out.null', format='null')
run = out.run_async(pipe_stdout=True, pipe_stderr=True)
result = run.communicate()

print(result)

这将导致ffmpeg输出，其中包含我需要的结果。以下是输出（为简洁起见进行了编辑）：

解析输出数据以仅查找/返回这些结果值的最有效方法是什么，这样我就可以在代码中从它们构建进一步的逻辑？在这种情况下，我只希望返回以下值：

静音\u开始：0
沉默结束：5.06285
静默时间：5.06285

黑启动：0
黑色端：5
黑色持续时间：5

静音启动：227.733
沉默结束：229.051
沉默时间：1.3184

黑色启动：229.28
黑底：230.24
黑色持续时间：0.96

静音启动：229.051
沉默结束：230.28
沉默时间：1.22856

我在正则表达式中尝试了许多不同的re.findall（）选项，但最接近的是只返回值的名称。例如，如果我将此添加到上面：

found = re.findall('\\b' + 'silence_end' + '\\b', str(result))

print(found)

我得到的只是名字：

[静默结束”，“静默结束”，“静默结束]

您可以使用两种备选方案组合所有可能性，然后将1+数字与可选点和1+数字进行匹配：

\b(?:silence|black)_(?:start|end|duration):\s*\d+(?:\.\d+)?\b

模式将匹配：

```
\b
```
单词边界
```
（？：静音|黑色）
```
将静音或黑色与下划线匹配
```
（？：开始|结束|持续时间）：\s*
```
匹配开始或结束或持续时间，
```
：
```
和0+空格字符
```
\d+（？：\。\d+）
```
匹配1+位数字和可选点数字部分
```
\b
```
单词边界

比如说

输出

非常感谢第四只鸟。这太棒了！不是为了贪心，但是关于我现在如何开始基于返回的数值构建一些逻辑，有什么提示/建议吗？作为一个起点，如果我想写一些类似“如果沉默时间>210，做xyz”的东西，你可以使用两个捕获组分别获取文本和数字<代码>\b（（？：沉默|黑色）（？：开始|结束|持续时间））：\s*（\d+（？：\。\d+））\b并将包含数字的第二组转换为数字类型。我理解第一部分，并且能够返回演示中显示的第四只鸟的组。不过，我不确定我是否理解你关于“将包含数字的第二组转换为数字类型”这句话的后半部分。我的目标是将数值作为变量捕获，然后将其输入到方程中。我会设法弄明白的。再次感谢！你好，第四只鸟。再次感谢你在这方面的帮助。我认为我的后续问题应该作为一个新的主题发布，所以我在这里发布了，以防您可以查看：。谢谢非常感谢@pygirl！这也适用于我，因此与第一个答案一样可以接受。

regex = re.compile(r'''
    [\S]+:                # a key (any word followed by a colon)
    (?:
    \s                    # then a space in between
        (?!\S+:)\S+\d+       # then a value (any word not followed by a colon)
    )                  # match multiple values if present
    ''', re.VERBOSE)

matches = regex.findall(str)
matches

['configuration: --prefix=/usr/local/Cellar/ffmpeg/4.2.2_3',
 'silence_end: 5.06285',
 'silence_duration: 5.06285',
 'silence_start: 227.733',
 'silence_end: 229.051',
 'silence_duration: 1.3184',
 'silence_start: 229.051',
 'silence_end: 230.28',
 'silence_duration: 1.22856']

\b(?:silence|black)_(?:start|end|duration):\s*\d+(?:\.\d+)?\b

import re
test_str = "your string"
regex = r"\b(?:silence|black)_(?:start|end|duration):\s*\d+(?:\.\d+)?\b"
print(re.findall(regex, test_str))

['silence_start: 0', 'black_start:0', 'black_end:5', 'black_duration:5', 'silence_end: 5.06285', 'silence_duration: 5.06285', 'silence_start: 227.733', 'silence_end: 229.051', 'silence_duration: 1.3184', 'silence_start: 229.051', 'black_start:229.28', 'black_end:230.24', 'black_duration:0.96', 'silence_end: 230.28', 'silence_duration: 1.22856']