Audio FFMPEG detect silent命令正确运行,但未给出静默持续时间

Audio FFMPEG detect silent命令正确运行,但未给出静默持续时间,audio,ffmpeg,Audio,Ffmpeg,我有一个.wav音频文件,需要在此文件中提取静默/暂停持续时间。我正在使用带有静音检测过滤器的ffmpeg,但我无法理解为什么它不为这个文件提供静音持续时间,而为其他文件提供结果。有谁能帮助我理解下面给出的答案,为什么它没有显示检测到的沉默 输入命令: 输出 调整噪声和/或d值。从文件中: 过滤器接受以下选项: 噪声,n-设置噪声容限。如果将dB附加到指定值或振幅比,则可以以dB为单位指定。违约 为-60dB,或0.001 持续时间,d-设置静默持续时间,直到通知默认值为2秒 沉默往往不是100

我有一个.wav音频文件,需要在此文件中提取静默/暂停持续时间。我正在使用带有静音检测过滤器的ffmpeg,但我无法理解为什么它不为这个文件提供静音持续时间,而为其他文件提供结果。有谁能帮助我理解下面给出的答案,为什么它没有显示检测到的沉默

输入命令:

输出

调整噪声和/或d值。从文件中:

过滤器接受以下选项:

噪声,n-设置噪声容限。如果将dB附加到指定值或振幅比,则可以以dB为单位指定。违约 为-60dB,或0.001

持续时间,d-设置静默持续时间,直到通知默认值为2秒

沉默往往不是100%的沉默。可能有背景噪音。在这种情况下,您需要调整噪波值,直到它检测到您想要的静音。例如,如果使用noise=-15dB,则任何等于或小于-15dB的声音都将被检测为静音

Audacity的这个屏幕截图显示了一个高亮显示的无声区域。与其他音频相比,它听起来很安静,但是如果你仔细听的话,你会听到风扇和其他背景噪音。Audacity中的VU表显示,它的最大音量实际上是-34 dB,因此您必须至少使用噪音=-34 dB


此外,您可能需要调整d,以告知静音段在被检测为静音之前需要的最小长度。

如果没有样本输入文件,我们可以给出的唯一建议是调整噪波和d值。更改持续时间对输出没有影响。但是是的,当我把噪音从-30db改为-0.01时,它给了我静音时间输出,这是什么意思?样本文件有很多噪音?谢谢。这有助于我理解噪声过滤器的用途。
ffmpeg -i "input.wav" -af silencedetect=noise=-30dB:d=0.5 -f null -
ffmpeg version 4.2.1 Copyright (c) 2000-2019 the FFmpeg developers
built with gcc 9.1.1 (GCC) 20190807
configuration: --enable-gpl --enable-version3 --enable-sdl2 --enable-fontconfig --enable-gnutls --    enable-iconv --enable-libass --enable-libdav1d --enable-libbluray --enable-libfreetype --enable-
libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable- 
libopus --enable-libshine --enable-libsnappy --enable-libsoxr --enable-libtheora --enable-
libtwolame --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx264 --enable-libx265 --
enable-libxml2 --enable-libzimg --enable-lzma --enable-zlib --enable-gmp --enable-libvidstab --
enable-libvorbis --enable-libvo-amrwbenc --enable-libmysofa --enable-libspeex --enable-libxvid -- 
 enable-libaom --enable-libmfx --enable-amf --enable-ffnvcodec --enable-cuvid --enable-d3d11va --    enable-nvenc --enable-nvdec --enable-dxva2 --enable-avisynth --enable-libopenmpt

libavutil      56. 31.100 / 56. 31.100
libavcodec     58. 54.100 / 58. 54.100
libavformat    58. 29.100 / 58. 29.100
libavdevice    58.  8.100 / 58.  8.100
libavfilter     7. 57.100 /  7. 57.100
libswscale      5.  5.100 /  5.  5.100
libswresample   3.  5.100 /  3.  5.100
libpostproc    55.  5.100 / 55.  5.100

Guessed Channel Layout for Input Stream #0.0 : stereo
Input #0, wav, from 'D:\Research\PhD\Carolina\AD\wav\media.io_Wakeman_Rhyne_001_01.wav':
Duration: 00:17:38.04, bitrate: 1411 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
Stream mapping:
Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
Output #0, null, to 'pipe:':