python中的视频和音频处理库

python中的视频和音频处理库,python,video,audio,Python,Video,Audio,Python中有哪些视频/音频库可用于识别视频录制中的特定音频模式? 我试图从视频文件中排除录制的开始部分(跳到特定的音频模式),因此我需要一种方法 从文件的开头扫描它 识别音频模式(特定音乐片段始终相同) 从该点开始录制/复制其余视频录制 视频详细信息 格式:-真实媒体(虽然不重要,因为我可以将其转换为其他内容) 长度:-从18到24分钟不等 在一个这样的视频上运行媒体信息工具可以提供以下详细信息 Video ID : 1 For

Python中有哪些视频/音频库可用于识别视频录制中的特定音频模式?
我试图从视频文件中排除录制的开始部分(跳到特定的音频模式),因此我需要一种方法

  • 从文件的开头扫描它
  • 识别音频模式(特定音乐片段始终相同)
  • 从该点开始录制/复制其余视频录制
视频详细信息

格式:-真实媒体(虽然不重要,因为我可以将其转换为其他内容)

长度:-从18到24分钟不等

在一个这样的视频上运行媒体信息工具可以提供以下详细信息

Video
ID                               : 1
Format                           : RealVideo 4
Codec ID                         : RV40
Codec ID/Info                    : Based on AVC (H.264), Real Player 9
Duration                         : 19mn 18s
Bit rate                         : 195 Kbps
Width                            : 332 pixels
Height                           : 248 pixels
Display aspect ratio             : 4:3
Frame rate                       : 23.976 fps
Bits/(Pixel*Frame)               : 0.099
Stream size                      : 27.0 MiB (84%)

Audio
ID                               : 0
Format                           : Cooker
Codec ID                         : cook
Codec ID/Info                    : Based on G.722.1, Real Player 6
Duration                         : 19mn 20s
Bit rate                         : 32.0 Kbps
Channel(s)                       : 2 channels
Sampling rate                    : 44.1 KHz
Bit depth                        : 16 bits
Stream size                      : 4.43 MiB (14%)

原始问题:

所以前几天我重温了一部动画连续剧《龙珠z》,我被我的视频激怒了。每一集大约有24分钟,每一集都有上一集的完整重述和总长度约为6-8分钟的结束音乐

我注意到,当重述结束时,每个视频都有相同的音频,并且视频的新名称出现。我将此音频记录在一个单独的文件中

我想问一下,在python中,是否有任何方法可以通过编码完成以下任务:=

  • 扫描音频以匹配标题名称的录制音频,以了解实际视频开始的确切时间

  • 将视频另存为从该点开始

  • 我不知道这样做有多困难,所以如果可能的话,请告诉我

    如果你能告诉任何一家图书馆,它确实为我提供了这样做的工具,并给我一些关于我应该如何继续的建议,我将不胜感激

    非常感谢AFAIK,语音识别(也公开了较低级别的功能,如对两个声音之间的相似性评分)仅在Python或中支持

    一旦找到标记,您可以使用外部库,如或根据需要剪切视频


    编辑:谷歌搜索还返回了一个包装,包装上有一个库。

    请原谅我对这个问题的编辑。我想帮忙,因为这个问题引发了一场“非真实问题”投票。它可能被认为过于模糊和宽泛。我试图把这个问题改写成一个更有价值的问题。它仍然很广泛,但可能有用/有趣。简而言之,对于试图按指示处理视频的人来说,什么是有用的指针(库名称、算法、gotchas…)。user506710,您能否通过指示视频格式、“标记音乐”的长度和特征来进一步改进此问题等等?没问题:)我想如果有人能更清楚地理解它会有帮助:)尽管我对它被称为“广泛”的原因感到困惑。。。匹配音频以获得开始时间真的太宽了吗?在我有时间之后,我可以从那一点开始剪辑视频…@mjv我没有提到格式的原因是因为我不想限制这个问题。。。我只是想,如果说有一个.avi库,我可以通过批处理将其转换为.avi。。。我不明白你说的记号笔是什么意思。。。