Python OpenCV 2.4编写半完整的PNG视频帧
我刚刚从Ubuntu 12.04的源代码安装了OpenCV 2.4。我试图使用Python脚本将视频的第一帧写入PNG图像,但我得到了一些奇怪的结果。代码如下:Python OpenCV 2.4编写半完整的PNG视频帧,python,video,opencv,video-processing,Python,Video,Opencv,Video Processing,我刚刚从Ubuntu 12.04的源代码安装了OpenCV 2.4。我试图使用Python脚本将视频的第一帧写入PNG图像,但我得到了一些奇怪的结果。代码如下: import numpy as np import cv import cv2 import sys video = cv.CaptureFromFile(sys.argv[1]) frame = cv.QueryFrame(video) proxy = cv.CreateImage(cv.GetSize(frame), 8, 1)
import numpy as np
import cv
import cv2
import sys
video = cv.CaptureFromFile(sys.argv[1])
frame = cv.QueryFrame(video)
proxy = cv.CreateImage(cv.GetSize(frame), 8, 1)
cv.CvtColor(frame, proxy, cv.CV_BGR2GRAY)
a = np.asarray(cv.GetMat(proxy))
cv2.imwrite('image.png', a)
问题是,图像显示如下:
这些是AVI文件,在其他方面似乎没有问题。有什么想法吗
编辑#1:抱歉,以下是ffmpeg版本信息:
ffmpeg version 0.10.2-4:0.10.2-0ubuntu0jon1
built on Mar 18 2012 09:59:38 with gcc 4.6.3
configuration: --extra-version='4:0.10.2-0ubuntu0jon1' --arch=amd64 --prefix=/usr --libdir=/usr/lib/x86_64-linux-gnu --disable-stripping --enable-vdpau --enable-bzlib --enable-libgsm --enable-libschroedinger --enable-libspeex --enable-libtheora --enable-libvorbis --enable-pthreads --enable-zlib --enable-libvpx --enable-runtime-cpudetect --enable-libfreetype --enable-vaapi --enable-frei0r --enable-gpl --enable-postproc --enable-x11grab --enable-librtmp --enable-libvo-aacenc --enable-version3 --enable-libvo-amrwbenc --enable-version3 --enable-libdc1394 --shlibdir=/usr/lib/x86_64-linux-gnu --enable-shared --disable-static
libavutil 51. 35.100 / 51. 35.100
libavcodec 53. 61.100 / 53. 61.100
libavformat 53. 32.100 / 53. 32.100
libavdevice 53. 4.100 / 53. 4.100
libavfilter 2. 61.100 / 2. 61.100
libswscale 2. 1.100 / 2. 1.100
libswresample 0. 6.100 / 0. 6.100
libpostproc 52. 0.100 / 52. 0.100
编辑#2:在我自己的故障排除中,我将ffmpeg从默认的12.04 ubuntu版本升级到了上面编辑#1中的版本。这似乎改变了一些事情:在这个问题中生成帧的视频现在似乎工作正常,但较大的视频仍然存在损坏的下半部分(或下三分之一或四分之一)。甚至更大的视频实际上完全是错误的。我真的不知道该怎么做,除了——再一次——错误或丢失的编解码器。它在QueryFrame
步骤中正确地识别故障
编辑#3:我更改了代码以独占使用cv2接口(根据下面一条评论中的链接)。现在,video.retrieve()
编辑#4:在使用新的cv2接口读取视频帧之前,我在视频上运行了以下命令:
ffmpeg -sameq -i normal.avi p_normal.avi
命令的输出看起来正常,除了ffmpeg初始化后的这一行及其输入说明:
编解码器“mpeg4”的像素格式“pal8”不兼容,自动选择
格式“yuv420p”
以下是命令的完整输出:
Input #0, avi, from 'normal.avi':
Duration: 00:01:37.60, start: 0.000000, bitrate: 1312 kb/s
Stream #0:0: Video: rawvideo, pal8, 128x256, 5 tbr, 5 tbn, 5 tbc
Incompatible pixel format 'pal8' for codec 'mpeg4', auto-selecting format 'yuv420p'
[buffer @ 0x11a0f80] w:128 h:256 pixfmt:pal8 tb:1/1000000 sar:0/1 sws_param:
[buffersink @ 0x11a1380] auto-inserting filter 'auto-inserted scale 0' between the filter 'src' and the filter 'out'
[scale @ 0x1197da0] w:128 h:256 fmt:pal8 -> w:128 h:256 fmt:yuv420p flags:0x4
Output #0, avi, to 'p_normal.avi':
Metadata:
ISFT : Lavf53.32.100
Stream #0:0: Video: mpeg4 (FMP4 / 0x34504D46), yuv420p, 128x256, q=2-31, 200 kb/s, 5 tbn, 5 tbc
Stream mapping:
Stream #0:0 -> #0:0 (rawvideo -> mpeg4)
Press [q] to stop, [?] for help
frame= 488 fps= 0 q=0.0 Lsize= 1497kB time=00:01:37.60 bitrate= 125.6kbits/s
video:1480kB audio:0kB global headers:0kB muxing overhead 1.165352%
最重要的是,用于读取帧的Python OpenCV代码(使用cv2接口)仍然返回False(与之前的行为相同)
编辑#5:到目前为止,我已经按照说明从源代码安装ffmpeg及其依赖项,并且进展顺利。如果没有从源代码重新安装OpenCV,我仍然会遇到与以前相同的问题,video.retrieve()
返回False。在尝试从源代码重新编译OpenCV 2.4时,我在编译过程中遇到以下错误:
Linking CXX shared library ../../lib/libopencv_highgui.so
/usr/bin/ld: /usr/local/lib/libavcodec.a(avpacket.o): relocation R_X86_64_32S against `av_destruct_packet' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libavcodec.a: could not read symbols: Bad value
如果我使用--enable pic
标志重新编译x264、libvpx和ffmpeg,OpenCV编译仍然失败,这次分别使用(kdbwin.o
,.rodata
)而不是上面代码段中的(avpacket.o
,av_destruction_packet
)
编辑#6:通过在libvpx和ffmpeg的配置选项中添加--enable shared
,修复了上述错误。OpenCV重新编译并成功构建,ffmpeg工作正常。遗憾的是,在运行上一个命令(ffmpeg-sameq-i normal.avi p_normal.avi
)之后,我的脚本仍然无法检索任何帧;返回的国旗仍然是假的。还有其他想法吗
编辑7:这是我正在使用的最新脚本
import numpy as np
import cv2
import sys
video = cv2.VideoCapture(sys.argv[1])
flag, frame = video.retrieve()
if not flag:
print 'Error'
quit()
proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imwrite('image.png', proxy)
编辑:明白了!下面是代码应该是什么:
import numpy as np
import cv2
import sys
video = cv2.VideoCapture(sys.argv[1])
if video.grab():
flag, frame = video.retrieve()
if not flag:
print 'Error'
quit()
proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imwrite('image.png', proxy)
最可能的问题是ffmpeg和使用的视频编解码器。你能分享其中一个视频吗?然后我们可以检查编解码器,看看有什么问题。我们也不知道你的系统上有什么ffmpeg版本
请注意,为什么要混合使用cv和cv2接口?只要使用cv2接口,代码就会看起来更好
编辑:我忘了提到,我测试了代码,所以问题肯定不在代码中
编辑2:问题可能是ffmpeg无法处理您的视频。如果不测试有问题的视频,很难说。您可以尝试一下cv2接口,这是您应该用来从视频文件中获取帧的
编辑3:我看了一下视频,似乎OpenCV使用ffmpeg的方式对您的视频有问题。一个快速解决方法是在OpenCV打开视频之前使用ffmpeg处理视频ffmpeg-sameq-i normal.avi p_norma.avi
为您提供一个视频,p_norma.avi
,您可以通过OpenCV毫无问题地处理该视频。对于normal.avi
:
Selected video codec: [rawbgr8flip] vfm: raw (RAW BGR8)
Selected video codec: [ffodivx] vfm: ffmpeg (FFmpeg MPEG-4)
对于生成的视频p_norma.avi
:
Selected video codec: [rawbgr8flip] vfm: raw (RAW BGR8)
Selected video codec: [ffodivx] vfm: ffmpeg (FFmpeg MPEG-4)
因此,生成的视频大约小10倍。这对您来说是一个可能的解决方案吗?我很想知道如何使它完全基于cv2,因为cv2接口似乎没有像QueryFrame
,CaptureFromFile
,或者我在代码段中使用普通cv接口调用的所有其他方法。我是否只做cv2.cv.\u方法
?此外,我会尽快发布一个视频。在寻找一个视频发送给你,我有一个新的发展。请参阅主要问题中的编辑#2。我更新了答案,有一个工作示例显示如何使用cv2接口处理视频文件。很好,非常感谢链接。我在cv2接口上使用了您的代码,现在每次调用video.retrieve()
,标志
返回值总是False
,因此很可能是ffmpeg问题。这里有一个链接,指向在帖子中创建原始图像的视频::-)您忘记在video.retrieve()之前调用video.grab()
。这应该可以解决问题。请告诉我进展如何。