Python OpenCV 2.4 zapisuje w połowie kompletne klatki wideo PNG

Question

May 05, 2012, 12:06 AM

Python OpenCV 2.4 zapisuje w połowie kompletne klatki wideo PNG

Właśnie zainstalowałem OpenCV 2.4 ze źródła w Ubuntu 12.04. Próbuję użyć skryptu Pythona do napisania pierwszej klatki filmu do obrazu PNG, ale otrzymuję dziwne wyniki. Oto kod:

import numpy as np
import cv
import cv2
import sys

video = cv.CaptureFromFile(sys.argv[1])
frame = cv.QueryFrame(video)
proxy = cv.CreateImage(cv.GetSize(frame), 8, 1)
cv.CvtColor(frame, proxy, cv.CV_BGR2GRAY)
a = np.asarray(cv.GetMat(proxy))
cv2.imwrite('image.png', a)

Problem polega na tym, że obraz wygląda tak:

Są to pliki AVI i inaczej wydają się być w porządku. Jakieś pomysły?

Edytuj # 1: Przepraszam, oto informacja o wersji ffmpeg:

ffmpeg version 0.10.2-4:0.10.2-0ubuntu0jon1
built on Mar 18 2012 09:59:38 with gcc 4.6.3
configuration: --extra-version='4:0.10.2-0ubuntu0jon1' --arch=amd64 --prefix=/usr --libdir=/usr/lib/x86_64-linux-gnu --disable-stripping --enable-vdpau --enable-bzlib --enable-libgsm --enable-libschroedinger --enable-libspeex --enable-libtheora --enable-libvorbis --enable-pthreads --enable-zlib --enable-libvpx --enable-runtime-cpudetect --enable-libfreetype --enable-vaapi --enable-frei0r --enable-gpl --enable-postproc --enable-x11grab --enable-librtmp --enable-libvo-aacenc --enable-version3 --enable-libvo-amrwbenc --enable-version3 --enable-libdc1394 --shlibdir=/usr/lib/x86_64-linux-gnu --enable-shared --disable-static
libavutil      51. 35.100 / 51. 35.100
libavcodec     53. 61.100 / 53. 61.100
libavformat    53. 32.100 / 53. 32.100
libavdevice    53.  4.100 / 53.  4.100
libavfilter     2. 61.100 /  2. 61.100
libswscale      2.  1.100 /  2.  1.100
libswresample   0.  6.100 /  0.  6.100
libpostproc    52.  0.100 / 52.  0.100

Edytuj # 2: W swoim własnym rozwiązywaniu problemów zaktualizowałem ffmpeg z domyślnej wersji 12.04 ubuntu do wersji, którą widzisz w Edit # 1 powyżej. Wydaje się, że zmieniło się to trochę: wideo, które wygenerowało ramkę w tym pytaniu, teraz wydaje się działać dobrze, ale większe filmy są nadal obecne z uszkodzonymi dolnymi połówkami (lub trzecimi trzecimi lub czwartymi). Nawet większe filmy w rzeczywistości całkowicie się segregują. Nie jestem pewien, co z tym zrobić, z wyjątkiem - jeszcze raz - wadliwych lub brakujących kodeków. To segfaults bezpośrednio naQueryFrame krok.

Edytuj # 3: Zmieniłem kod, aby używać wyłącznie interfejsu cv2 (zgodnie z linkiem w jednym z poniższych komentarzy). Teraz,video.retrieve() zawsze wracaFalse i żaden obraz nie jest napisany.

Edytuj # 4: Uruchomiłem następujące polecenie na filmie przed użyciem nowego interfejsu cv2 do odczytu klatek wideo:

ffmpeg -sameq -i normal.avi p_normal.avi

Wyjście polecenia wyglądało ok, z wyjątkiem tej jednej linii po inicjalizacji ffmpeg i jej opisu wejścia:

Niezgodny format pikseli „pal8” dla kodeka „mpeg4”, automatyczny wybór formatu „yuv420p”

Oto pełny wynik polecenia:

Input #0, avi, from 'normal.avi':
  Duration: 00:01:37.60, start: 0.000000, bitrate: 1312 kb/s
    Stream #0:0: Video: rawvideo, pal8, 128x256, 5 tbr, 5 tbn, 5 tbc
Incompatible pixel format 'pal8' for codec 'mpeg4', auto-selecting format 'yuv420p'
[buffer @ 0x11a0f80] w:128 h:256 pixfmt:pal8 tb:1/1000000 sar:0/1 sws_param:
[buffersink @ 0x11a1380] auto-inserting filter 'auto-inserted scale 0' between the filter 'src' and the filter 'out'
[scale @ 0x1197da0] w:128 h:256 fmt:pal8 -> w:128 h:256 fmt:yuv420p flags:0x4
Output #0, avi, to 'p_normal.avi':
  Metadata:
    ISFT            : Lavf53.32.100
    Stream #0:0: Video: mpeg4 (FMP4 / 0x34504D46), yuv420p, 128x256, q=2-31, 200 kb/s, 5 tbn, 5 tbc
Stream mapping:
  Stream #0:0 -> #0:0 (rawvideo -> mpeg4)
Press [q] to stop, [?] for help
frame=  488 fps=  0 q=0.0 Lsize=    1497kB time=00:01:37.60 bitrate= 125.6kbits/s    
video:1480kB audio:0kB global headers:0kB muxing overhead 1.165352%

Co najważniejsze, kod Python OpenCV do odczytu ramki (przy użyciu interfejsu cv2) nadal zwraca False (to samo zachowanie co poprzednio).

Edytuj # 5: Do tej pory przestrzegałem instrukcjiznaleźć tutaj za zainstalowanie ffmpeg i jego zależności ze źródła, i to poszło gładko. Bez ponownej instalacji OpenCV ze źródła wciąż napotykam ten sam problem, co wcześniejvideo.retrieve() zwraca False. Próbując ponownie skompilować OpenCV 2.4 ze źródła, podczas kompilacji pojawia się następujący błąd:

Linking CXX shared library ../../lib/libopencv_highgui.so
/usr/bin/ld: /usr/local/lib/libavcodec.a(avpacket.o): relocation R_X86_64_32S against `av_destruct_packet' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libavcodec.a: could not read symbols: Bad value

Jeśli przekompiluję x264, libvpx i ffmpeg za pomocą--enable-pic flaga, kompilacja OpenCV nadal nie działa, tym razem z (kdbwin.o, .rodata) zamiast (avpacket.o, av_destruct_packet) odpowiednio we fragmencie powyżej.

Edytuj # 6: Naprawiono powyższy błąd, dodając--enable-shared do opcji konfiguracji libvpx i ffmpeg. OpenCV skompilował się i zbudował pomyślnie, a ffmpeg działał dobrze. Niestety po uruchomieniu poprzedniego polecenia (ffmpeg -sameq -i normal.avi p_normal.avi), mój skryptnadal nie mógł odzyskać żadnych ramek; wracająca flaga nadal była fałszywa. Jakieś dalsze pomysły?

Edytuj # 7: Oto najnowszy skrypt, którego używam.

import numpy as np
import cv2
import sys

video = cv2.VideoCapture(sys.argv[1])
flag, frame = video.retrieve()
if not flag:
  print 'Error'
  quit()
proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imwrite('image.png', proxy)

Edytuj # 8: Rozumiem! Oto, jaki powinien być kod:

import numpy as np
import cv2
import sys

video = cv2.VideoCapture(sys.argv[1])
if video.grab():
  flag, frame = video.retrieve()
  if not flag:
    print 'Error'
    quit()
  proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
  cv2.imwrite('image.png', proxy)