dvb
 
telewizja cyfrowa eon skystar
Jakość sygnału telewizyjnego po kompresji cyfrowej
 
 
 
 
 

 

Licznik odwiedzin

 

 

Jakość sygnału telewizyjnego po kompresji cyfrowej zawsze zależy od jakości materiału źródłowego. Programy zaszumione oraz materiały o wysokim stopniu złożoności (duża ilość informacji w obrazie połączona z dynamiką sceny) są trudne do kompresji, ponieważ duża entropia obrazu telewizyjnego (mała powtarzalność elementów pomiędzy sąsiednimi obrazami) uniemożliwia efektywną kompresję bez niezauważalnych przez odbiorcę zniekształceń. W takich przypadkach przed zastosowaniem kompresji często stosuje się reduktory szumów, natomiast w samym koderze zmniejsza rozdzielczość obrazu telewizyjnego oraz rezygnuje się ze stosowania obrazów typu B.
Często źródłem pogorszenia jakości sygnału może być przechodzenie między różnymi standardami cyfrowymi, a niekoniecznie sama kompresja. Najlepszy przykład to poddanie sygnału cyfrowego 4:1:1 (np. DVCAM) kompresji MPEG-2 MP@ML (4:2:0). Rezultatem zdekodowania jest uzyskanie sygnału o znacznie pogorszonej jakości, odpowiadającej sygnałowi 4:1:0.

 

Zniekształcenia w koderze

Jakość sygnału telewizyjnego po kompresji cyfrowej uzależniona jest także od treści wizyjnej (informacyjnej) materiału źródłowego. Koder ze względu na implementację przez producenta specyficznych algorytmów optymalizacyjnych może być źródłem następujących zniekształceń obrazu telewizyjnego:

  • pulsowanie bloków
    Każdy kodowany obraz jest segmentowany na bloki 8x8 pikseli. Dla wszystkich bloków obrazu ustalane są indywidualne parametry kodowania (współczynniki kwantyzacji). Koder próbuje zbalansować liczbę bitów przeznaczonych do kodowania obrazów I (potrzebują dużo bitów) oraz obrazów prognozowanych P i B. Dlatego często koder podejmuje szereg niewłaściwych decyzji w trakcie ustalania parametrów kodowania. Zakłócenia typu pulsowanie bloków są szczególnie zauważalne na rozległych płaszczyznach o dużej liczbie szczegółów, np. twarz i włosy na zbliżeniu, dywan, tafla jeziora. Są one uciążliwe dla widza, gdyż szczegóły w obrazie niekiedy są widoczne, a niekiedy ich nie ma.
  • blokowa struktura obrazu
    Zniekształcenie powstające w wyniku nadmiernej eliminacji wysokich częstotliwości po transformacji DCT podczas kwantyzacji bloków obrazu. Bloki są szczególnie widoczne w przypadku strumienia cyfrowego o ustalonej małej przepływności bitowej, który nie zawiera obrazów prognozowanych P i B w grupie obrazowej GOP. Obrazy prognozowane pozwalają na efektywniejszą kompresję obrazu, dzięki czemu więcej bitów można przeznaczyć do kodowania obrazów I, co w efekcie poprawia jakość obrazu telewizyjnego.
  • artefakty cyfrowe typu "fruwające komary"
    Zniekształcenia obrazu typu fruwające komary objawiają się w postaci przypadkowych kropek i kresek w pobliżu krawędzi obiektów. Komary statyczne pojawiają się często wokół napisów i telewizyjnego logo. Są one mniej dokuczliwe dla odbiorcy niż komary ruchome. Fruwające komary są widoczne na grafice i animacjach komputerowych oraz na filmach rysunkowych, gdzie kreska jest bardzo wyraźna. Powstają w wyniku obarczenia składowej stałej transformacji DCT błędami kwantowania oraz odrzucenia składowych o wysokich częstotliwościach w kwantyzerze. Przykładem artefaktów "fruwające komary" może być obraz przedstawiający fragment jabłka poddany kompresji cyfrowej. Wokół krawędzi jabłka i jego ogonka widoczne są artefakty typu fruwające komary, a na obrazie - blokowa struktura.

 

Kodery cyfrowe MPEG nie radzą sobie z kodowaniem niektórych sekwencji telewizyjnych. Do tych krytycznych sekwencji zalicza się obrazy o skomplikowanej kompozycji, które zawierają kilka warstw przemieszczających się w różnych kierunkach z różnymi prędkościami, np. relacja sportowa z wyścigów konnych. Również sceny, w których występują takie elementy jak dym, ogień, trawa lub woda, są trudne do kompresji ze względu na swój specyficzny charakter.

 

Kiedy powstają zniekształcenia

Zniekształcenia obrazu telewizyjnego mogą być szczególnie widoczne, gdy wystąpi:

  • zmiana ujęcia lub sceny.
    Obrazy prognozowane P są określane na podstawie informacji zawartych w obrazie bieżącym oraz uprzednio zakodowanym obrazie typu I lub P (typ obrazu zależy od jego pozycji w grupie obrazowej GOP). W jaki sposób kodowany jest obraz typu P - rys. 1. Niestety, strukturę grupy GOP jednorazowo ustala operator systemu nadawczego. Jeśli wystąpi zmiana ujęcia lub sceny w sekwencji telewizyjnej, to obraz bieżący musi zostać zakodowany zgodnie z obowiązującą sekwencją obrazów I, B i P, nawet jeśli wiąże się to z pogorszeniem jakości obrazu. Obraz typu P stanowi różnicę między dwoma obrazami, dlatego zazwyczaj zawiera mniej informacji niż poprzedzający go obraz I lub P, który jest dla niego odniesieniem.
    Wyjątkiem jest sytuacja, gdy obrazy użyte do kalkulacji obrazu P są diametralnie różne. W celu zachowania stałej wyjściowej przepływności bitów w omawianym przypadku koder decyduje się na kodowanie bloków obrazu Obr: jako Intra (wykorzystanie do kompresji informacji tylko z bieżącego obrazu, bez prognozowania) oraz na stosowanie dużych współczynników kwantyzacji (odrzucenie części informacji o wysokich częstotliwościach po transformacji DCT). Znaczny spadek jakości obrazu nie jest widoczny dla oka ludzkiego ze względu na jego znaczną bezwładność, ale przegląd zdekompresowanego materiału obraz po obrazie ujawnia wręcz katastrofalne zniekształcenia.

 

Rys.1. Kodowanie obrazu Obr2 jako P2

 

  • zejście do czerni
    Na krawędziach obiektów ujawniają się bloki i "komary", bardzo wyraźnie dostrzegalne zniekształcenia nawet dla mało wymagającego odbiorcy. Zejście do czerni jest najczęściej stosowane jako element separujący bloki reklamowe. Dlatego nadawca szczególnie dba o to, aby ze względu na duże zainteresowanie sponsorów programów i reklamodawców reklamy były zawsze emitowane z najlepszą możliwą jakością telewizyjną. Skutecznym rozwiązaniem jest udostępnienie do pracy kodera większego strumienia bitów, gdyż wówczas może on przesłać więcej informacji o obrazie. Po transformacji DCT traci się mniej danych o wysokich częstotliwościach, dlatego minimalizowane są błędy kwantowania i ograniczane zniekształcenia obrazu dekodowane-go w odbiorniku.
  • ruch w obrazie TV
    Często detektor ruchu w koderze nie może dopasować obrazów prognozowanych do treści sąsiedniego obrazu telewizyjnego, w efekcie bloki obrazów prognozowanych są kodowane jako Intra z dużymi współczynnikami kompresji.
    Dobrym przykładem jest ruch kamery do obiektu lub w kierunku przeciwnym, tzw. najazd i odjazd kamery. Wówczas ulega zmianie wielkość elementów obrazu, co sprawia znaczne trudności obliczeniowe dla kodera, próbującego ustalić optymalne wektory ruchu makrobloków obrazowych (segmenty obrazu 16x16 pikseli, zawierające cztery sąsiednie bloki 8x8 pikseli).
    Podobny problem pojawia się w wyniku ruchu kamery w kierunku poziomym lub pionowym, tzw. panorama pozioma i pionowa. Wówczas część elementów obrazu przesuwa się poza kadr kamery, co uniemożliwia znalezienie podobieństwa między określonymi segmentami sąsiednich obrazów.
    Również duża dynamika w obrazie telewizyjnym, objawiająca się np. w wyniku szybkiego ruchu lub obrotu kamery tzw. szwenku, albo gwałtowne odkrycie lub ukrycie pewnych elementów obrazu są źródłami silnych zniekształceń, powstających w koderze cyfrowym.

 

Strumienie cyfrowe o różnych przepływnościach

Czynnikiem decydującym o stopniu kompresji jest ustalona wyjściowa przepływność strumienia danych z kodera. Sygnał cyfrowy MPEG-2 MP@ML (4:2:0) z powodzeniem jest stosowany do emisji telewizyjnych:

  • 15 Mbit/s - widoczne zniekształcenia tylko dla krytycznych sekwencji wizyjnych, wykorzystywanych do celów testowych np. test Diva with Noise i.in.
  • 7-8 Mbit/s - zadowalające, nawet dla przekazów zawodów sportowych;
  • 4 Mbit/s - w pełni wystarczająca przepływność dla kompresji filmów, wywiadów telewizyjnych itp.

 

Pomiary kodera

Pomiaru parametrów kompresji kodera dokonuje się za pomocą specjalnego analizatora wizyjnego MPEG, który obrazuje procesy w nim zachodzące:

  • tryb przewidywania i kompensacji ruchu w obrazie - brak/pole/obraz
    Wybór trybu pracy zależy od treści wizyjnej obrazu. Tryb "pole" jest stosowany do materiału źródłowego międzyliniowego (produkcja telewizyjna) i obiektów obrazu szybko poruszających się. Wówczas wektory ruchu dla makrobloków między sąsiednimi polami obrazu wyznaczane są w sposób bardziej efektywny niż przy porównywaniu pełnych obrazów. Natomiast trybu "obraz" używa się do materiałów pochodzenia filmowego, gdzie sąsiednie pola obrazu są identyczne. W przypadku obrazów statycznych i wolnozmiennych większość bloków w obrazach prognozowanych B i P jest pomijana, wysyłany jest tylko komunikat do odbiornika, że bloki do odtworzenia bieżącego obrazu należy powtórzyć z poprzedniego obrazu typu I lub P (tzw. tryb skip błock).
  • kierunek prognozowania obrazów - brak/do przodu/do tyłu/do przodu i do tyłu
    Bloki obrazów prognozowanych P i B mogą być kodowane jaku Intra (wykorzystanie do kompresji tylko informacji z bieżącego obrazu, bez prognozowania) w przypadku, gdy zostanie wykryty brak związku treści bieżącego obrazu z sąsiednim lub sąsiednimi obrazami typu I lub P. Z podobnych względów stosuje się czasem jednokierunkowe prognozowanie tylko do przodu lub tylko do tyłu - dla bloków w obrazie typu B.
    Niektórzy producenci sprzętu w celu obniżenia kosztów kodera, stosują tanie układy scalone do detekcji ruchu. Ze względu na mniejszą złożoność układową ruch w obrazie jest wykrywany w małym obszarze, co wpływa na spadek efektywności kodowania, a tym samym na jakość przekazu. Jeśli bowiem związek z obrazem sąsiednim nie zostanie wykryty, to bloki obrazów prognozowanych muszą być kodowane jako Intra z dużymi współczynnikami kompresji.
  • tryb transformacji DCT - pole/obraz
    Wybór trybu pracy zależy od treści wizyjnej obrazu, podobnie jak tryb przewidywania i kompensacji ruchu. W przypadku występowania w obrazie obiektów szybko poruszających się, sąsiednie pola obrazu różnią się wyraźnie co do przenoszonej treści, dlatego transformata DCT liczona dla bloków pola obrazu wymaga przesiania mniejszej liczby danych. Dla obrazów z małym ruchem lub pochodzenia filmowego stosuje się prognozowanie w trybie "obraz".
  • struktura grupy obrazowej GOP
    Typ kodowanych obrazów w grupie obrazowej GOP ma decydujący wpływ na wartość współczynnika kompresji sygnału telewizyjnego. Jeśli obraz typu I lub P jest obarczony zniekształceniami i jednocześnie jest wykorzystywany jako obraz odniesienia dla następnych kodowanych obrazów B i P, wówczas zniekształcenia są powielane w obrazach prognozowanych do momentu pojawienia się kolejnego obrazu typu I, co ma miejsce dopiero w następnej grupie obrazowej GOP.
    W przypadku braku obecności obrazów prognozowanych (typu P i B) w grupie GOP. ze względu na stosunkowo niewielki współczynnik kompresji samych obrazów typu I, następuje pogorszenie jakości kodowanego sygnału telewizyjnego.

 

Usterki obrazu telewizyjnego

Przez lata funkcjonowania telewizji analogowej widz został przyzwyczajony do szumów w obrazie, odbić, mało nasyconych kolorów i braku kontrastu. Natomiast degradacja przekazu telewizyjnego objawiająca się blokową strukturą obrazu, skokowym przebiegiem ruchu w obrazie (efekt strobowania), zamrożeniem treści wizyjnej czy nawet nagłym zerwaniem transmisji to zjawiska nowe i szczególnie uciążliwe dla odbiorcy. Przyczyn pojawienia się struktury blokowej obrazu może być wiele. Gdy bloki są widoczne na całym obszarze ekranu, świadczyć to może o awarii magnetowidu cyfrowego, który jest źródłem programu telewizyjnego. Natomiast pojawianie się bloków w zależności od treści obrazowej świadczy o złej pracy kodera cyfrowego. Najczęstszym źródłem przytoczonych usterek może być także odbiornik cyfrowy IRD (Integrated Receiver Decoder). Starsze oraz tańsze odbiorniki powszechnego użytku wyposażane są w pamięć RAM o pojemności tylko 16 Mb. co może prowadzić do zakłóceń poprawnego odbioru. Pamięć odbiornika cyfrowego do poprawnej pracy powinna zmagazynować co najmniej dwa i pół obrazu telewizyjnego:

  • jeden zdekompresowany obraz typu I,
  • jeden zdekompresowany obraz typu P,
  • jedno pole obrazu typu B.

 

W przypadku przekazu sygnału telewizyjnego o rozdzielczości 704 piksele x 576 linii pamięć 16 Mb nie jest w stanie pomieścić wszystkich zdekodowanych obrazów i w efekcie wszystkie obrazy typu B są opuszczane przez odbiornik w procesie rekonstrukcji obrazu telewizyjnego. Objawia się to strobowaniem. szczególnie uciążliwym w scenach o dużej dynamice ruchu. Najlepszym rozwiązaniem jest wówczas rozszerzenie pamięci swojego odbiornika do 32 Mb (standardowo) lub zmiana parametrów kodowania sygnału przez nadawcę. Można zmniejszyć strumień danych przez narzucenie agresywniejszej kompresji lub ograniczyć rozdzielczość obrazu telewizyjnego. Większa kompresja wpływa na wyraźne pogorszenie jakości przekazu i dlatego w zasadzie nie stosuje się tego rozwiązania. Spadek rozdzielczości do np. 544 x 576 nie jest widoczny w scenach akcji, które charakteryzują się dużą dynamiką ruchu. Natomiast w scenach statycznych może spowodować rozmycie obrazu (mniejszy kontrast), co jednak jest mało dostrzegalne, jeśli widz korzysta z analogowego wyjścia PAL swojego odbiornika cyfrowego.

 

 

O stronie:

Stronka poświęcona szeroko pojętej tematyce telewizyjnej. Zawarte informacje pomogą w zrozumieniu wielu zagadnień związanych z satelitarna telewizja cyfrowa DVB, zarówno teoretycznie, jak i praktycznie.

 

Ciekawe linki:

dvb-board-pl-com

satkurier.pl

happysat.org

dvbpl.com

dvbzone.prv.pl