|
Ze względu na nowatorski sposób przetwarzania obrazu, standard
kompresji MPEG4 będzie odgrywał bardzo istotną rolę w rozwoju technik
multimedialnych. Przewiduje się, że w niedalekiej przyszłości stanie
się on kluczowym elementem w systemach trzeciej generacji i dzięki
swoim ogromnym możliwościom interakcji zmieni zupełnie obecne oblicze
Internetu i telewizji.
Standard MPEG4 reprezentuje zupełnie nową jakość w rozumieniu
kodowania strumienia multimedialnego. Opracowany został w 1998
roku na mocy międzynarodowej normy IS0-14496. Nowy standard kompresji
i transmisji danych multimedialnych definiuje bardzo efektywne
metody reprezentacji tych danych, bazujące na zbiorach w postaci
tzw. obiektów audiowizualnych AVO (ang. AudioVisual Object). To
nowatorskie podejście, określane jako Object-Based Code, definiuje
scenę audiowizualną jako zakodowaną reprezentację obiektów AVO,
związanych ze sobą relacjami i koordynatami przestrzenno-czasowymi.
Naturalną konsekwencją podejścia obiektowego jest używanie terminologii
stosowanej w metodologiach zorientowanych obiektowo. Szczególnie
istotnymi jej elementami są pojęcia: wspomnianego już obiektu,
metody, interfejsu i klasy. Definicja klasy określa struktury danych
i metody ich przetwarzania. Obiekty audiowizualne mają charakter
hierarchiczny i mogą być konstruowane jako złożenie z innych obiektów.
Obiektem może być samochód poruszający się po drodze, niebieskie
tło na planie czy padający deszcz. Efekty dźwiękowe mają również
swoją obiektową reprezentację, np. dźwięki wydawane przez klarnet
stanowią element grupy obiektów, jakim jest orkiestra. Ich wspólne
relacje przestrzenno-czasowe tworzą spójny obraz multimedialny.
Takie rozumienie scen audiowizualnych poprzez podział na elementarne
obiekty niesie ze sobą ogromne możliwości interakcji, o których
nie mogło być mowy w poprzednich standardach (MPEG1, MPEG2), operujących
na blokach pikseli. Elementy sceny, stanowiące obiekty, mogą być
z tej sceny wyodrębnione i dowolnie modyfikowane.
Wyobraźmy sobie stronę WWW z treścią multimedialną zakodowaną
w standardzie MPEG4. Witryna przedstawia film ze spotkania towarzyskiego.
Ludzie rozmawiają ze sobą, niektórzy poruszają się po scenie w
rytm muzyki. Zgodnie z zastosowaną technologią obiektową każdej
osobie przyporządkowany jest obiekt opisujący jej kształt, dynamikę
ruchu i inne atrybuty. Dzięki takiemu rozwiązaniu kliknięcie na
daną, będącą w ruchu, osobę może wyzwolić akcję w postaci wyświetlenia
informacji na jej temat lub połączenia się z jej stroną domową.
Taki pomysł byłby bardzo trudny do zrealizowania przy klasycznym, "ramkowym" podejściu
do przekazu multimedialnego, gdzie reprezentowane jako zbiór pikseli
osoby, stanowiące elementy sceny jako całości, nie mogą być wyodrębnione
w prosty sposób.
Kolejnym zastosowaniem mogłaby być multimedialna baza obiektów
(wizyjnych i fonicznych, naturalnych i komputerowo syntetyzowanych),
która umożliwiałaby dowolne komponowanie własnych sekwencji scen
audiowizualnych.
W architekturze komunikacyjnej standardu MPEG4 rys. 9.1 grupa
obiektów audiowizualnych jest przesyłana do dekodera MPEG4. Przed
rozpoczęciem transmisji danych koder i dekoder wymieniają informacje
kontrolne, określające klasy algorytmów oraz narzędzi niezbędnych
w procesie dekodowania obiektów AVO. Następnie w koderze uruchamiane
są procesy zabezpieczania przed błędami, multipleksacja i wysłanie
danych. W multiplekserze wszystkie strumienie elementarne łączone
są w jeden strumień danych (w standardzie przewiduje się do 1024
strumieni elementarnych). W dekoderze dokonuje się operacja odwrotna:
dane są demultipleksowane, dekodowane, a następnie składane i prezentowane
użytkownikowi.
W standardzie MPEG4 zaimplementowane zostały zaawansowane mechanizmy
korekcji i ochrony przed błędami. Istotne jest to, że obiekty AVO
kodowane są niezależnie od swojego otoczenia czy tła, co oznacza,
że nie są traktowane jako jeden strumień bitowy, jak w standardach
poprzednich. Ten fakt powoduje, że obiekty niosące ważne informacje
mogą być kodowane w sposób bardziej odporny na błędy. O tym, którym
partiom bitów przypisana zostanie większa waga, decyduje użytkownik
(lub koder). Możliwe jest wówczas manipulowanie (interakcja) strumieniem
bitowym. Jeśli użytkownik stwierdzi, że tło sceny jest mało istotne,
wówczas zostanie zakodowane z mniejszą rozdzielczością przestrzenną
bądź w ogóle pominięte.

Rys. 9.1. Architektura komunikacyjna standardu MPEG4 i kodowanie
oraz
dekodowanie obiektów AVO [16]
Struktura sygnału cyfrowego w standardzie MPEG4 jest bardzo złożona.
Autorzy standardu uznali, że nie zawsze pełna implementacja standardu
jest konieczna i celowa. Dlatego też wprowadzono podział całej
struktury na podzbiory, zwane profilami, które reprezentują cechy
i narzędzia standardu w zależności od zastosowań.
Klasy profili w standardzie MPEG4
Scene Profiles - profile systemowe, które obejmują:
- simple profiles - jako zespół narzędzi do kodowania i przetwarzania
przekazu telewizyjnego
- audio profiles - narzędzia do przetwarzania wyłącznie obiektów
audio
- 2D profiles - wykorzystywany do operacji na prostej grafice dwuwymiarowej
- VMRL profiles - narzędzia standardu MPEG4, zgodne z VMRL - językiem
modelowania grafiki komputerowej
Media Profiles - narzędzia do przetwarzania i tworzenia obiektów
audiowizualnych:
- visual profiles - narzędzia do kodowania i przetwarzania obrazów
rzeczywistych
- syntetycznych i scen zawierających elementy sztuczne i rzeczywiste
- graphics profiles - przetwarzanie 2D i 3D
- audio profiles - przetwarzanie audio (algorytmy AAC, Twin VQ).
Object Descriptor Profiles - profile, w których są zawarte informacje
synchronizujące relacje czasowe między obiektami.
W ramach profili zdefiniowana została bardzo ważna cecha standardu,
jaką jest skalowanie (scalability). Oznacza to, że w zależności
od tego, jaka ma być żądana jakość obrazu i dźwięku lub na jaką
jakość zezwala kanał transmisyjny - kodowanie treści multimedialnych
(obiektów AVO) może zachodzić z różną dokładnością i mocą obliczeniową.
Stanowi to bardzo korzystny mechanizm, ponieważ zezwala na propagowanie
sekwencji audiowizualnych w sieciach oferujących różne przepustowości.
Ponadto warstwa systemowa standardu MPEG4 pozwala na współpracę
z różnymi sieciami komunikacyjnymi (DECT, GSM, PSTN, ISDN, ATM,
Internet itd.) i nośnikami informacji (dyski optyczne, magnetyczne,
karty elektroniczne itd.). Równocześnie strumień bitowy MPEG4 dostosowuje
się do możliwości i mocy obliczeniowej kodera oraz dekodera. Jeśli
przetworzenie danej sceny AV jest zbyt skomplikowanym zadaniem,
wówczas dekodowana i prezentowana jest tylko ta część strumienia
z treścią multimedialną, którą dekoder może "przetworzyć".
Rys. 9.2. MPEG4 zawdzięcza swoją elastyczność i uniwersalność profilom
struktury
sygnału, które pozwalają dostosować transmisję do przepustowości
medium i mocy obliczeniowej kodeków [16]
Ta uniwersalność, wynikająca z niezależności od platformy sprzętowej
oraz transmisyjnej (możliwość pracy w środowiskach o zmiennej przepustowości
sieci komunikacyjnej), pozwala implementować wiele różnych aplikacji,
wykorzystujących kompresję MPEG4.
Oto tylko niektóre z możliwych zastosowań:
- AoD - Audio on Demand w Internecie. Strumień MPEG4 audio, o prędkości
16 kb/s, daje dobrą jakość na poziomie przepustowości, jaką oferuje
obecnie Internet. Pozwoli to na tworzenie prawdziwie wirtualnych
i dynamicznych witryn WWW z możliwością interakcji.
- Składowanie treści multimedialnych na czytnikach optycznych CD,
DVD (popularny DivX - jako format MPEG4).
- VoD - Video on Demand w telewizji cyfrowej, a w przyszłości także
w Internecie. MPEG4 w sposób naturalny zapewnia QoS (Quality of
Service), czyli odtwarzanie z różną jakością dzięki mechanizmom
skalowania i profilowania.
Wideo telefonia mobilna i stacjonarna
Standard MPEG4 oferuje transmisję audio-wideo (różnej jakości)
z bardzo dużą i efektywną kompresją w sieciach o małych przepustowościach
oraz ma rozbudowane mechanizmy korekcji i ochrony przed błędami.
Powoduje to, że jest on niezwykle korzystny w zastosowaniach
radiokomunikacyjnych, które z definicji są narażone na błędy
transmisji i mają ograniczoną przepustowość. Standard MPEG4 umożliwia
minimalną transmisję wideo na poziomie około 10 kb/s z nie najlepszą,
co prawda, ale zadowalającą jakością. Odpowiada to szybkości
transmisji mowy w systemie GSM! Niedługo wideotelefony oparte
na istniejącej obecnie infrastrukturze radiokomunikacyjnej (DECT,
GSM, CDMA) staną się normą.
Powszechnie się uważa, że standard MPEG4, odpowiedzialny za transmisję
audio-wideo, znajdzie zastosowanie w systemach trzeciej generacji
UMTS (Universal Mobile Telecommunications System), w których przekaz
treści multimedialnych stanowi jedno z podstawowych zadań. Prace
nad wdrażaniem tego typu usług zostały już rozpoczęte. Jedną z
pierwszych firm jest Ericsson, który we własnych ośrodkach badawczych
pod Sztokholmem udostępnił zainteresowanym pokazy wideo konferencyjne,
prowadzone z terminala mobilnego, poruszającego się po ulicach
miasta. Transmisja odbywa się na podstawie wielodostępu kodowego
WB-CDMA (WideBand Code Division Multiply Access) z prędkością około
300 kb/s właśnie z wykorzystaniem kompresji MPEG4.
|