La codifica video

Il segnale video è una sequenza di immagini (frames) che si succedono nel tempo ad una velocità detta frame rate. Un’immagine digitale, a sua volta, è definibile come una sequenza di elementi, detti pixel, disposti su righe e colonne a formare una matrice (o tabella), caratterizzati da una componente relativa alla luminosità (luminanza) e da due componenti relative al colore (crominanze).

Nell’ambito delle comunicazioni multimediali in rete i formati di frame video maggiormente utilizzati sono dei multipli o sottomultipli di un formato detto CIF (Common Intermediate Format). La tabella seguente illustra alcuni di tali formati in
termini di risoluzione della componente di luminanza dei pixel:

Formato

Risoluzione

(orizzontale x verticale)

Sub-QCIF

128 x 96

QCIF

176 x 144

CIF

352 x 288

4CIF

704 x 576

Il segnale video presenta due tipi di ridondanza: ridondanza spaziale e ridondanza temporale. La ridondanza spaziale è riferita all’informazione presente all’interno di una stessa immagine, che può presentare caratteristiche di omogeneità tali da renderne inutile la codifica completa, per cui, generalmente tramite tecniche dette “trasformate”, si codifica solo l’informazione necessaria. La ridondanza temporale riguarda invece l’informazione tra frames differenti: esemplificando al massimo, due frames consecutivi tra i quali non c’è variazione (ad esempio non c’è movimento) nella scena, sono ridondanti, per cui non ha senso codificarli entrambi, è sufficiente codificarne solo uno. Le tecniche che sfruttano la ridondanza temporale fanno uso di algoritmi di stima e compensazione del movimento che operano una preliminare suddivisione di un frame in unità più piccole dette blocchi.
I principali schemi di codifica e compressione video, riguardo alla riduzione della ridondanza temporale, utilizzano tre tipi di frame:

  • I-frame: Intra-coded frame, è codificato indipendentemente da tutti gli altri frames.
  • P-frame: Predictively-coded frame, è codificato in base al frame codificato in precedenza.
  • B-frame: Bi-directionally predicted frame, è codificato in base sia ai frames precedenti che a quelli successivi.

Una sequenza video nel caso generale sarà quindi una successione di frames del tipo I, P, B.
I principali standard non proprietari per la codifica e la compressione video sono stati sviluppati dagli organismi ITU (International Telecommunications Union) ed MPEG (Moving Picture Experts Group). Occorre precisare che tali standard non specificano come debba essere implementato il codificatore o il decodificatore, ma definiscono solamente la sintassi del bitstream ed il processo di decodifica. E’ pertanto possibile trovare codec che pur implementando lo stesso standard, presentano delle differenze, le quali possono poi riflettersi nelle prestazioni, dovute proprio alla libertà che lo standard lascia relativamente alla realizzazione effettiva del codificatore e del decodificatore.
La tabella seguente elenca tali standard con l’indicazione dell’ambito applicativo e del bit rate:

Standard

Applicazioni

Bit rate

ITU H.261

Videoconferenza e videotelefonia su ISDN

p x 64 kbps

(p = numero intero)

ITU H.263

Videoconferenza e videotelefonia su PSTN

< 64 kbps

ITU H.264/MPEG-4 Part 10

Broadcasting, videoconferenza, videotelefonia, streaming, storage, ecc.

10 ÷ 100 kbps

MPEG-1

Memorizzazione video su supporti digitali (CD-ROM)

1.5 Mbps

MPEG-2

Televisione digitale

2 ÷ 60 Mbps

MPEG-4

Codifica ad oggetti, contenuti sintetici, video streaming

Variabile

Per quanto riguarda la compressione, gli standard elencati nella tabella precedente si basano a grandi linee su una stessa “gerarchia di livelli sintattici”, così riassumibile:

  • Una sequenza video è una successione di frames.
  • Un frame è un’immagine codificata.
  • Un frame consiste di un certo numero di macroblocchi.
  • I macroblocchi sono organizzati in “slices”, ossia una slice è un insieme di macroblocchi di uno stesso frame.
  • I macroblocchi sono costituiti da unità più piccole dette blocchi.

Si può rappresentare graficamente tale gerarchia di livelli in questo modo:

gerarchia video

Riferimenti

Tesi di laurea in Ingegneria Elettronica di Antonio Mancosu, A.A. 2005/2006: “Controllo del ritardo di playout nelle comunicazioni audio-video su reti a pacchetti”.

Antonio Mancosu

Lascia una Risposta