Il segnale video è una sequenza di immagini (frames) che si succedono nel tempo ad una velocità detta frame rate. Un’immagine digitale, a sua volta, è definibile come una sequenza di elementi, detti pixel, disposti su righe e colonne a formare una matrice (o tabella), caratterizzati da una componente relativa alla luminosità (luminanza) e da due componenti relative al colore (crominanze).
Nell’ambito delle comunicazioni multimediali in rete i formati di frame video maggiormente utilizzati sono dei multipli o sottomultipli di un formato detto CIF (Common Intermediate Format). La tabella seguente illustra alcuni di tali formati in
termini di risoluzione della componente di luminanza dei pixel:
|
Formato |
Risoluzione (orizzontale x verticale) |
|
Sub-QCIF |
128 x 96 |
|
QCIF |
176 x 144 |
|
CIF |
352 x 288 |
|
4CIF |
704 x 576 |
Il segnale video presenta due tipi di ridondanza: ridondanza spaziale e ridondanza temporale. La ridondanza spaziale è riferita all’informazione presente all’interno di una stessa immagine, che può presentare caratteristiche di omogeneità tali da renderne inutile la codifica completa, per cui, generalmente tramite tecniche dette “trasformate”, si codifica solo l’informazione necessaria. La ridondanza temporale riguarda invece l’informazione tra frames differenti: esemplificando al massimo, due frames consecutivi tra i quali non c’è variazione (ad esempio non c’è movimento) nella scena, sono ridondanti, per cui non ha senso codificarli entrambi, è sufficiente codificarne solo uno. Le tecniche che sfruttano la ridondanza temporale fanno uso di algoritmi di stima e compensazione del movimento che operano una preliminare suddivisione di un frame in unità più piccole dette blocchi.
I principali schemi di codifica e compressione video, riguardo alla riduzione della ridondanza temporale, utilizzano tre tipi di frame:
- I-frame: Intra-coded frame, è codificato indipendentemente da tutti gli altri frames.
- P-frame: Predictively-coded frame, è codificato in base al frame codificato in precedenza.
- B-frame: Bi-directionally predicted frame, è codificato in base sia ai frames precedenti che a quelli successivi.
Una sequenza video nel caso generale sarà quindi una successione di frames del tipo I, P, B.
I principali standard non proprietari per la codifica e la compressione video sono stati sviluppati dagli organismi ITU (International Telecommunications Union) ed MPEG (Moving Picture Experts Group). Occorre precisare che tali standard non specificano come debba essere implementato il codificatore o il decodificatore, ma definiscono solamente la sintassi del bitstream ed il processo di decodifica. E’ pertanto possibile trovare codec che pur implementando lo stesso standard, presentano delle differenze, le quali possono poi riflettersi nelle prestazioni, dovute proprio alla libertà che lo standard lascia relativamente alla realizzazione effettiva del codificatore e del decodificatore.
La tabella seguente elenca tali standard con l’indicazione dell’ambito applicativo e del bit rate:
|
Standard |
Applicazioni |
Bit rate |
|
ITU H.261 |
Videoconferenza e videotelefonia su ISDN |
p x 64 kbps (p = numero intero) |
|
ITU H.263 |
Videoconferenza e videotelefonia su PSTN |
< 64 kbps |
|
ITU H.264/MPEG-4 Part 10 |
Broadcasting, videoconferenza, videotelefonia, streaming, storage, ecc. |
10 ÷ 100 kbps |
|
MPEG-1 |
Memorizzazione video su supporti digitali (CD-ROM) |
1.5 Mbps |
|
MPEG-2 |
Televisione digitale |
2 ÷ 60 Mbps |
|
MPEG-4 |
Codifica ad oggetti, contenuti sintetici, video streaming |
Variabile |
Per quanto riguarda la compressione, gli standard elencati nella tabella precedente si basano a grandi linee su una stessa “gerarchia di livelli sintattici”, così riassumibile:
- Una sequenza video è una successione di frames.
- Un frame è un’immagine codificata.
- Un frame consiste di un certo numero di macroblocchi.
- I macroblocchi sono organizzati in “slices”, ossia una slice è un insieme di macroblocchi di uno stesso frame.
- I macroblocchi sono costituiti da unità più piccole dette blocchi.
Si può rappresentare graficamente tale gerarchia di livelli in questo modo:
Riferimenti
Tesi di laurea in Ingegneria Elettronica di Antonio Mancosu, A.A. 2005/2006: “Controllo del ritardo di playout nelle comunicazioni audio-video su reti a pacchetti”.
Antonio Mancosu
Postato in: Comunicazioni Multimediali | Messo il tag: Antonio Mancosu, blocco, CIF, codifica, frame, H.264, ITU, macroblocco, MPEG, pixel, QCIF, ridondanza, slice, streaming, tesi di laurea, video, videoconferenza
