Kdenlive/Sistemi video

Copertina

Il video digitale possiede alcune proprietà e terminologie ereditate dai vecchi sistemi analogici usati nella diffusione televisiva e alcune altre proprietà derivate dalle nuove tecnologie. Dare informazioni dettagliate su queste caratteristiche e sistemi è un compito che va oltre lo scopo di questo manuale, ciononostante ecco alcune (brevi) spiegazioni che potrebbero aiutare il profano ad orientarsi nell'uso delle clip e nella generazione video con Kdenlive.

Quadri (frame) al secondo

L'occhio umano è una macchina meravigliosa ma è limitato e può essere facilmente ingannato. Quest'ultimo fatto è ciò che ha reso possibile l'invenzione del cinema ancora nel 1800 --- se una sequenza di foto leggermente diverse viene mostrata in rapida sequenza, l'occhio non può distinguere una scena dall'altra, e ha l'illusione di un movimento continuo. È lo stesso fatto che accade se si prende una penna tra le dita e la si muove velocemente in alto e in basso tenendo lasca la presa con le dita --- l'effetto ottico fa sembrare che la penna si stia piegando.

Nel linguaggio video, ogni fotogramma nella sequenza viene chiamato quadro o dall'inglese frame. È necessario mostrare i frame con una certa velocità per ottenere l'illusione del movimento. La misura di questa velocità è data dall'unità frame (o quadri) al secondo (fps). L'occhio umano non riesce a distinguere tra un quadro e l'altro se questi vengono mostrati con una velocità di 14fps, anche se un po' a scatti. Velocità di fps leggermente maggiori migliorano notevolmente l'illusione del movimento.

Quando fu inventata la televisione, uno dei problemi riscontrati fu che era necessario sincronizzare i quadri trasmessi con quelli ricevuti. La mancanza di circuiti elettronici precisi al tempo portò i costruttori ad avvalersi di un semplice oscillatore presente comunemente in ogni casa: la frequenza della corrente di alimentazione. In alcuni paesi questa è di 50Hz, mentre in altri è di 60Hz. Questo fatto porta a comprendere meglio le differenze tra i due sistemi standard PAL e NTSC.

Dimensioni dello schermo

Rapporto di visualizzazione

Il rapporto di visualizzazione (in inglese aspect ratio) è praticamente la proporzione tra la larghezza e l'altezza dello schermo.

I due rapporti più usati sono:

4:3 - questo è il formato standard per la televisione analogica, conosciuto anche come "pan format".
16:9 - questo formato è derivato dal cinema, e viene usato anche dai cosiddetti schermi televisivi wide cioè larghi.

Quando un film in formato 16:9 deve venir proiettato su uno schermo in 4:3, questo deve essere tagliato ai lati, rimuovendo colonne (perciò contenuto), oppure mostrando dei bordi neri in cima e in fondo allo schermo che permettono di proiettare l'intera immagine nello schermo più stretto, a discapito di un po' di risoluzione. Quest'ultimo metodo di visualizzazione è conosciuto anche come letterbox.

Video interlacciato

Ecco un'altra caratteristica che deriva dal mondo televisivo. Gli schermi televisivi (o CRT per Tubi a Raggi Catodici) usati fino agli anni 90 non erano sufficientemente veloci per poter disegnare l'intera immagine sullo schermo 50 o 60 volte al secondo.

La soluzione fu trovata nel dividere ogni quadro in due campi o semiquadri --- il primo formato dalle righe dispari della figura e il secondo formato da quelle pari. L'occhio umano non riesce a distinguere scene molto vicine e il materiale utilizzato per l'emissione di luce dallo schermo ha una piccola inerzia ottica mantenendo la luce per qualche frazione di secondo dopo che il raggio catodico è passato. Con tali velocità la combinazione dei due semiquadri è resa impercettibile.

Questo è l'interlacciamento. Seguendo la frequenza scelta dai due standard a 50 o 60 semiquadri al secondo si ottiene una frequenza di quadro effettiva di rispettivamente 25 o 30 quadri al secondo.

In seguito, cinescopi più veloci permisero la visualizzazione diretta dei quadri senza bisogno di interlacciamento e quindi il termine non interlacciato sottintende una qualità migliore specialmente durante i fermi immagine. Alle volte è quindi desiderabile poter convertire un video da formato interlacciato in non-interlacciato o viceversa.

Timecode

Quando si sta modificando un video, spesso si ha bisogno di un riferimento ad uno specifico istante in un video --- per esempio quando inizia una certa scena. La misura più precisa derivante dalle prime macchine di elaborazione video è il timecode, proveniente dalla tecnologia delle cassette video e rimasta nel video digitale.

Il timecode di una registrazione è un segnale inserito all'interno delle informazioni video di un nastro e conta il tempo trascorso dall'inizio della registrazione. Viene normalmente visualizzato nel formato hh:mm:ss:ff, dove hh è il numero di ore, mm significa minuti, ss sono i secondi, e ff è il numero di frame o quadri trascorsi in quel secondo.

NTSC

NTSC è un sistema di diffusione (broadcast) televisiva creato dal National Television Standards Comittee negli USA. Anche se uno standard analogico, NTSC viene usato anche come riferimento per i video digitali nel formato e dimensione video e nel numero di frame al secondo. Ha le seguenti caratteristiche:

352x240 dimensioni dello schermo in pixel (720x480 per i DVD)
30fps o più precisamente, 30000/1001fps o 29,97fps.

La strana frequenza di quadri al secondo nello standard NTSC rende necessario l'uso del comunemente detto drop frame, ovvero letteralmente, scarto di quadri, una tecnica usata dai software di elaborazione video come Kdenlive. Ogni 2 minuti, eccetto ogni decimo minuto, due quadri vengono semplicemente ignorati nel conteggio del tempo, in modo da rendere il flusso video come se scorresse a 30 frame al secondo. Senza questo trucco, l'audio alla velocità "30fps reali" scorrerebbe leggermente fuori sincronizzazione con il video in pochi minuti.

PAL

Il sistema PAL fu creato dal gigante tedesco dell'elettronica AEG-Telefunken, ed è stato adottato in molti altri paesi europei, sudamericani, asiatici ed africani. Il nome è l'acronimo di Phase-Alternate Line, un ingegnoso sistema per la correzione automatica dei colori in televisione --- per questo PAL viene anche definito come l'acronimo di "Pictures Always Loveable" (immagini sempre gradevoli), in scherzosa antitesi a NTSC, che, sempre nello scherzo, viene fatto derivare da "Never Twice the Same Color" (mai due volte lo stesso colore)...

Come per NTSC, nel campo del video digitale la sigla PAL è usata per indicare una specifica combinazione di dimensione video e frequenza di immagine:

dimensione video 352x288 pixels (720x576 per il DVD)
25 frames al secondo

Esiste però qualche variante PAL, specifica per paese, che non segue questi standard. Ad esempio il sistema PAL-M, adottato in Brasile ed in Laos, mantiene la brillantezza del colore e la modulazione del PAL, utilizzando però la dimensione video e la frequenza di immagine dell'NTSC

Crominanza e Luminanza: i colori nel video

Quando si iniziò a progettare la commercializzazione di televisori a colori, un grande numero di persone possedeva già un apparecchio in bianco e nero, e sarebbe stato impensabile costringerle a buttarlo. Inoltre l'ipotesi di trasmettere programmi televisivi a colori utilizzando tre distinti segnali per i tre colori fondamentali (rosso, verde e blu, in inglese Red, Green e Blue, da cui la sigla RGB) era irrealizzabile a causa dell'ampiezza di banda richiesta dalla trasmissione di tipo analogico. Sarebbe stato necessario trasmettere troppe informazioni per la capacita di un canale televisivo standard, dell'ampiezza di 6 MHz.

Gli ingegneri quindi, sfruttando ancora una volta una limitazione della vista umana, trovarono una brillante soluzione: inventarono, al posto del sistema additivo RGB, un sistema di definizione dei colori basato sulla sottrazione, chiamato YCC.

La maggior parte di informazione del segnale televisivo a colori analogico è formata dalla luminanza, che definisce soltanto il livello di luminosità di un punto spaziando tra il nero puro e il bianco puro. Questo è esattamente quanto serve per realizzare una trasmissione in bianco e nero, perciò i vecchi apparecchi hanno potuto continuare ad essere utilizzati semplicemente ignorando la parte di informazione relativa al colore. Alla luminanza, ma utilizzando rispetto a questa una quantità molto inferiore di banda, sono stati aggiunti i segnali di crominanza per la definizione dei colori. Questi segnali sono elaborati dall'apparecchio ricevente, sfruttando un po'di semplice logica dei colori. Se miscelando tutti i colori alla massima luminosità si ottiene il bianco puro --- che corrisponde anche al massimo valore di luminanza ---, i valori corrispondenti ai vari colori possono essere ottenuti sottraendo il relativo valore della crominanza da quello della luminanza.

Per l'esattezza, il bianco è composto da circa il 30% di rosso, l'11% di blu e il 60% di verde. Quindi, per ottimizzare l'utilizzo di banda trasmissiva, la luminanza (Y) viene combinata con i due segnali di crominanza relativi al rosso (C_r) e al blu (C_b). Diventa semplice ottenere il valore della componente verde di un pixel, applicando la formula G = Y - C_r - C_b. Il valore delle componenti blu e rossa si ottengono con le formule B = Y + (C_b - Y), e R = Y + (C_r - Y).

Di conseguenza, un'immagine a televisiva a colori è definita per una parte dal segnale di luminanza e per il resto da quelli di crominanza (in una proporzione 4:2:2). Si può usare una minore ampiezza di banda per la crominanza perché il colore necessita di una minor quantità di informazioni, sfruttando il fatto che l'occhio umano è molto più sensibile alle variazioni di luminosità ed ai contorni di un'immagine che non alle variazioni di colore. È possibile verificare questo fenomeno osservando delle immagini composte solo da colori e prive di contorni neri o comunque scuri.

Nonostante questa soluzione sia stata ideata per le trasmissioni analogiche, e il video digitale consenta la trasmissione completa delle informazioni relative al colore utilizzando una ridotta ampiezza di banda, si continua ad utilizzare il sistema YCC, allo scopo di ottenere una compressione ancora maggiore. Lo standard video digitale DV25 utilizza una banda ancora minore per l'informazione relativa al colore, con un rapporto luminanza/crominanza 4:1:1 --- che può generare disturbi di visualizzazione in operazioni come quella di combinare un'immagine, con un'altra di una persona ripresa su uno sfondo blu (la famosa composizione cromakey). Lo standardDV50, orientato ad un utilizzo più professionale, utilizza un rapporto luminanza/crominanza 4:2:2.