Come nasce un “MP3”? E perchè?

28 08 2007

Per capire cos’è un “MP3” è necessario fare una piccola premessa sul principio psicoacustico su cui si basa la sua creazione (encode). Il nostro orecchio, purtroppo, non è una macchina perfetta, in particolare può essere ingannato e raggirata la percezione del suono che ci trasmette. Come mai accade questo fenomeno? Immaginiamo di ascoltare uno sweep (una sequenza di toni puri, a mò di scala musicale, dalla frequenza più bassa udibile a quella più alta), potremmo tracciare un grafico (noto come la “U della udibilità umana”, data la sua forma) nel quale riusciremmo a vedere “a che volume ci sono apparse” tutte queste note. Successivamente scopriremmo che alcune frequenze le percepiamo più alte di sensibilità ed altre più basse, ovvero non uniformemente.

La situazione cambia notevolmente aggiungendo un secondo tono, di frequenza costante e di sensibilità relativamente elevata (il tono mascherante). Ripetiamo lo sweep e torniamo a valutare la “sensazione di volume” che abbiamo avuto questa volta riguardo la precedente scala mascherata. Il risultato è molto particolare:

In un range intorno alla frequenza mascherante il tono mascherato (quello di cui ci interessa l’analisi) viene gradatamente attenuato; mentre al di fuori di questa porzione di spettro (linea tratteggiata) la risposta è la stessa della prima prova. E’ come se il nostro orecchio non sentisse più un intero insieme di note poichè coperte da un’altra, magari lontana qualche KHz ma sufficientemente elevata in sensibilità (dB).
Questo è il principio naturale con il quale nascono gli algoritmi di compressione dei file musicali. Questi non fanno altro che sfruttare l’effetto mascheramento di suoni più “forti” rispetto ad altri più “deboli”, eliminano quelle componenti spettrali che essendo troppo vicine a suoni forti, risulteranno non udibili.

L’algoritmo
Tutto nasce da un filtraggio su 32 bande del segnale musicale da comprimere. Poi viene assegnato ad ogni suono una sorta di giudizio, con il quale si determina la scala gerarchica tra ciò che maschera le bande adiacenti e ciò che viene mascherato. Le bande mascheranti riceveranno una codifica nel dominio digitale (assegnazione di un numero di bit): l’insieme dei bit di ogni banda che si “salva” dalla scrematura andrà infine a formare lo stream di bit in uscita.
In particolare, nell’MP3 (fin’ora abbiamo enunciato lo standard MP in genere) le bande vengono ulteriormente suddivise in 8 o 16 sottobande, alle quali verrà assegnata una codifica differente (intesa come diverso numero di bit) in relazione al contenuto (non sempre costante) dell’informazione elettronica in ogni singolo istante e a seconda della frequenza da riprodurre. Ad esempio, le frequenze più basse hanno un contenuto maggiore di informazione e verranno quindi rappresentate da un maggior numero di bit. Al contrario, le bande mascheranti più alte in frequenza, contenendo una minor informazione elettronica, verranno codificate con un minor numero di bit.

Advertisements

Azioni

Information

One response

6 11 2008
Michele

Bell’articolo, sapevo già il funzionamento dell’algoritmo dell’ mp3, però è stato un piacere rileggerlo, volevo precisare che passare un mp3 anche con qualità 320kbit/s 48.000hz 32bit, in un CD audio classico, non miglioreremo le sue qualità audio.
Se una canzone di 5 minuti in formato non compresso (wav) occupa circa 100MB ci sarà un motivo…

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...




%d blogger hanno fatto clic su Mi Piace per questo: