
Per capire cos’è un “MP3″ è necessario fare una piccola premessa sul principio psicoacustico su cui si basa la sua creazione (encode). Il nostro orecchio, purtroppo, non è una macchina perfetta, in particolare può essere ingannato e raggirata la percezione del suono che ci trasmette. Come mai accade questo fenomeno? Immaginiamo di ascoltare uno sweep (una sequenza di toni puri, a mò di scala musicale, dalla frequenza più bassa udibile a quella più alta), potremmo tracciare un grafico (noto come la “U della udibilità umana”, data la sua forma) nel quale riusciremmo a vedere “a che volume ci sono apparse” tutte queste note. Successivamente scopriremmo che alcune frequenze le percepiamo più alte di sensibilità ed altre più basse, ovvero non uniformemente.
La situazione cambia notevolmente aggiungendo un secondo tono, di frequenza costante e di sensibilità relativamente elevata (il tono mascherante). Ripetiamo lo sweep e torniamo a valutare la “sensazione di volume” che abbiamo avuto questa volta riguardo la precedente scala mascherata. Il risultato è molto particolare:

In un range intorno alla frequenza mascherante il tono mascherato (quello di cui ci interessa l’analisi) viene gradatamente attenuato; mentre al di fuori di questa porzione di spettro (linea tratteggiata) la risposta è la stessa della prima prova. E’ come se il nostro orecchio non sentisse più un intero insieme di note poichè coperte da un’altra, magari lontana qualche KHz ma sufficientemente elevata in sensibilità (dB).
Questo è il principio naturale con il quale nascono gli algoritmi di compressione dei file musicali. Questi non fanno altro che sfruttare l’effetto mascheramento di suoni più “forti” rispetto ad altri più “deboli”, eliminano quelle componenti spettrali che essendo troppo vicine a suoni forti, risulteranno non udibili.
L’algoritmo
Tutto nasce da un filtraggio su 32 bande del segnale musicale da comprimere. Poi viene assegnato ad ogni suono una sorta di giudizio, con il quale si determina la scala gerarchica tra ciò che maschera le bande adiacenti e ciò che viene mascherato. Le bande mascheranti riceveranno una codifica nel dominio digitale (assegnazione di un numero di bit): l’insieme dei bit di ogni banda che si “salva” dalla scrematura andrà infine a formare lo stream di bit in uscita.
In particolare, nell’MP3 (fin’ora abbiamo enunciato lo standard MP in genere) le bande vengono ulteriormente suddivise in 8 o 16 sottobande, alle quali verrà assegnata una codifica differente (intesa come diverso numero di bit) in relazione al contenuto (non sempre costante) dell’informazione elettronica in ogni singolo istante e a seconda della frequenza da riprodurre. Ad esempio, le frequenze più basse hanno un contenuto maggiore di informazione e verranno quindi rappresentate da un maggior numero di bit. Al contrario, le bande mascheranti più alte in frequenza, contenendo una minor informazione elettronica, verranno codificate con un minor numero di bit.












Scuola di Musica e Canto
Musica Live Brescia
E' passato poco fa