Les formats audio - Radio Fiat+/-Lux

Différents facteurs affectent la qualité d'un flux audio (stream):

Voici, à titre de référence, un tableau des flux diffusés publiquement sur Radio Fiat+/-Lux:

Format	Débit	Fréquence	Canaux	Usage
MP3	128 kbps	44 100 Hz	2 (joint-stereo)	Grand public
MP3	32 kbps	44 100 Hz	1 (mono)	Bas débit (nombre limité de slots)
Ogg Vorbis	112 kbps (débit moyen) (VBR, qualité 3)	44 100 Hz	2 (stéréo)	Pour les fervents du libre! (nombre limité de slots)
HE-AAC/V2 (AAC+)	32 kbps	44 100 Hz	2 (stéréo)	Mobile et bas débit (nombre limité de slots)

Formats

Voici un tableau des principaux formats audio utilisés pour le streaming.

Format	Avantages	Désavantages	Conclusion
MP3	MP3 est le format le plus répandu. Il est supporté par la plupart des logiciels. Il peut être lu par un lecteur Flash (donc facilement encastrable dans une page web).	Le MP3 est un format propriétaire. Utiliser un encodeur nécessite une licence (du moins, théoriquement).	Le choix populiste
Ogg Vorbis (.ogg)	Format libre. Offre une qualité nettement supérieure au format MP3 pour un débit (bitrate) donné.	Le support du format est moins répandu que le MP3. L'encodage et le décodage nécessite beaucoup plus de ressources processeur. Ce format est prohibé pour les vieux PCs.	Le choix engagé
AAC+	C'est actuellement (jusqu'à nouvel ordre) le format qui offre la meilleure qualité pour un débit (bitrate) donné. De plus, le décodage est moins intensif sur le processeur que pour le format Ogg Vorbis.	Format propriétaire. N'est pas encore supporté par beaucoup de logiciels.	Le choix efficace

Pour Radio Fiat+/-Lux, notre choix s'est naturellement porté vers le format le plus portable, soit le MP3. Par contre, nous n'hésitons par à recourir au format Ogg Vorbis pour relayer un flux privé d'un studio à l'autre avant de le retransmettre publiquement, lorsque les conditions le permettent, afin de préserver au maximum la qualité audio originale. D'ailleurs, un flux Ogg Vorbis de la station devrait être disponible publiquement sous peu (nous somme le 4 novembre 2009) en quantités limitées pour nos auditeurs engagés!

Débit

La donnée la plus déterminante quant à la qualité d'un flux audio est le débit (bitrate). Le débit détermine de quantité d'information (en bits) pour décrire une seconde de signal. Plus le débit est élevé, plus le signal transmis peut être décrit avec précision.

Le débit d'un flux doit être déterminé en fonction:

De la qualité désirée
La vitesse de transfert des auditeurs
Des limites de débit total du relais (débit du flux × nombre d'auditeurs)
Des limites de bande passante du relais (transfert maximal de données au cours d'une période donnée, généralement un mois)

Bas débit

En général, vos auditeurs n'auront pas de contrainte quand à la vitesse de transfert. Par contre, si vous avez des auditeurs qui utilisent un accès à Internet commuté (par modem via une ligne téléphonique -- ne riez pas, il y en a beaucoup plus que vous ne pourriez imaginer!), il faudra penser à offrir un flux à bas débit. La vitesse maximale théorique d'un modem téléphonique étant de 56 kbps, le débit d'un tel flux devra nécessairement être inférieur à ce taux de transfert. Le flux bas débit de Radio Fiat+/-Lux a un débit de 32 kbps, ce qui permet une écoute acceptable (en mono). Comme la demande pour ce type de flux est plutôt rare, celui-ci est relayé directement de nos studios (sans passer par un relais public payant).

Débit variable

Certains formats, comme Ogg Vorbis, permettent d'encoder des flux à débit variable (VBR, "Variable Bitrate", en opposition à CBR, "Constant Bitrate"). Dans ce cas, les parties du signal les plus complexes utiliseront plus d'information par rapport aux autres, de sorte à garder dans l'ensemble un débit moyen constant. Cela permet d'offrir une meilleure qualité d'encodage pour un même débit.

Bande passante

Pour plus d'information sur les relais et la bande-passante, consultez:

Ressources pour opérateurs (Services de relais externes)

Canaux

Un enregistrement audio peut être soit mono ou stéréo. Un enregistrement mono (monaural) ne comporte qu'un seul canal, tandis qu'un enregistrement stéréo comporte deux canaux. L'usage de plus de deux canaux n'est pas très répandu en ce qui nous concerne!

Il faut garder en tête qu'un enregistrement stéréo nécessite deux fois plus d'information qu'un enregistrement mono. Donc, un enregistrement stéréo aura, pour un même débit (bitrate), une qualité approximativement deux fois moindre qu'un enregistrement mono.

Certains formats, comme le MP3, permettent un encodage en joint-stereo, qui permettra d'optimiser le flux en tirant avantage du fait que les deux canaux d'un enregistrement sont en général très semblables.

Nous conseillons de générer des flux mono pour des débits inférieurs à 64 kbps afin d'assurer une écoute confortable.

Fréquence d'échantillonnage

Lorsqu'un signal audio est numérisé, le signal analogique doit être converti en nombres. Pour ce faire, le niveau du signal est échantillonné de nombreuses fois par secondes. Ces nombres peuvent ensuite être stockés et restitués plus tard en ondes sonores. Plus la fréquence d'échantillonnage (sample rate) est élevée, plus la forme de l'onde restituée sera proche de l'originale. Une fréquence trop basse donnera à l'onde une apparence "carrée", un effet similaire à la pixelisation observable lorsqu'on agrandit une image numérique en basse résolution, qui est audible à l'oreille.

La fréquence utilisée pour les disques compacts est 44 100 Hz (c'est à dire, 44 100 échantillons par seconde). Cette fréquence permet de restituer la plupart des sons analogiques sans altération qui soit audible à l'oreille humaine.

Pour la diffusion audio sur Internet, nous conseillons de s'en tenir à 44 100 Hz, même pour les flux à plus bas débit, à tout le moins en ce qui concerne les flux musicaux. Bien qu'en théorie la quantité d'information à encoder est proportionnelle au taux d'échantillonnage, l'expérience nous a montré qu'il n'y a aucun intérêt à réduire la fréquence d'échantillonnage pour les flux radio, qui contiennent de la musique. (Par contre, des fréquences d'échantillonage de 32 000 Hz, 22 050 Hz et même 10 025 Hz, peuvent très bien faire l'affaire pour d'autres applications, notamment pour des flux strictement vocaux.)

Fréquences d'échantillonage standard les plus courantes:

48 000 Hz
44 100 Hz (CD audio, recommandé)
32 000 Hz
22 050 Hz (voix)
11 025 Hz

Il n'est pas conseillé de déroger de ces fréquences apparemment arbitraires; effectivement, certains logiciels pourraient ne pas supporter des taux exotiques.

Profondeur de bit

La profondeur de bit (bit depth) détermine combien de bits seront utilisés pour stocker un échantillon. Plus le nombre de bit est élevé, plus la précision de l'échantillon sera élevée. Les profondeurs de bit les plus courantes sont 8 et 16 bits (16 bits est la profondeur de bit d'un échantillon pour les CD audio).

La profondeur de bit ne concerne pas vraiment les flux audio, car les algorithmes de compression utilisent en général des séries de Fourier et autres fonctions pour stocker les données audio (plutôt que des échantillons). C'est au moment de la prise de son que la profondeur de bit est critique, mais en général, n'importe quel système produira des échantillons sur 16 bits (précision du CD) avant que ceux-ci ne soient encodés par le logiciel DSP. Il n'y a donc pas lieu de s'en soucier ici.