Aller au contenu principal
Accueil
MDesigner.org

Navigation principale

  • Accueil
  • Formations
    • Communication et Marketing
    • Intelligence Artificielle et Technologies
    • Relations Internationales et Interculturalités
  • Recherche
    • Narration et Discours
    • Pédagogie et Théâtre
    • Créativité Computationnelle
  • Évènements
    • Calendrier ÆØΞΣ
    • Sessions ÆØΞΣ

Fil d'Ariane

  1. Accueil

Interactive Audio Media Format (IAMF) & FFMPEG

Immersive audio models and formats

Introduction à l'IAMF

Qu'est-ce que l'IAMF?

https://aomediacodec.github.io

L'Interactive Audio Media Format (IAMF) est un nouveau format audio développé par l'Alliance for Open Media (AOM) qui vise à révolutionner l'expérience audio immersive et interactive. Ce format open-source est conçu pour offrir:

  • Une spatialisation audio avancée

  • Une interactivité enrichie

  • Une personnalisation pour l'auditeur

  • Une compatibilité avec différents écosystèmes

Origines et développement

IAMF est développé par l'Alliance for Open Media, un consortium qui comprend des acteurs majeurs comme Google, Apple, Amazon, Netflix et d'autres. Ce format s'inscrit dans la continuité des codecs AV1 et s'intègre parfaitement avec eux.

Architecture technique de l'IAMF

Structure de base

Le format IAMF est construit autour de plusieurs composants clés:

  1. En-tête (Header): Contient les métadonnées essentielles

  2. Descripteurs audio: Définissent les caractéristiques des flux audio

  3. Métadonnées interactives: Permettent l'adaptation dynamique

  4. Données audio: Les échantillons audio proprement dits

Caractéristiques techniques principales

  • Support du son 3D: Spatialisation avancée avec support pour le positionnement dynamique

  • Couches audio multiples: Permet des mixages complexes

  • Paramètres interactifs: Volume, égalisation et effets modifiables en temps réel

  • Efficacité de codage: Utilisation des codecs AV1 pour une compression efficace

Cas d'utilisation

Applications potentielles

  1. Divertissement:

    • Films et séries avec audio adaptatif

    • Jeux vidéo avec son dynamique

    • Expériences musicales interactives

  2. Réalité virtuelle et augmentée:

    • Audio spatialisé précis

    • Adaptation au mouvement de l'utilisateur

  3. Accessibilité:

    • Personnalisation des pistes audio

    • Adaptation aux préférences de l'auditeur

  4. Publicité interactive:

    • Messages audio adaptés au contexte

Implémentation et outils

Intégration avec les codecs existants

IAMF est conçu pour fonctionner en tandem avec:

  • AV1 pour la vidéo

  • Opus et autres codecs audio

Outils de développement

L'écosystème IAMF propose:

  • Bibliothèques de référence

  • Outils de création de contenu

  • Plugins pour moteurs audio populaires

Avantages par rapport aux formats existants

FonctionnalitéIAMFDolby AtmosMPEG-H
Open-sourceOuiNonNon
PersonnalisationOuiLimitéeOui
InteractivitéOuiNonLimitée
Compression efficaceOuiOuiOui

Démonstration pratique

Exemple de configuration basique

xml
 
<iamf version="1.0">  <audioDescriptor id="main">    <codec>opus</codec>    <channels>6</channels>    <interactiveParams>      <volume adjustable="true" range="-20,10"/>      <eq adjustable="true" bands="5"/>    </interactiveParams>  </audioDescriptor> </iamf>

Workflow typique

  1. Création du contenu audio avec outils auteurs

  2. Encodage au format IAMF

  3. Intégration dans l'application

  4. Lecture avec adaptation interactive

Défis et limitations

Points à considérer

  • Nécessite un support matériel/logiciel

  • Courbe d'apprentissage pour les créateurs

  • Compatibilité avec l'existant

Perspectives d'évolution

  • Amélioration des outils auteurs

  • Extension des capacités interactives

  • Adoption par les plateformes majeures

Conclusion

IAMF représente une avancée significative dans les technologies audio, combinant immersion, interactivité et accessibilité dans un format ouvert. Son adoption pourrait redéfinir les standards de l'audio numérique dans les années à venir.

Ressources supplémentaires

  • Site officiel IAMF

  • Documentation technique

  • Exemples d'implémentation

  • Communauté de développement

Encodage IAMF avec des outils externes (FFmpeg et MP4Box)

Encodage IAMF

https://github.com/AOMediaCodec/iamf-tools/blob/main/docs/external/encoding_with_external_tools.md#merge-an-iamf-file-with-video-into-mp4

1. Introduction à l'encodage IAMF

L'Interactive Audio Media Format (IAMF) peut être encodé et encapsulé dans des fichiers MP4 à l'aide d'outils open-source comme FFmpeg et MP4Box. Ces outils permettent :

  • L'encodage de fichiers audio (WAV) en IAMF

  • La fusion avec une vidéo dans un conteneur MP4

  • La gestion des métadonnées de spatialisation et d'interactivité


2. Encodage avec FFmpeg

FFmpeg permet d'encoder des pistes audio en IAMF et de les fusionner avec une vidéo.

2.1. Notes importantes avant de commencer

  • Ordre des canaux : Par défaut, FFmpeg suppose un ordre de canaux conforme à ITU-R BS.2051. Si votre fichier utilise un autre ordre, modifiez les indices dans channelmap.

  • Métadonnées de loudness :
    IAMF nécessite des informations de volume normalisé (integrated_loudness en LKFS et digital_peak en dBFS).
    Vous pouvez les mesurer avec des outils comme loudnorm ou astats dans FFmpeg.


2.2. Exemples d'encodage avec FFmpeg

Encodage d'un fichier stéréo en IAMF

sh
 
ffmpeg -i /chemin/vers/input.wav \    -i /chemin/vers/video.mp4 -c:v copy \    -filter_complex "[0:a]channelmap=0|1:stereo[FRONT]" \    -map "[FRONT]" -map 1:0 \    -stream_group "type=iamf_audio_element:id=1:st=0:audio_element_type=channel,layer=ch_layout=stereo" \    -stream_group "type=iamf_mix_presentation:id=3:stg=0:annotations=en-us=default_mix_presentation,submix=parameter_id=100:parameter_rate=48000:default_mix_gain=0.0|element=stg=0:headphones_rendering_mode=binaural:annotations=en-us=stereo:parameter_id=101:parameter_rate=48000:default_mix_gain=0.0|layout=sound_system=stereo:integrated_loudness=0.0:digital_peak=0.0" \    -streamid 0:0 -streamid 1:1 \    -c:a libopus -b:a 64000 /chemin/vers/output.mp4

Encodage d'un fichier 5.1 en IAMF

sh
 
ffmpeg -i /chemin/vers/input.wav \    -i /chemin/vers/video.mp4 -c:v copy \    -filter_complex "[0:a]channelmap=0|1:stereo[FRONT];[0:a]channelmap=4|5:stereo[BACK];[0:a]channelmap=2:mono[CENTER];[0:a]channelmap=3:mono[LFE]" \    -map "[FRONT]" -map "[BACK]" -map "[CENTER]" -map "[LFE]" -map 1:0 \    -stream_group "type=iamf_audio_element:id=1:st=0:st=1:st=2:st=3:audio_element_type=channel,layer=ch_layout=5.1(side)" \    -stream_group "type=iamf_mix_presentation:id=3:stg=0:annotations=en-us=default_mix_presentation,submix=parameter_id=100:parameter_rate=48000:default_mix_gain=0.0|element=stg=0:headphones_rendering_mode=binaural:annotations=en-us=5.1:parameter_id=101:parameter_rate=48000:default_mix_gain=0.0|layout=sound_system=stereo:integrated_loudness=0.0:digital_peak=0.0" \    -streamid 0:0 -streamid 1:1 -streamid 2:2 -streamid 3:3 -streamid 4:4 \    -c:a libopus -b:a 64000 /chemin/vers/output.mp4

🔹 Encodage d'un fichier Ambisonics (1er ordre) en IAMF

sh
 
ffmpeg -i /chemin/vers/input_FOA.wav \    -i /chemin/vers/video.mp4 -c:v copy \    -filter_complex "[0:a]channelmap=0:mono[A0];[0:a]channelmap=1:mono[A1];[0:a]channelmap=2:mono[A2];[0:a]channelmap=3:mono[A3]" \    -map "[A0]" -map "[A1]" -map "[A2]" -map "[A3]" -map 1:0 \    -stream_group "type=iamf_audio_element:id=1:st=0:st=1:st=2:st=3:audio_element_type=scene,layer=ch_layout=ambisonic\ 1:ambisonics_mode=mono," \    -stream_group "type=iamf_mix_presentation:id=3:stg=0:annotations=en-us=default_mix_presentation,submix=parameter_id=100:parameter_rate=48000:default_mix_gain=0.0|element=stg=0:headphones_rendering_mode=binaural:annotations=en-us=FOA:parameter_id=101:parameter_rate=48000:default_mix_gain=0.0|layout=sound_system=stereo:integrated_loudness=0.0:digital_peak=0.0" \    -streamid 0:0 -streamid 1:1 -streamid 2:2 -streamid 3:3 -streamid 4:4 \    -c:a libopus -b:a 64000 /chemin/vers/output.mp4

3. Fusion avec MP4Box

MP4Box permet d'encapsuler un fichier .iamf autonome dans un MP4 et de le fusionner avec une vidéo.

3.1. Fusion simple d'un fichier IAMF avec une vidéo

sh
 
MP4Box -add input_audio.iamf -add input_video.mp4 -new output.mp4

3.2. Fusion avec FFmpeg (pour des configurations complexes)

sh
 
ffmpeg -i /chemin/vers/3OA_and_stereo_iamf.mp4 \    -i /chemin/vers/video.mp4 \    -c:v copy -c:a copy \    -map 0:a:0 -map 0:a:1 -map 0:a:2 -map 0:a:3 -map 0:a:4 -map 0:a:5 -map 0:a:6 -map 0:a:7 -map 0:a:8 -map 0:a:9 -map 0:a:10 -map 0:a:11 -map 0:a:12 -map 0:a:13 -map 0:a:14 -map 0:a:15 -map 0:a:16 -map 1:v:0 \    -stream_group map=0=0:st=0:st=1:st=2:st=3:st=4:st=5:st=6:st=7:st=8:st=9:st=10:st=11:st=12:st=13:st=14:st=15 \    -stream_group map=0=1:st=16 \    -stream_group map=0=2 \    -streamid 0:0 -streamid 1:1 -streamid 2:2 -streamid 3:3 -streamid 4:4 -streamid 5:5 -streamid 6:6 -streamid 7:7 -streamid 8:8 -streamid 9:9 -streamid 10:10 -streamid 11:11 -streamid 12:12 -streamid 13:13 -streamid 14:14 -streamid 15:15 -streamid 16:16 \    /chemin/vers/output.mp4

4. Conclusion

  • FFmpeg est idéal pour encoder directement des WAV en IAMF et les fusionner avec une vidéo.

  • MP4Box est plus simple pour fusionner un fichier IAMF existant avec une vidéo.

  • Les métadonnées de loudness sont essentielles pour une expérience audio cohérente.

Documentation officielle :

  • FFmpeg

  • MP4Box

  • IAMF Specs

 

  • Intelligence Artificielle et Technologies

Voyage vers les Sociétés de la Connaissance

COMMUNICATION ET MARKETING
communication, design, science des données, dialogue, éducation, cinéma, journalisme, marketing, médias, médias sociaux, narration, actualités, production, radio, social, web, art, jeux, gestion, sport, cinéma


INTELLIGENCE ARTIFICIELLE ET TECHNOLOGIES
IA, connaissance, informatique, innovation, logiciels, mathématiques, recherche, astronomie, botanique, finance, industrie, apprentissage en ligne, psychologie


RELATIONS INTERNATIONALES ET INTERCULTURALITÉ
anthropologie, culture, diplomatie, droit, économie, géographie, histoire, langues, littérature, livres, musée, musique, philosophie, politique, religion, sexualité, tourisme