Oliver Alsbach

Oliver Alsbach

Directeur-conseil, prestation de services – Solutions de radiodiffusion dira

Dans le domaine de la production sonore et radiophonique, l’intelligence artificielle (IA) commence déjà à faire ses preuves en simplifiant le travail des éditeurs, en accélérant radicalement les flux de travaux et en offrant des services qui étaient auparavant inconcevables. Une chose est claire : l’IA n’a pas besoin de faire de la magie pour changer la donne dans ce domaine. Grâce à l’IA, des applications bien connues, comme la conversion parole-texte, apportent enfin la valeur ajoutée attendue.

Qu’il s’agisse de longs débats parlementaires, de matchs de soccer qui se disputent pendant toute une soirée ou de concerts qui durent plusieurs heures, les diffuseurs enregistrent chaque jour d’énormes quantités de matériel audio. Jusqu’à récemment, trouver un énoncé précis et percutant parmi ce matériel constituait une tâche fastidieuse et chronophage. De plus, le temps est un facteur crucial dans le domaine de la production radiophonique. Si un événement doit figurer dans le prochain bulletin de nouvelles, la rapidité est de mise.

L’IA est un atout précieux pour les radiodiffuseurs aux prises avec des délais d’exécution très courts, surtout lorsqu’il s’agit de transcrire automatiquement des enregistrements. Par exemple, dans l’éditeur audio, le texte généré est affiché à côté de l’enveloppe (la courbe décrivant l’évolution de l’amplitude du son), et les éditeurs peuvent simplement effectuer une recherche dans le texte. Une fois l’estampille temporelle apposée, l’éditeur peut sélectionner un segment, le couper, créer une nouvelle piste audio, l’insérer dans le calendrier de diffusion et le lire – le tout très rapidement.

La conversion de la parole au texte passe à un autre niveau

La conversion de la parole en texte est une technologie qui a vu le jour il y a plusieurs décennies, mais ce n’est que récemment, grâce à l’apprentissage machine et à l’IA, qu’elle a fait l’objet d’avancées importantes permettant d’offrir une réelle valeur ajoutée aux radiodiffuseurs. Au départ, seulement quelques mots étaient transcrits correctement. Aujourd’hui, un taux de reconnaissance de plus de 90 % est concevable. L’exemple de la conversion parole-texte montre clairement qu’il ne suffit jamais d’introduire une nouvelle technologie – elle doit produire des résultats de qualité avant de pouvoir être adoptée et exploitée.

L’omniprésence des nouveaux sujets, termes et noms propres dans le monde d’aujourd’hui représente un défi particulier. Le mélange de mots provenant de langues différentes (p. ex. l’intégration de termes techniques étrangers) constitue une autre difficulté pour la conversion parole-texte. Les systèmes de reconnaissance vocale sont donc entraînés indépendamment pour apprendre de nouveaux mots et de nouvelles phrases, et ils s’améliorent continuellement. Dans l’ensemble, la qualité de la transcription est remarquable aujourd’hui. L’IA fournit même un pourcentage indiquant la probabilité que le résultat soit exact.

Les archives deviennent de véritables coffres aux trésors

Des fonctions supplémentaires peuvent être intégrées au texte transcrit. Il est très utile que l’IA cible les mots clés les plus importants et les ajoute automatiquement aux métadonnées. La convivialité du contenu s’en voit considérablement accrue. Les entreprises de radiodiffusion disposent de vastes archives qui peuvent même remonter aux débuts des registres gouvernementaux. Même si au fil des ans ces documents d’archives ont été largement numérisés, ils ne deviennent utilisables que s’ils peuvent être trouvés. Grâce à l’IA, des archives complètes peuvent être passées au crible en quelques secondes. De plus, il est désormais possible de déterminer automatiquement et avec fiabilité quelle personne parle et quand elle prend la parole. En combinant les capacités de reconnaissance de la parole et du locuteur, on peut facilement trouver un énoncé précis dans le discours d’une personne connue.

Ce que nous réserve l’avenir

L’IA a déjà fait ses preuves dans le domaine du journalisme radiophonique. L’industrie est donc très optimiste à l’égard de ce que nous réserve l’avenir.

  • Il y a un grand potentiel, par exemple, dans le post-traitement automatisé du matériel audio, qui tirera parti d’une rapidité de diffusion accrue.
  • Les mots de remplissage et les sons qui marquent une hésitation pourront être automatiquement supprimés.
  • L’IA peut, notamment, suggérer la meilleure approche pour couper du matériel audio et apporter des modifications automatiquement pour les podcasts, les formats courts et les annonces-amorces sur diverses plateformes.
  • L’IA peut également créer des profils de spectacle, aider à la planification du contenu musical, visuel et audio, et classer ce contenu par thème ou par marché précis.
  • La capacité de l’IA en matière de conversion parole-texte fait l’objet de bien des discussions, mais nous ne savons pas encore si nous verrons un jour des présentateurs de nouvelles générés par l’IA. 

L’exemple de l’application de l’IA dans le domaine de la production radiophonique démontre clairement le potentiel de cette technologie pour soutenir le travail de personnes créatives. L’IA prend en charge des tâches simples et répétitives afin que les éditeurs puissent se concentrer sur des tâches plus importantes. Ils sont ainsi en mesure de trouver rapidement la bonne information et de générer plus de contenu pour diverses plateformes. Les gens sont – et demeurent – indispensables dans ce processus.  

Chez CGI, nous croyons que la combinaison d’une utilisation responsable de l’IA et de la créativité humaine est nécessaire pour obtenir des résultats fiables. Apprenez-en davantage sur le cadre d’utilisation responsable de l’IA de CGI et les considérations éthiques sur l’IA dans les flux de travaux des salles de presse
 

Haut de page

À propos de l’auteur

Oliver Alsbach

Oliver Alsbach

Directeur-conseil, prestation de services – Solutions de radiodiffusion dira

À titre de directeur-conseil, prestation de services, Oliver Alsbach s’occupe du développement de CGI dira, notre système de gestion de contenu et de diffusion pour la production radio et audio.