Plan du cours

Introduction à la Synthèse Vocale et au Clonage Vocal

  • Aperçu de la synthèse vocale basée sur le texte (TTS) et la synthèse vocale neuronale
  • Clonage vocal vs génération de parole : cas d'utilisation et limites
  • Modèles clés : Tacotron, WaveNet, FastSpeech, VITS

Travail avec des Plateformes Commerciales

  • Utilisation d'ElevenLabs et de Resemble AI
  • Création, clonage et édition de voix
  • Accès à l'API et workflows text-to-speech

Construction avec des Outils Open-Source

  • Installation et configuration de Coqui TTS
  • Formation de voix personnalisées et gestion des jeux de données
  • Génération de parole avec un contrôle précis (intonation, vitesse, émotion)

Préparation des Données et Jeu de Données Vocal Management

  • Collecte et nettoyage d'échantillons vocaux
  • Segmenter, annoter et aligner lescriptes
  • Sourcing éthique et consentement vocal

Intégration de l'Application

  • Intégration du TTS dans des sites web et applications
  • Création de systèmes IVR et robots interactifs
  • Génération de dialogue synthétique pour la vidéo et les jeux

Évaluation de la Qualité et du Réalisme

  • Tests MOS (Mean Opinion Score) et d'intelligibilité
  • Contrôle de l'expressivité et de la prosodie
  • Comparaison de latence, de fidélité et de réalisme

Considérations Éthiques, Légales et en Gouvernance Go

  • Risques liés aux deepfakes et utilisation responsable
  • Consentement, attribution et implications de droits d'auteur
  • Réglementations et politiques organisationnelles

Résumé et Étapes Suivantes

Pré requis

  • Compréhension des fondamentaux de l'apprentissage automatique
  • Familiarité avec les formats de fichiers audio et les outils d'édition
  • Compétences en programmation de base Python

Public cible

  • Développeurs et ingénieurs AI intéressés par la synthèse vocale
  • Créateurs de contenu et technologues des médias explorant la génération vocale
  • Équipes R&D construisant des systèmes audio personnalisés ou dynamiques
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires