Prenez contact avec nous

Plan du cours

Fondamentaux multimodaux Hunyuan et configuration du laboratoire

  • Comprendre les capacités multimodales de Hunyuan pour les cas d'usage images, 3D et vidéos.
  • Identifier des scénarios business pratiques pour les équipes créatives, produit et contenu.
  • Préparer l'environnement de laboratoire, les échantillons d'actifs et l'accès aux modèles.
  • Exécuter les premières tâches de génération et examiner les résultats.

Conception de prompts et motifs de workflow

  • Structurer les prompts pour obtenir des résultats multimodaux cohérents.
  • Travailler avec des prompts textuels, des images de référence et des paramètres d'entrée de base.
  • Choisir les workflows adaptés à la génération d'images, de vidéos ou de 3D.
  • Itérer sur les prompts en fonction de la qualité des résultats et de l'intention business.

Laboratoires de génération et d'examen d'images

  • Créer des images marketing, produit et conceptuelles à partir de prompts.
  • Affiner le style visuel, la composition et la cohérence du contenu.
  • Examiner les résultats pour leur utilité, leur qualité et leur adéquation avec la marque.
  • Organiser les images produites pour l'approbation et l'utilisation ultérieure.

Laboratoires de génération de vidéos

  • Créer des sorties vidéo courtes à partir de prompts et d'entrées préparées.
  • Contrôler le style, l'intention de la scène et la variation des résultats.
  • Examiner les vidéos pour leur clarté, leur continuité et leur utilisation pratique.
  • Préparer les sorties vidéo pour les démonstrations ou les workflows de contenu.

Laboratoires de création d'actifs 3D

  • Générer des actifs 3D de base à partir d'entrées textuelles ou image.
  • Vérifier la géométrie, la qualité des textures et l'exploitabilité des actifs.
  • Exporter les actifs pour la visualisation, le prototypage ou les pipelines de contenu.
  • Comparer les moments où la génération 3D est appropriée versus les workflows image ou vidéo.

Intégration, gouvernance et prochaines étapes

  • Diffuser les actifs générés via des applications, services ou API simples.
  • Connecter les sorties multimodales aux workflows produits, contenu et de revue.
  • Appliquer des vérifications pratiques pour la qualité, la sécurité de la marque, le respect des droits d'auteur et l'usage responsable.
  • Planifier les cas d'essai pilotes et les prochaines étapes pour l'adoption interne.

Pré requis

  • Compréhension de base des concepts de l'IA et de l'IA générative.
  • Expérience d'utilisation d'applications web, d'API ou d'outils développeurs courants.
  • Expérience de base en Python ou en script.

Audience cible

  • Développeurs créant des fonctionnalités de produit alimentées par l'IA.
  • Chefs de produit techniques et architectes de solutions.
  • Équipes d'innovation, médias et numérique travaillant avec du contenu image, vidéo ou 3D.
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires