Prenez contact avec nous

Plan du cours

Introduction à la multimodalité de Gemini 3

  • Capacités en matière de texte, d'images, d'audio et de vidéo
  • Sélection du modèle et présentation des points de terminaison
  • Concepts clés du raisonnement multimodal

Travail avec du texte et des entrées structurées

  • Stratégies de prompt pour la génération de texte
  • Métadonnées, fenêtres de contexte et embeddings
  • Orchestration textuelle des tâches multimodales

Compréhension des images et flux de travail visuels

  • Analyse et interprétation d'images avec Gemini 3
  • Création d'outils de recherche visuelle et de taggage
  • Mise en place d'interactions image-vers-texte et texte-vers-image

Traitement des entrées audio

  • Flux de travail de reconnaissance et de transcription speech
  • Détection et interprétation d'événements audio
  • Intégration de l'audio avec des entrées textuelles et visuelles

Intelligence vidéo et analyse de scènes

  • Raisonnement vidéo image par image et continu
  • Création d'outils de résumé et d'extraction de moments clés
  • Automatisation et flux de travail de contenu basés sur la vidéo

Conception d'architectures d'applications multimodales

  • Combinaison de plusieurs types d'entrées dans un seul pipeline
  • Considérations liées à la latence, aux coûts et aux calculs
  • Meilleures pratiques pour les systèmes multimodaux évolutifs

Prototypage d'applications multimodales

  • Création pratique de prototypes multimodaux
  • Itération rapide grâce à l'ingénierie de prompts
  • Tests et affinement des parcours utilisateur

Déploiement de solutions multimodales

  • Stratégies de déploiement et configuration de l'environnement
  • Surveillance des performances en contexte réel
  • Considérations relatives à la sécurité et à la conformité

Résumé et prochaines étapes

Pré requis

  • Une compréhension des concepts modernes de l'IA
  • De l'expérience avec Python ou JavaScript
  • Une familiarité avec les API REST

Audience cible

  • Concepteurs
  • Créateurs de contenu
  • Équipes techniques de produits
 14 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires