Prenez contact avec nous

Plan du cours

Préparation des modèles d'apprentissage automatique au déploiement

  • Emballage des modèles avec Docker
  • Exportation des modèles depuis TensorFlow et PyTorch
  • Considérations relatives au versionnage et au stockage

Servir les modèles sur Kubernetes

  • Aperçu des serveurs d'inférence
  • Déploiement de TensorFlow Serving et TorchServe
  • Configuration des points de terminaison des modèles

Techniques d'optimisation de l'inférence

  • Stratégies de groupement par lots (batching)
  • Gestion des requêtes simultanées
  • Réglage de la latence et du débit

Auto-scaling des charges de travail ML

  • Horizontal Pod Autoscaler (HPA)
  • Vertical Pod Autoscaler (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

Approvisionnement GPU et gestion des ressources

  • Configuration des nœuds GPU
  • Aperçu du plugin de périphérique NVIDIA
  • Demandes et limites de ressources pour les charges de travail ML

Stratégies de déploiement et de versionnement des modèles

  • Déploiements bleu/vert
  • Modèles de déploiement canari
  • Tests A/B pour l'évaluation des modèles

Surveillance et observabilité du ML en production

  • Métriques pour les charges de travail d'inférence
  • Pratiques de journalisation et de traçage
  • Tableaux de bord et alertes

Considérations en matière de sécurité et de fiabilité

  • Sécurisation des points de terminaison des modèles
  • Politiques réseau et contrôle d'accès
  • Garantie de haute disponibilité

Résumé et prochaines étapes

Pré requis

  • Une compréhension des flux de travail des applications conteneurisées
  • Une expérience avec des modèles d'apprentissage automatique basés sur Python
  • Une familiarité avec les fondamentaux de Kubernetes

Public visé

  • Ingénieurs ML
  • Ingénieurs DevOps
  • Équipes en ingénierie de plateforme
 14 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires