Formation Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts est un cours pratique sur la mise en service fiable et à grande échelle des modèles Tencent Hunyuan.

Cette formation en direct, animée par un formateur (en ligne ou en présentiel), s'adresse aux ingénieurs et aux architectes de niveau intermédiaire qui souhaitent utiliser Tencent Hunyuan pour déployer des modèles volumineux et à experts moindres (MoE) avec une latence réduite, une meilleure utilisation des GPU et des coûts d'exploitation maîtrisés.

À l'issue de cette formation, les participants seront capables de :

expliquer les principaux défis de la mise en production des modèles Tencent Hunyuan.
appliquer des techniques pratiques d'optimisation de l'inférence, telles que TensorRT, l'ajustement du cache KV, la quantification et le regroupement (batching).
concevoir une approche de déploiement évolutive intégrant l'autoscaling, la surveillance et la planification des capacités.
améliorer les compromis entre latence et coûts pour les charges de travail de production réelles.

Format du cours

Conférence interactive et discussions.
Nombreux exercices et mises en pratique.
Mise en œuvre pratique dans un environnement de laboratoire en direct.

Options de personnalisation du cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter afin de l'organiser.

Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.

Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.

Cours à venir

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

2026-08-10 09:30

14 heures

St. Mary

CA$ 4,770 (En ligne)

CA$ 24,770 (Salle de Classe)

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

2026-08-24 09:30

14 heures

201, avenue Portage

CA$ 4,770 (En ligne)

CA$ 6,770 (Salle de Classe)

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

2026-09-07 09:30

14 heures

Halifax-Place Métropolitaine

CA$ 4,770 (En ligne)

CA$ 6,770 (Salle de Classe)

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

2026-09-21 09:30

14 heures

Halifax - Purdy Wharf

CA$ 4,770 (En ligne)

CA$ 6,770 (Salle de Classe)

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

2026-10-05 09:30

14 heures

Dartmouth - Metropolitan Place

CA$ 4,770 (En ligne)

CA$ 6,770 (Salle de Classe)

Formation Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Plan du cours

Pré requis

Cours à venir

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Déploiement de Tencent Hunyuan en environnement de production : inférence à faible latence et optimisation des coûts

Cours Similaires

LangGraph Avancé : Optimisation, débogage et surveillance de graphes complexes

Création d'agents de codage avec Devstral : De la conception d'agents aux outils

Opérations sur les modèles open source : Auto-hébergement, affinement et gouvernance avec les modèles Devstral et Mistral

Applications de LangGraph dans la finance

Les fondamentaux de LangGraph : Conception et enchaînement des prompts pour les LLM par graphes

LangGraph dans le secteur de la santé : orchestration des flux de travail pour des environnements réglementés

LangGraph pour les applications juridiques

Construction de workflows dynamiques avec LangGraph et agents LLM

LangGraph pour l'automatisation du marketing

Le Chat Enterprise : ChatOps privé, intégrations et contrôles d'administration

Architectures de grands modèles de langage (LLM) économiques : Mistral à grande échelle (Ingénierie des performances et du coût)

Industrialisation des assistants conversationnels avec Mistral Connectors & Integrations

Déploiements de niveau entreprise avec Mistral Medium 3

Mistral pour une IA responsable : Vie privée, résidence des données et contrôles entreprise

Applications multimodales avec les modèles Mistral (vision, OCR et compréhension de documents)

Catégories Similaires

Large Language Models (LLMs)

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites