Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à l'affinage des LLM DeepSeek
- Aperçu des modèles DeepSeek, par exemple DeepSeek-R1 et DeepSeek-V3
- Comprendre la nécessité d'affiner les LLM
- Comparaison entre l'affinage et l'ingénierie des prompts
Préparation des ensembles de données pour l'affinage
- Sélection de données spécifiques au domaine
- Techniques de prétraitement et de nettoyage des données
- Tokenisation et formatage des ensembles de données pour DeepSeek LLM
Configuration de l'environnement d'affinage
- Configuration de l'accélération GPU et TPU
- Configuration de Hugging Face Transformers avec DeepSeek LLM
- Compréhension des hyperparamètres pour l'affinage
Affinage de DeepSeek LLM
- Mise en œuvre de l'affinage supervisé
- Utilisation de LoRA (Low-Rank Adaptation) et PEFT (Parameter-Efficient Fine-Tuning)
- Exécution de l'affinage distribué pour les ensembles de données à grande échelle
Évaluation et optimisation des modèles affinés
- Évaluation des performances du modèle avec des métriques d'évaluation
- Gestion du surapprentissage et du sous-apprentissage
- Optimisation de la vitesse d'inférence et de l'efficacité du modèle
Déploiement des modèles DeepSeek affinés
- Conditionnement des modèles pour le déploiement via API
- Intégration des modèles affinés dans les applications
- Mise à l'échelle des déploiements avec le cloud et l'informatique en périphérie
Cas d'utilisation et applications réels
- LLM affinés pour la finance, la santé et le service à la clientèle
- Études de cas d'applications sectorielles
- Considérations éthiques dans les modèles d'IA spécifiques à un domaine
Résumé et prochaines étapes
Pré requis
- Expérience avec les frameworks d'apprentissage automatique et d'apprentissage profond
- Familiarité avec les transformers et les grands modèles de langage (LLM)
- Compréhension des techniques de prétraitement des données et d'entraînement des modèles
Audience
- Chercheurs en IA explorant l'affinage des LLM
- Ingénieurs en apprentissage automatique développant des modèles d'IA personnalisés
- Développeurs avancés mettant en œuvre des solutions basées sur l'IA
21 Heures