Plan du cours

Introduction à la Génération Augmentée par la Recherche (RAG)

  • Qu'est-ce que le RAG et pourquoi il est important pour l'IA d'entreprise
  • Composants d'un système RAG : récupérateur, générateur, stockage de documents
  • Comparaison avec les LLM autonomes et la recherche vectorielle

Configuration d'une Pipeline RAG

  • Installation et configuration de Haystack ou frameworks similaires
  • Ingestion et prétraitement des documents
  • Connexion des récupérateurs à des bases de données vectorielles (par exemple, FAISS, Pinecone)

Fine-Tuning le Récupérateur

  • Formation de récupérateurs denses en utilisant des données spécifiques au domaine
  • Utilisation de transformateurs de phrases et d'apprentissage contrastif
  • Évaluation de la qualité du récupérateur avec l'exactitude top-k

Fine-Tuning le Générateur

  • Sélection des modèles de base (par exemple, BART, T5, FLAN-T5)
  • Tuning par instructions vs. fine-tuning supervisé
  • Méthodes LoRA et PEFT pour des mises à jour efficaces

Évaluation et Optimisation

  • Métriques pour évaluer les performances RAG (par exemple, BLEU, EM, F1)
  • Délai de réponse, qualité de la recherche et réduction de l'hallucination
  • Suivi des expériences et amélioration itérative

Deployment et Intégration dans le Monde Réel

  • Déploiement du RAG dans les moteurs de recherche internes et les chatbots
  • Considérations en matière de sécurité, d'accès aux données et de gouvernance
  • Intégration avec des API, des tableaux de bord ou des portails de connaissances

Cas Pratiques et Meilleures Pratiques

  • Cas d'utilisation en entreprise dans la finance, les soins de santé et le droit
  • Gestion du dérive de domaine et des mises à jour de la base de connaissances
  • Directions futures pour les systèmes LLM augmentés par la recherche

Récapitulatif et Prochaines Étapes

Pré requis

  • Une compréhension des concepts de traitement du langage naturel (NLP)
  • Expérience avec les modèles linguistiques basés sur les transformateurs
  • Familiarité avec Python et les workflows de base d'apprentissage automatique

Public cible

  • Ingénieurs NLP
  • Équipes de gestion des connaissances
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires