Prenez contact avec nous

Plan du cours

Introduction à la Génération Augmentée par Récupération (RAG)

  • Qu'est-ce que le RAG et pourquoi est-il important pour l'IA en entreprise.
  • Composants d'un système RAG : récupérateur, générateur, magasin de documents.
  • Comparaison avec les LLM autonomes et la recherche vectorielle.

Configuration d'un pipeline RAG

  • Installation et configuration de Haystack ou de frameworks similaires.
  • Ingestion et prétraitement des documents.
  • Connexion des récupérateurs aux bases de données vectorielles (par exemple, FAISS, Pinecone).

Ajustement fin du récupérateur

  • Entraînement de récupérateurs denses à l'aide de données spécifiques à un domaine.
  • Utilisation de transformers de phrases et d'apprentissage contrastif.
  • Évaluation de la qualité du récupérateur avec la précision top-k.

Ajustement fin du générateur

  • Sélection des modèles de base (par exemple, BART, T5, FLAN-T5).
  • Ajustement d'instructions versus ajustement fin supervisé.
  • Méthodes LoRA et PEFT pour des mises à jour efficaces.

Évaluation et optimisation

  • Métriques pour évaluer les performances du RAG (par exemple, BLEU, EM, F1).
  • Latence, qualité de la récupération et réduction des hallucinations.
  • Suivi des expériences et amélioration itérative.

Déploiement et intégration en conditions réelles

  • Déploiement du RAG dans des moteurs de recherche internes et des chatbots.
  • Aspects liés à la sécurité, à l'accès aux données et à la gouvernance.
  • Intégration avec des API, des tableaux de bord ou des portails de connaissances.

Études de cas et meilleures pratiques

  • Cas d'usage en entreprise dans les secteurs de la finance, des soins de santé et du juridique.
  • Gestion de la dérive du domaine et des mises à jour de la base de connaissances.
  • Perspectives futures des systèmes LLM à récupération augmentée.

Résumé et prochaines étapes

Pré requis

  • Compréhension des concepts de traitement automatique du langage naturel (TAL).
  • Expérience avec les modèles de langage basés sur des transformers.
  • Connaissance de Python et des flux de travail de base en apprentissage automatique.

Public cible

  • Ingénieurs en TAL.
  • Équipes de gestion des connaissances.
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires