Prenez contact avec nous

Plan du cours

Fondements d’une IA sûre et équitable

  • Concepts clés : sécurité, biais, équité, transparence
  • Types de biais : biais des ensembles de données, de représentation, algorithmique
  • Aperçu des cadres réglementaires (Règlement sur l’IA de l’UE, RGPD, etc.)

Les biais dans les modèles ajustés

  • Comment le réglage fin peut introduire ou amplifier les biais
  • Études de cas et échecs en conditions réelles
  • Identification des biais dans les ensembles de données et les prédictions des modèles

Techniques d’atténuation des biais

  • Stratégies au niveau des données (rééquilibrage, augmentation)
  • Stratégies pendant l’entraînement (régularisation, débiaisage par adversaires)
  • Stratégies de post-traitement (filtrage des sorties, calibration)

Sécurité et robustesse des modèles

  • Détection des sorties dangereuses ou nuisibles
  • Gestion des entrées adverses
  • Tests d’intrusion (red teaming) et tests de stress des modèles ajustés

Audit et surveillance des systèmes d’IA

  • Métriques d’évaluation des biais et de l’équité (par exemple, parité démographique)
  • Outils d’explicabilité et cadres de transparence
  • Pratiques de surveillance continue et de gouvernance

Boîtes à outils et pratique sur le terrain

  • Utilisation de bibliothèques open-source (par exemple, Fairlearn, Transformers, CheckList)
  • Pratique : détection et atténuation des biais dans un modèle ajusté
  • Génération de sorties sûres grâce à la conception de prompts et à des contraintes

Cas d’utilisation en entreprise et préparation à la conformité

  • Meilleures pratiques pour intégrer la sécurité dans les flux de travail des LLM
  • Documentation et fiches modèles pour la conformité
  • Préparation aux audits et aux revues externes

Resumé et prochaines étapes

Pré requis

  • Une compréhension des modèles d’apprentissage automatique et des processus d’entraînement
  • De l’expérience dans le travail avec le réglage fin (fine-tuning) et les grands modèles de langage (LLM)
  • Une familiarité avec Python et les concepts du traitement automatique des langues (NLP)

Public cible

  • Équipes de conformité en IA
  • Ingénieurs en apprentissage automatique (ML)
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires