Prenez contact avec nous

Plan du cours

Introduction à AlphaFold & Son impact sur la recherche biologique

  • Évolution de la prédiction de la structure des protéines : de la modélisation par homologie aux percées du apprentissage profond
  • Rôle d'AlphaFold dans l'accélération de la biologie structurale, la découverte de médicaments et l'annotation fonctionnelle
  • Définition des attentes : capacités, limitations et points d'intégration expérimentale
  • Exercice pratique : Exploration de l'interface de la Base de données de structure des protéines AlphaFold (AFDB) et réalisation de recherches initiales de séquences

Comment AlphaFold fonctionne-t-il ? Architecture & Composants principaux

  • Architecture du réseau neuronal : Evoformer, module de structure et modélisation des séquences basée sur l'attention
  • Génération de l'alignement multiple de séquences (MSA) et appariement de modèles (PDB, UniRef, BFD)
  • Métriques de confiance : explication du pLDDT (confiance par résidu) et du PAE (erreur alignée prédite)
  • Exercice pratique : Cartographie des étapes du workflow d'AlphaFold en utilisant une séquence de protéine exemple et suivi des entrées MSA/modèles

Accès à AlphaFold : Plateformes, Cahiers (Notebooks) & Déploiement

  • Options de déploiement officielles : AlphaFold DB, API publique, cahiers Colab et environnements locaux/GPU
  • Configuration d'un environnement Colab reproductible : installation des dépendances, allocation du GPU et formatage des entrées
  • Préparation des séquences de protéines : structure FASTA, gestion des chaînes et considérations multi-domaines
  • Laboratoire pratique : Déploiement du cahier Colab officiel d'AlphaFold, téléchargement d'un FASTA personnalisé et lancement de la première exécution de prédiction

Base de données de structure des protéines AlphaFold & Ressources publiques

  • Navigation dans l'AFDB : couverture des organismes, qualité des structures, formats de téléchargement (PDB/mmCIF, fichiers non relaxés/pLDDT)
  • Recoupement de l'AFDB avec UniProt, PDB et bases de données fonctionnelles (GO, KEGG, CATH)
  • Gestion des jeux de données à grande échelle : limites de prédiction par lots, guidelines de citation et licences de données
  • Exercice pratique :

Interprétation des prédictions d'AlphaFold & Métriques de confiance

  • Lecture des cartes thermiques pLDDT : identification des cœurs structurés, des régions désordonnées et des domaines à faible confiance
  • Décodage des matrices PAE : détection des limites de domaines, des interactions intra/inter-chaines et des régions potentielles de mauvais repliement
  • Lorsque les prédictions sont fiables : couverture des séquences, profondeur évolutionnaire et homologues structuraux connus
  • Exercice pratique :

Code source ouvert d'AlphaFold & Voies de personnalisation

  • Structure du référentiel : modules principaux, pipelines de données et fichiers de configuration
  • Modification des entrées : MSA personnalisés, remplacement des modèles et ajustement des seuils de confiance
  • Optimisation des performances : réduction du temps d'exécution, gestion de la mémoire et sauvegarde des points de contrôle (checkpoints)
  • Laboratoire pratique :

Cas d'utilisation d'AlphaFold dans la recherche biologique & Intégration expérimentale

  • Guidage de la mutagenèse, de la cristallisation et de la planification des grilles en cryo-MET (cryo-EM) à l'aide de modèles prédits
  • Annotation fonctionnelle : cartographie des sites actifs, préparation du docking de ligands et prédiction des interfaces
  • Limitations & vérification : lorsque faire confiance aux prédictions, lorsque valider expérimentalement et pièges courants
  • Atelier :

Résumé, application phare (Capstone) & Prochaines étapes

  • Consolidation des concepts clés : architecture, interprétation et déploiement pratique
  • Projet final :
  • Questions ouvertes, dépannage des erreurs courantes et distribution des ressources
  • Prochaines étapes : intégration avancée d'AlphaFold3, RoseTTAFold, trRosetta et outils communautaires en cours de développement

Pré requis

  • Connaissances et compréhension des structures des protéines
  • Une familiarité avec les concepts fondamentaux de la biologie moléculaire (séquences d'acides aminés, principes de repliement, formats PDB/mmCIF) est recommandée
  • Aisance dans la navigation sur des cahiers (notebooks) web et l'exécution de cellules de code dans un navigateur

Public cible

  • Biologistes, chercheurs en biologie moléculaire et enquêteurs en biologie structurale
  • Chercheurs expérimentaux cherchant des prédictions de structure computationnelles pour guider les flux de travail en laboratoire (wet-lab)
  • Professionnels des sciences de la vie intégrant la modélisation assistée par l'IA dans la formulation d'hypothèses et la conception expérimentale
 7 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires