Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à AlphaFold & Son impact sur la recherche biologique
- Évolution de la prédiction de la structure des protéines : de la modélisation par homologie aux percées du apprentissage profond
- Rôle d'AlphaFold dans l'accélération de la biologie structurale, la découverte de médicaments et l'annotation fonctionnelle
- Définition des attentes : capacités, limitations et points d'intégration expérimentale
- Exercice pratique : Exploration de l'interface de la Base de données de structure des protéines AlphaFold (AFDB) et réalisation de recherches initiales de séquences
Comment AlphaFold fonctionne-t-il ? Architecture & Composants principaux
- Architecture du réseau neuronal : Evoformer, module de structure et modélisation des séquences basée sur l'attention
- Génération de l'alignement multiple de séquences (MSA) et appariement de modèles (PDB, UniRef, BFD)
- Métriques de confiance : explication du pLDDT (confiance par résidu) et du PAE (erreur alignée prédite)
- Exercice pratique : Cartographie des étapes du workflow d'AlphaFold en utilisant une séquence de protéine exemple et suivi des entrées MSA/modèles
Accès à AlphaFold : Plateformes, Cahiers (Notebooks) & Déploiement
- Options de déploiement officielles : AlphaFold DB, API publique, cahiers Colab et environnements locaux/GPU
- Configuration d'un environnement Colab reproductible : installation des dépendances, allocation du GPU et formatage des entrées
- Préparation des séquences de protéines : structure FASTA, gestion des chaînes et considérations multi-domaines
- Laboratoire pratique : Déploiement du cahier Colab officiel d'AlphaFold, téléchargement d'un FASTA personnalisé et lancement de la première exécution de prédiction
Base de données de structure des protéines AlphaFold & Ressources publiques
- Navigation dans l'AFDB : couverture des organismes, qualité des structures, formats de téléchargement (PDB/mmCIF, fichiers non relaxés/pLDDT)
- Recoupement de l'AFDB avec UniProt, PDB et bases de données fonctionnelles (GO, KEGG, CATH)
- Gestion des jeux de données à grande échelle : limites de prédiction par lots, guidelines de citation et licences de données
- Exercice pratique :
Interprétation des prédictions d'AlphaFold & Métriques de confiance
- Lecture des cartes thermiques pLDDT : identification des cœurs structurés, des régions désordonnées et des domaines à faible confiance
- Décodage des matrices PAE : détection des limites de domaines, des interactions intra/inter-chaines et des régions potentielles de mauvais repliement
- Lorsque les prédictions sont fiables : couverture des séquences, profondeur évolutionnaire et homologues structuraux connus
- Exercice pratique : évaluation des sorties pLDDT/PAE pour une protéine multi-domaine, signalement des régions à faible confiance et planification des cibles de mutagenèse/validation
Code source ouvert d'AlphaFold & Voies de personnalisation
- Structure du référentiel : modules principaux, pipelines de données et fichiers de configuration
- Modification des entrées : MSA personnalisés, remplacement des modèles et ajustement des seuils de confiance
- Optimisation des performances : réduction du temps d'exécution, gestion de la mémoire et sauvegarde des points de contrôle (checkpoints)
- Laboratoire pratique :
Cas d'utilisation d'AlphaFold dans la recherche biologique & Intégration expérimentale
- Guidage de la mutagenèse, de la cristallisation et de la planification des grilles en cryo-MET (cryo-EM) à l'aide de modèles prédits
- Annotation fonctionnelle : cartographie des sites actifs, préparation du docking de ligands et prédiction des interfaces
- Limitations & vérification : lorsque faire confiance aux prédictions, lorsque valider expérimentalement et pièges courants
- Atelier :
Résumé, application phare (Capstone) & Prochaines étapes
- Consolidation des concepts clés : architecture, interprétation et déploiement pratique
- Projet final :
- Questions ouvertes, dépannage des erreurs courantes et distribution des ressources
- Prochaines étapes : intégration avancée d'AlphaFold3, RoseTTAFold, trRosetta et outils communautaires en cours de développement
Pré requis
- Connaissances et compréhension des structures des protéines
- Une familiarité avec les concepts fondamentaux de la biologie moléculaire (séquences d'acides aminés, principes de repliement, formats PDB/mmCIF) est recommandée
- Aisance dans la navigation sur des cahiers (notebooks) web et l'exécution de cellules de code dans un navigateur
Public cible
- Biologistes, chercheurs en biologie moléculaire et enquêteurs en biologie structurale
- Chercheurs expérimentaux cherchant des prédictions de structure computationnelles pour guider les flux de travail en laboratoire (wet-lab)
- Professionnels des sciences de la vie intégrant la modélisation assistée par l'IA dans la formulation d'hypothèses et la conception expérimentale
7 Heures