Formation Jupyter pour les équipes de science des données
Jupyter est un environnement IDE et de calcul interactif, open-source et basé sur le web.
Cette formation animée par un instructeur (en ligne ou sur site) présente le concept de développement collaboratif en science des données et démontre comment utiliser Jupyter pour suivre et participer en équipe au « cycle de vie d'une idée computationnelle ». Elle accompagne les participants dans la création d'un projet pilote de science des données basé sur l'écosystème Jupyter.
À la fin de cette formation, les participants seront capables de :
- Installer et configurer Jupyter, y compris la création et l'intégration d'un dépôt d'équipe sur Git.
- Utiliser les fonctionnalités de Jupyter telles que les extensions, les widgets interactifs, le mode multi-utilisateurs et plus encore pour faciliter la collaboration de projet.
- Créer, partager et organiser des Notebooks Jupyter avec les membres de l'équipe.
- Choisir parmi Scala, Python et R pour écrire et exécuter du code contre des systèmes de big data tels qu'Apache Spark, le tout via l'interface Jupyter.
Format du cours
- Conférences interactives et discussions.
- De nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Le Notebook Jupyter prend en charge plus de 40 langages, dont R, Python, Scala, Julia, etc. Pour personnaliser ce cours selon vos langages de prédilection, veuillez nous contacter pour en convenir.
Plan du cours
Introduction à Jupyter
- Aperçu de Jupyter et de son écosystème
- Installation et configuration
- Configuration de Jupyter pour la collaboration d'équipe
Fonctionnalités collaboratives
- Utilisation de Git pour le contrôle de version
- Extensions et widgets interactifs
- Mode multi-utilisateurs
Création et gestion des Notebooks
- Structure et fonctionnalité des Notebooks
- Partage et organisation des Notebooks
- Meilleures pratiques pour la collaboration
Programmation avec Jupyter
- Choix et utilisation des langages de programmation (Python, R, Scala)
- Écriture et exécution de code
- Intégration avec les systèmes de big data (Apache Spark)
Fonctionnalités avancées de Jupyter
- Personnalisation de l'environnement Jupyter
- Automatisation des flux de travail avec Jupyter
- Exploration de cas d'utilisation avancés
Sessions pratiques
- Labs pratiques
- Projets de science des données réalistes
- Exercices de groupe et revues par les pairs
Résumé et prochaines étapes
Pré requis
- Expérience en programmation avec des langages tels que Python, R, Scala, etc.
- Une formation en science des données
Public cible
- Équipes de science des données
Cours à partir de 4 + personnes. Pour un entraînement individuel ou en petit groupe, veuillez demander un devis.
Formation Jupyter pour les équipes de science des données - Réservation
Formation Jupyter pour les équipes de science des données - Demande de renseignements
Jupyter pour les équipes de science des données - Demande d'informations consulting
Nos clients témoignent (1)
C'est excellent d'avoir le cours sur mesure pour les domaines clés que j'ai soulignés dans le questionnaire pré-cours. Cela aide vraiment à aborder mes questions sur la matière et à s'aligner avec mes objectifs d'apprentissage.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
Traduction automatique
Cours à venir
Cours Similaires
Introduction à la science des données et à l'IA avec Python
35 HeuresPlongez dans des approches pratiques de la science des données et de l'IA en utilisant Python — donne aux professionnels les compétences nécessaires pour explorer les données, construire des modèles d'apprentissage automatique et déployer des applications pilotées par l'IA dans des contextes commerciaux. Couvre les workflows CRISP-DM, l'analyse statistique, l'apprentissage supervisé et non supervisé, l'apprentissage profond avec TensorFlow, le traitement du langage naturel (NLP), le Big Data avec Spark, ainsi que la narration basée sur les données ; Idéal pour les débutants cherchant une certification en science des données avec Python et une formation en analyse orientée carrière.
Apache Airflow pour la science des données : Automatiser les pipelines d'apprentissage automatique
21 HeuresCette formation en direct dirigée par un instructeur à Canada (en ligne ou en présentiel) s'adresse à des participants de niveau intermédiaire souhaitant automatiser et gérer des flux de travail d'apprentissage automatique, y compris l'entraînement, la validation et le déploiement de modèles à l'aide d'Apache Airflow.
À la fin de cette formation, les participants seront capables de :
- Configurer Apache Airflow pour l'orchestration de flux de travail d'apprentissage automatique.
- Automatiser le prétraitement des données, l'entraînement des modèles et les tâches de validation.
- Intégrer Airflow avec des frameworks et des outils d'apprentissage automatique.
- Déployer des modèles d'apprentissage automatique à l'aide de pipelines automatisés.
- Surveiller et optimiser les flux de travail d'apprentissage automatique en environnement de production.
Écosystème Anaconda pour les scientifiques des données
14 HeuresCette formation en direct, animée par un instructeur à Canada (en ligne ou sur site), s'adresse aux scientifiques des données souhaitant utiliser l'écosystème Anaconda pour capturer, gérer et déployer des packages et des flux de travail d'analyse de données au sein d'une plateforme unique.
À l'issue de cette formation, les participants seront capables de :
- Installer et configurer les composants et bibliothèques d'Anaconda.
- Comprendre les concepts fondamentaux, les fonctionnalités et les avantages d'Anaconda.
- Gérer les packages, les environnements et les canaux à l'aide d'Anaconda Navigator.
- Utiliser les packages Conda, R et Python pour la science des données et l'apprentissage automatique.
- Découvrir des cas d'utilisation pratiques et des techniques pour gérer plusieurs environnements de données.
AWS Cloud9 pour la science des données
28 HeuresCette formation en présentiel ou en ligne à Canada s'adresse aux scientifiques des données et aux analystes de niveau intermédiaire souhaitant utiliser AWS Cloud9 pour optimiser leurs flux de travail de science des données.
À la fin de cette formation, les participants seront capables de :
- Configurer un environnement de science des données dans AWS Cloud9.
- Effectuer des analyses de données en utilisant Python, R et Jupyter Notebook dans Cloud9.
- Intégrer AWS Cloud9 avec des services de données AWS tels que S3, RDS et Redshift.
- Utiliser AWS Cloud9 pour le développement et le déploiement de modèles d'apprentissage automatique.
- Optimiser les flux de travail basés sur le cloud pour l'analyse et le traitement des données.
Introduction à Google Colab pour la science des données
14 HeuresCette formation en direct, animée par un formateur, à Canada (en ligne ou sur place), s'adresse aux scientifiques des données et aux professionnels des TI débutants qui souhaitent apprendre les fondamentaux de la science des données à l'aide de Google Colab.
À la fin de cette formation, les participants seront en mesure de :
- Configurer et naviguer dans Google Colab.
- Écrire et exécuter du code Python de base.
- Importer et manipuler des ensembles de données.
- Créer des visualisations à l'aide de bibliothèques Python.
Les fondamentaux de la science des données pour les professionnels du marketing et des ventes
21 HeuresCe cours s'adresse aux professionnels du marketing et des ventes qui souhaitent approfondir l'application de la science des données dans leurs domaines respectifs. Il offre une couverture détaillée des différentes techniques de science des données utilisées pour l'« upselling », le « cross-selling », la segmentation du marché, le branding et la valeur à vie du client (CLV).
Différence entre le marketing et les ventes - En quoi les ventes et le marketing sont-ils distincts ?
En termes très simples, on peut définir les ventes comme un processus qui se concentre ou vise les individus ou de petits groupes. Le marketing, quant à lui, cible un groupe plus large ou le grand public. Le marketing inclut la recherche (identification des besoins du client), le développement de produits (création de produits innovants) et la promotion du produit (par le biais de publicités) afin de créer une prise de conscience du produit parmi les consommateurs. En cela, le marketing consiste à générer des leads ou des prospects. Une fois le produit mis sur le marché, il incombe au commercial de persuader le client d'acheter le produit. Les ventes signifient convertir les leads ou prospects en achats et commandes, tandis que le marketing vise des objectifs à long terme, contrairement aux ventes qui relèvent d'objectifs à court terme.
Kaggle
14 HeuresCe cours en direct, dispensé par un formateur dans Canada (en ligne ou en présentiel), s’adresse aux scientifiques des données et aux développeurs souhaitant apprendre et développer leur carrière en science des données à l’aide de Kaggle.
À la fin de cette formation, les participants seront en mesure de :
- Se familiariser avec la science des données et l’apprentissage automatique.
- Explorer l’analyse des données.
- Comprendre Kaggle et son fonctionnement.
Data Science avec la plate-forme KNIME Analytics
21 HeuresKNIME Analytics Platform est une solution open source de premier plan pour l'innovation axée sur les données, vous aidant à découvrir le potentiel caché dans vos données, à extraire de nouvelles informations ou à prédire de futurs scénarios. Avec plus de 1 000 modules, des centaines d'exemples prêts à l'emploi, une gamme complète d'outils intégrés et le plus large choix d'algorithmes avancés disponibles, KNIME Analytics Platform est la boîte à outils parfaite pour tout data scientist et analyste commercial.
Ce cours sur KNIME Analytics Platform est une occasion idéale pour les débutants, les utilisateurs avancés et les experts KNIME de découvrir l'outil, d'apprendre à l'utiliser plus efficacement et à créer des rapports clairs et complets basés sur des flux de travail KNIME.
Cette formation animée par un instructeur (en ligne ou sur site) s'adresse aux professionnels des données qui souhaitent utiliser KNIME pour répondre à des besoins commerciaux complexes.
Elle cible un public ne connaissant pas la programmation et souhaitant utiliser des outils de pointe pour mettre en œuvre des scénarios analytiques.
À la fin de cette formation, les participants seront capables de :
- Installer et configurer KNIME.
- Construire des scénarios de Data Science
- Former, tester et valider des modèles
- Mettre en œuvre la chaîne de valeur complète des modèles de Data Science
Format du cours
- Conférences interactives et discussions.
- De nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours ou en savoir plus sur ce programme, veuillez nous contacter pour organiser cela.
Apprentissage automatique pour la science des données avec Python
21 HeuresCette formation en direct, animée par un instructeur à <lieu> (en ligne ou sur site), s'adresse aux analystes de données et aux développeurs de niveau intermédiaire, ainsi qu'aux futurs scientifiques des données qui souhaitent appliquer des techniques d'apprentissage automatique en Python pour extraire des informations, effectuer des prédictions et automatiser des décisions basées sur les données.
À la fin de ce cours, les participants seront en mesure de :
- Comprendre et distinguer les principaux paradigmes de l'apprentissage automatique.
- Explorer les techniques de prétraitement des données et les métriques d'évaluation des modèles.
- Appliquer des algorithmes d'apprentissage automatique pour résoudre des problèmes de données concrets.
- Utiliser les bibliothèques Python et les cahiers Jupyter pour le développement pratique.
- Construire des modèles pour la prédiction, la classification, la recommandation et le regroupement.
Introduction aux modèles pré-entraînés
14 HeuresCette formation en direct animée par un formateur à Canada (en ligne ou sur site) s'adresse aux professionnels de niveau débutant qui souhaitent comprendre le concept des modèles pré-entraînés et apprendre à les appliquer pour résoudre des problèmes concrets, sans avoir à développer des modèles à partir de zéro.
À la fin de cette formation, les participants seront capables de :
- Comprendre le concept et les avantages des modèles pré-entraînés.
- Explorer différentes architectures de modèles pré-entraînés et leurs cas d'utilisation.
- Peaufiner (fine-tune) un modèle pré-entraîné pour des tâches spécifiques.
- Implémenter des modèles pré-entraînés dans de simples projets de machine learning.
Programmation Python pour la finance
35 HeuresPython est un langage de programmation qui a connu un immense succès dans l'industrie financière. Adopté par les plus grandes banques d'investissement et fonds de couverture, il est utilisé pour développer une vaste gamme d'applications financières, allant des programmes de trading de base aux systèmes de gestion des risques.
Lors de cette formation animée par un instructeur, les participants apprendront à utiliser Python pour développer des applications pratiques capables de résoudre divers problèmes spécifiques liés à la finance.
À l'issue de cette formation, les participants seront en mesure de :
- Comprendre les fondamentaux du langage de programmation Python
- Télécharger, installer et maintenir les meilleurs outils de développement pour créer des applications financières en Python
- Sélectionner et utiliser les packages Python et les techniques de programmation les plus adaptés pour organiser, visualiser et analyser des données financières provenant de diverses sources (CSV, Excel, bases de données, Web, etc.)
- Construire des applications qui résolvent des problèmes liés à l'allocation d'actifs, à l'analyse des risques, à la performance des investissements, et plus encore
- Dépanner, intégrer, déployer et optimiser une application Python
Public visé
- Développeurs
- Analistes
- Quants (analystes quantitatifs)
Format de la formation
- Partiellement théorique, partiellement axée sur la discussion, avec des exercices et une pratique intensive
Remarque
- Cette formation vise à proposer des solutions à certains des principaux problèmes rencontrés par les professionnels de la finance. Toutefois, si vous souhaitez aborder un sujet, un outil ou une technique spécifique en profondeur, veuillez nous contacter pour en convenir.
Data science GPU avec NVIDIA RAPIDS
14 HeuresCette formation en direct, dispensée par un instructeur, en <lieu> (en ligne ou sur site), s'adresse aux data scientists et aux développeurs souhaitant utiliser RAPIDS pour créer des pipelines de données accélérés par le GPU, des workflows et des visualisations, en appliquant des algorithmes de machine learning tels que XGBoost, cuML, etc.
À l'issue de cette formation, les participants seront en mesure de :
- Configurer l'environnement de développement nécessaire pour créer des modèles de données avec NVIDIA RAPIDS.
- Comprendre les fonctionnalités, les composants et les avantages de RAPIDS.
- Exploiter les GPUs pour accélérer les pipelines de données et d'analyse de bout en bout.
- Mettre en œuvre la préparation de données et l'ETL accélérés par le GPU avec cuDF et Apache Arrow.
- Apprendre à effectuer des tâches de machine learning avec les algorithmes XGBoost et cuML.
- Construire des visualisations de données et exécuter des analyses de graphes avec cuXfilter et cuGraph.