Formation Jupyter pour les équipes de science des données
Jupyter est un IDE interactif et un environnement informatique à code source ouvert, basé sur le web.
Cette formation en direct (en ligne ou sur site) présente l'idée du développement collaboratif en science des données et montre comment utiliser Jupyter pour suivre et participer en tant qu'équipe au "cycle de vie d'une idée informatique". Elle accompagne les participants dans la création d'un exemple de projet de science des données basé sur l'écosystème Jupyter.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer Jupyter, y compris la création et l'intégration d'un dépôt d'équipe sur Git.
- Utiliser les fonctionnalités de Jupyter telles que les extensions, les widgets interactifs, le mode multi-utilisateurs et plus encore pour permettre la collaboration au sein d'un projet.
- Créer, partager et organiser des Notebooks Jupyter avec les membres de l'équipe.
- Choisir parmi Scala, Python, R, pour écrire et exécuter du code contre des systèmes de big data tels que Apache Spark, le tout à travers l'interface Jupyter.
Format du cours
- Exposé et discussion interactifs.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement live-lab.
Options de personnalisation du cours
- Le Jupyter Notebook supporte plus de 40 langages dont R, Python, Scala, Julia, etc. Pour adapter ce cours au(x) langage(s) de votre choix, veuillez nous contacter.
Plan du cours
Introduction à Jupyter
- Présentation de Jupyter et de son écosystème
- Installation et configuration
- Configurer Jupyter pour la collaboration en équipe
Fonctionnalités de collaboration
- Utilisation de Git pour le contrôle de version
- Extensions et widgets interactifs
- Mode multi-utilisateurs
Création et gestion des blocs-notes
- Structure et fonctionnalité des carnets de notes
- Partage et organisation des carnets de notes
- Meilleures pratiques de collaboration
Programming avec Jupyter
- Choisir et utiliser des langages de programmation (Python, R, Scala)
- Écrire et exécuter du code
- Intégration avec les systèmes big data (Apache Spark)
Fonctionnalités avancées de Jupyter
- Personnaliser l'environnement Jupyter
- Automatiser les flux de travail avec Jupyter
- Explorer les cas d'utilisation avancés
Sessions pratiques
- Laboratoires pratiques
- Projets de science des données dans le monde réel
- Exercices de groupe et évaluations par les pairs
Résumé et prochaines étapes
Pré requis
- Une expérience de Programming dans des langages tels que Python, R, Scala, etc.
- Une formation en science des données
Audience
- Équipes de science des données
Cours à partir de 4 + personnes. Pour un entraînement individuel ou en petit groupe, veuillez demander un devis.
Formation Jupyter pour les équipes de science des données - Réservation
Formation Jupyter pour les équipes de science des données - Demande de renseignements
Jupyter pour les équipes de science des données - Demande d'informations consulting
Nos clients témoignent (1)
C'est excellent d'avoir le cours sur mesure pour les domaines clés que j'ai soulignés dans le questionnaire pré-cours. Cela aide vraiment à aborder mes questions sur la matière et à s'aligner avec mes objectifs d'apprentissage.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
Traduction automatique
Cours à venir
Cours Similaires
Introduction à la science des données et à l'IA avec Python
35 HeuresIl s'agit d'une introduction de 5 jours à la science des données et à l'intelligence artificielle (IA).
Le cours est dispensé avec des exemples et des exercices utilisant Python
Apache Airflow pour Data Science: Automatisation des pipelines
21 HeuresCette formation dirigée par un instructeur, en ligne ou sur site à Canada, est destinée aux participants de niveau intermédiaire qui souhaitent automatiser et gérer des workflows d'apprentissage automatique, y compris l'entraînement, la validation et le déploiement de modèles, en utilisant Apache Airflow.
À la fin de cette formation, les participants seront en mesure de :
- Configurer Apache Airflow pour l'orchestration des workflows d'apprentissage automatique.
- Automatiser les tâches de prétraitement des données, d'entraînement et de validation des modèles.
- Intégrer Airflow avec des frameworks et outils d'apprentissage automatique.
- Déployer des modèles d'apprentissage automatique en utilisant des pipelines automatisés.
- Surveiller et optimiser les workflows d'apprentissage automatique en production.
Anaconda Ecosystem pour les Scientifiques des Données
14 HeuresCette formation en direct avec instructeur en Canada (en ligne ou sur site) s'adresse aux data scientists qui souhaitent utiliser l'écosystème Anaconda pour capturer, gérer et déployer des packages et des workflows d'analyse de données dans une plateforme unique.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer les composants et les bibliothèques Anaconda.
- Comprendre les concepts de base, les fonctionnalités et les avantages de Anaconda.
- Gérer les paquets, les environnements et les canaux à l'aide du Anaconda Navigator.
- Utiliser Conda, R et les paquets Python pour la science des données et l'apprentissage automatique.
- Connaître des cas d'utilisation pratiques et des techniques pour gérer des environnements de données multiples.
AWS Cloud9 pour Data Science
28 HeuresCette formation dirigée par un instructeur, en ligne ou sur site à Canada, est destinée aux scientifiques de données et aux analystes de niveau intermédiaire qui souhaitent utiliser AWS Cloud9 pour des flux de travail optimisés en science des données.
À la fin de cette formation, les participants seront capables de :
- Configurer un environnement de science des données dans AWS Cloud9.
- Effectuer des analyses de données en utilisant Python, R et Jupyter Notebook dans Cloud9.
- Intégrer AWS Cloud9 avec les services de données AWS tels que S3, RDS et Redshift.
- Utiliser AWS Cloud9 pour le développement et le déploiement de modèles d'apprentissage automatique.
- Optimiser les flux de travail basés sur le cloud pour l'analyse et le traitement des données.
Introduction à Google Colab pour la science des données
14 HeuresCette formation dirigée par un instructeur (en ligne ou en présentiel) est destinée aux data scientists et professionnels IT de niveau débutant qui souhaitent apprendre les bases de la science des données avec Google Colab.
À la fin de cette formation, les participants seront capables de :
- Configurer et naviguer dans Google Colab.
- Écrire et exécuter du code Python basique.
- Importer et gérer des ensembles de données.
- Créer des visualisations à l'aide de bibliothèques Python.
Une Introduction Pratique à la Science des Données
35 HeuresLes participants qui terminent cette formation acquerront une compréhension pratique et concrète de la Science des Données ainsi que de ses technologies, méthodologies et outils associés.
Les participants auront l'opportunité d'appliquer ces connaissances en pratique à travers des exercices pratiques. L'interaction en groupe et les commentaires de l'instructeur constituent une composante importante de la formation.
Le cours commence par une introduction aux concepts élémentaires de la Science des Données, puis progresse vers les outils et méthodologies utilisés en Science des Données.
Public cible
- Développeurs
- Analystes techniques
- Consultants en TI
Format du cours
- Partiellement théorique, partiellement discuté, avec des exercices et une pratique intensive en laboratoire
Note
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Science des données pour l'analyse de big data
35 HeuresLes données volumineuses sont des ensembles de données si volumineux et complexes qu'un logiciel de traitement de données traditionnel ne permet pas de les traiter. Les défis du Big Data incluent la capture, le stockage, l'analyse, la recherche, le partage, le transfert, la visualisation, l'interrogation, la mise à jour et la confidentialité des informations.
Science des données essentielle pour les professionnels du Marketing/ventes
21 HeuresCe cours est destiné aux professionnels du marketing et des ventes qui souhaitent approfondir l'application de la data science dans le marketing et les ventes. Le cours couvre en détail différentes techniques de data science utilisées pour le "up-selling", le "cross-selling", la segmentation de marché, le branding et la valeur à vie du client (CLV).
Différence entre Marketing et Ventes - En quoi les ventes et le marketing sont-ils différents ?
Pour simplifier, on peut dire que les ventes se concentrent sur des individus ou de petits groupes. Le marketing, quant à lui, vise un groupe plus large ou le public en général. Le marketing inclut la recherche (identification des besoins du client), le développement de produits (création de produits innovants) et la promotion du produit (par le biais de publicités) pour créer une prise de conscience du produit parmi les consommateurs. Ainsi, le marketing signifie la génération de leads ou de prospects. Une fois que le produit est sur le marché, c'est au vendeur de persuader le client d'acheter le produit. Les ventes consistent à convertir les leads en achats et commandes, tandis que le marketing a des objectifs à long terme, alors que les ventes sont liées à des objectifs à court terme.
Introduction à la science des données
35 HeuresCette formation dirigée par un instructeur (en ligne ou sur place) est destinée aux professionnels souhaitant débuter une carrière en science des données.
À la fin de cette formation, les participants seront capables de :
- Installer et configurer Python et MySql.
- Comprendre ce qu'est la science des données et comment elle peut ajouter de la valeur à pratiquement toute entreprise.
- Apprendre les bases du codage en Python
- Apprendre les techniques d'apprentissage automatique supervisé et non supervisé, ainsi que leur mise en œuvre et l'interprétation des résultats.
Format du cours
- Cours interactif avec discussion.
- Nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Kaggle
14 HeuresCette formation en Canada (en ligne ou sur site) est destinée aux data scientists et aux développeurs qui souhaitent apprendre et développer leur carrière dans Data Science en utilisant Kaggle.
A l'issue de cette formation, les participants seront capables de :
- S'informer sur la science des données et l'apprentissage automatique.
- Explorer l'analyse des données.
- En savoir plus sur Kaggle et son fonctionnement.
Data Science avec la Plateforme KNIME Analytics
21 HeuresLa Plateforme KNIME Analytics est une option open source de premier plan pour l'innovation axée sur les données, vous aidant à découvrir le potentiel caché dans vos données, à creuser pour trouver de nouvelles perspectives ou à prédire des futurs innovants. Avec plus de 1000 modules, des centaines d'exemples prêt-à-l'emploi, une gamme complète d'outils intégrés et le choix le plus vaste d'algorithmes avancés disponibles, la Plateforme KNIME Analytics est l'outil parfait pour tout data scientist et analyste d'affaires.
Ce cours sur la Plateforme KNIME Analytics est une occasion idéale pour les débutants, les utilisateurs avancés et les experts de KNIME de se familiariser avec KNIME, d'apprendre à l'utiliser plus efficacement, et de créer des rapports clairs et complets basés sur les workflows KNIME.
Cette formation encadrée par un instructeur (en ligne ou sur site) est destinée aux professionnels des données souhaitant utiliser KNIME pour répondre à des besoins d'affaires complexes.
Elle est adressée à un public qui ne connaît pas la programmation et qui souhaite utiliser des outils de pointe pour mettre en œuvre des scénarios d'analyse.
À la fin de cette formation, les participants seront capables de :
- Installer et configurer KNIME.
- Construire des scénarios en Data Science
- Former, tester et valider les modèles
- Mettre en œuvre la chaîne de valeur complète des modèles de Data Science
Format du cours
- Conférence interactive et discussion.
- De nombreux exercices et pratiques.
- Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours ou en savoir plus sur ce programme, veuillez nous contacter pour organiser.
Fondamentaux de MATLAB, Sciences des Données et Génération de Rapports
35 HeuresDans la première partie de cette formation, nous couvrons les fondamentaux de MATLAB et sa fonction à la fois comme langage et comme plateforme. Cette discussion comprend une introduction à la syntaxe de MATLAB, aux tableaux et aux matrices, à la visualisation de données, au développement de scripts et aux principes orientés objet.
Dans la deuxième partie, nous montrons comment utiliser MATLAB pour l'exploration de données, l'apprentissage automatique et l'analyse prédictive. Pour donner aux participants une perspective claire et pratique de l'approche et de la puissance de MATLAB, nous établissons des comparaisons entre l'utilisation de MATLAB et l'utilisation d'autres outils tels que les tableurs, le C, C++ et Visual Basic.
Dans la troisième partie de la formation, les participants apprennent à rationaliser leur travail en automatisant le traitement des données et la génération de rapports.
Tout au long de la formation, les participants mettront en pratique les idées apprises au moyen d'exercices pratiques dans un environnement de laboratoire. À la fin de la formation, les participants auront une connaissance approfondie des capacités de MATLAB et seront en mesure de l'utiliser pour résoudre des problèmes réels de science des données ainsi que pour rationaliser leur travail grâce à l'automatisation.
Des évaluations seront effectuées tout au long du cours pour mesurer les progrès réalisés.
Format du cours
- Le cours comprend des exercices théoriques et pratiques, y compris des discussions de cas, l'inspection d'exemples de code, et la mise en œuvre pratique.
Remarque
- Les sessions pratiques seront basées sur des modèles de rapports de données préétablis. Si vous avez des besoins spécifiques, veuillez nous contacter pour convenir d'un arrangement.
Machine Learning pour Data Science avec Python
21 HeuresCette formation en direct, animée par un formateur (en ligne ou sur site) s'adresse aux analystes de données intermédiaires, développeurs ou futurs scientifiques des données qui souhaitent appliquer les techniques d'apprentissage automatique dans Python pour extraire des insights, faire des prédictions et automatiser les décisions basées sur les données.
À la fin de cette formation, les participants seront capables de :
- Comprendre et différencier les principaux paradigmes d'apprentissage automatique.
- Explorer les techniques de prétraitement des données et les métriques d'évaluation des modèles.
- Appliquer des algorithmes d'apprentissage automatique pour résoudre des problèmes de données du monde réel.
- Utiliser les bibliothèques Python et les carnets Jupyter pour le développement pratique.
- Construire des modèles pour la prédiction, la classification, la recommandation et le regroupement.
Accélération des Flux de Travail Python Pandas avec Modin
14 HeuresCette formation en direct avec instructeur dans Canada (en ligne ou sur site) est destinée aux scientifiques des données et aux développeurs qui souhaitent utiliser Modin pour construire et mettre en œuvre des calculs parallèles avec Pandas afin d'accélérer l'analyse des données.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement nécessaire pour commencer à développer des flux de travail Pandas à l'échelle avec Modin.
- Comprendre les caractéristiques, l'architecture et les avantages de Modin.
- Connaître les différences entre Modin, Dask et Ray.
- Effectuer des opérations Pandas plus rapidement avec Modin.
- Mettre en œuvre l'ensemble de l'API et des fonctions Pandas.
Science des Données avec GPU et NVIDIA RAPIDS
14 HeuresCette formation dirigée par un instructeur (en ligne ou sur site) est destinée aux scientifiques des données et développeurs qui souhaitent utiliser RAPIDS pour créer des pipelines de données, des workflows et des visualisations accélérés par GPU, en appliquant des algorithmes d'apprentissage automatique tels que XGBoost, cuML, etc.
À la fin de cette formation, les participants seront capables de :
- Configurer l'environnement de développement nécessaire pour créer des modèles de données avec NVIDIA RAPIDS.
- Comprendre les fonctionnalités, les composants et les avantages de RAPIDS.
- Tirer parti des GPU pour accélérer les pipelines de données et d'analyse de bout en bout.
- Implémenter la préparation de données et l'ETL accélérés par GPU avec cuDF et Apache Arrow.
- Apprendre à effectuer des tâches d'apprentissage automatique avec les algorithmes XGBoost et cuML.
- Créer des visualisations de données et exécuter des analyses graphiques avec cuXfilter et cuGraph.