Formation Jupyter for Data Science Teams
Jupyter est un IDE interactif et un environnement informatique à code source ouvert, basé sur le web.
Cette formation en direct (en ligne ou sur site) présente l'idée du développement collaboratif en science des données et montre comment utiliser Jupyter pour suivre et participer en tant qu'équipe au "cycle de vie d'une idée informatique". Elle accompagne les participants dans la création d'un exemple de projet de science des données basé sur l'écosystème Jupyter.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer Jupyter, y compris la création et l'intégration d'un dépôt d'équipe sur Git.
- Utiliser les fonctionnalités de Jupyter telles que les extensions, les widgets interactifs, le mode multi-utilisateurs et plus encore pour permettre la collaboration au sein d'un projet.
- Créer, partager et organiser des Notebooks Jupyter avec les membres de l'équipe.
- Choisir parmi Scala, Python, R, pour écrire et exécuter du code contre des systèmes de big data tels que Apache Spark, le tout à travers l'interface Jupyter.
Format du cours
- Exposé et discussion interactifs.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement live-lab.
Options de personnalisation du cours
- Le Jupyter Notebook supporte plus de 40 langages dont R, Python, Scala, Julia, etc. Pour adapter ce cours au(x) langage(s) de votre choix, veuillez nous contacter.
Plan du cours
Introduction à Jupyter
- Présentation de Jupyter et de son écosystème
- Installation et configuration
- Configurer Jupyter pour la collaboration en équipe
Fonctionnalités de collaboration
- Utilisation de Git pour le contrôle de version
- Extensions et widgets interactifs
- Mode multi-utilisateurs
Création et gestion des blocs-notes
- Structure et fonctionnalité des carnets de notes
- Partage et organisation des carnets de notes
- Meilleures pratiques de collaboration
Programming avec Jupyter
- Choisir et utiliser des langages de programmation (Python, R, Scala)
- Écrire et exécuter du code
- Intégration avec les systèmes big data (Apache Spark)
Fonctionnalités avancées de Jupyter
- Personnaliser l'environnement Jupyter
- Automatiser les flux de travail avec Jupyter
- Explorer les cas d'utilisation avancés
Sessions pratiques
- Laboratoires pratiques
- Projets de science des données dans le monde réel
- Exercices de groupe et évaluations par les pairs
Résumé et prochaines étapes
Pré requis
- Une expérience de Programming dans des langages tels que Python, R, Scala, etc.
- Une formation en science des données
Audience
- Équipes de science des données
Les formations ouvertes requièrent plus de 3 participants.
Formation Jupyter for Data Science Teams - Booking
Formation Jupyter for Data Science Teams - Enquiry
Jupyter for Data Science Teams - Demande d'informations consulting
Demande d'informations consulting
Nos clients témoignent (1)
C'est formidable que le cours soit personnalisé aux domaines clés que j'ai soulignés dans le questionnaire préparatoire. Cela aide vraiment à répondre à mes questions sur le sujet et à me conformer à mes objectifs d'apprentissage.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
Traduction automatique
Cours à venir
Cours Similaires
Introduction to Data Science and AI using Python
35 HeuresIl s'agit d'une introduction de 5 jours à Data Science et à l'IA.
Le cours est livré avec des exemples et des exercices utilisant Python
Anaconda Ecosystem for Data Scientists
14 HeuresCette formation en direct avec instructeur en Canada (en ligne ou sur site) s'adresse aux data scientists qui souhaitent utiliser l'écosystème Anaconda pour capturer, gérer et déployer des packages et des workflows d'analyse de données dans une plateforme unique.
A la fin de cette formation, les participants seront capables de :
- Installer et configurer les composants et les bibliothèques Anaconda.
- Comprendre les concepts de base, les fonctionnalités et les avantages de Anaconda.
- Gérer les paquets, les environnements et les canaux à l'aide du Anaconda Navigator.
- Utiliser Conda, R et les paquets Python pour la science des données et l'apprentissage automatique.
- Connaître des cas d'utilisation pratiques et des techniques pour gérer des environnements de données multiples.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 HeuresRésumé
Les fournisseurs de services (CSP) sont confrontés à une pression pour réduire les coûts et maximiser le revenu moyen par utilisateur (ARPU), tout en assurant une excellente expérience client, mais les volumes de données continuent de croître. Le trafic mondial de données mobiles va croître à un taux de croissance annuel combiné (CAGR) de 78 % à 2016, atteignant 10,8 exabytes par mois.
Pendant ce temps, les CSP génèrent de grands volumes de données, y compris les enregistrements détaillés des appels (CDR), les données réseau et les données client. Les entreprises qui exploitent pleinement ces données gagnent une limite concurrentielle. Selon une récente enquête de The Economist Intelligence Unit, les entreprises qui utilisent la prise de décision basée sur les données bénéficient d’une augmentation de productivité de 5-6%. Cependant, 53% des entreprises n’utilisent que la moitié de leurs données précieuses, et un quart des répondants a noté que de vastes quantités de données utiles ne sont pas utilisées. Les volumes de données sont si élevés que l'analyse manuelle est impossible, et la plupart des systèmes logiciels héréditaires ne peuvent pas se maintenir, ce qui entraîne que les données précieuses sont déchirées ou ignorées.
Avec Big Data & Analytics’ logiciel de big data à grande vitesse, scalable, les CSPs peuvent miner tous leurs données pour une meilleure prise de décision en moins de temps. Différents Big Data produits et techniques fournissent une plate-forme logicielle end-to-end pour la collecte, la préparation, l'analyse et la présentation d'informations sur les grandes données. Les domaines d'application comprennent la surveillance des performances du réseau, la détection de fraudes, la détection du client et l'analyse du risque de crédit. Big Data & Scale des produits d'analyse pour gérer des terabytes de données mais la mise en œuvre de ces outils nécessite un nouveau type de système de base de données basé sur le cloud comme Hadoop ou un processeur de calcul parallèle à grande échelle (KPU, etc.)
Ce cours travaille sur Big Data BI pour Telco couvre toutes les nouvelles zones émergentes dans lesquelles les CSP investissent pour augmenter la productivité et ouvrir de nouveaux flux de revenus d'affaires. Le cours fournira une vue complète de 360 degrés sur Big Data BI à Telco afin que les décideurs et les gestionnaires puissent avoir un aperçu très large et complet des possibilités de Big Data BI à Telco pour la productivité et l'amélioration des revenus.
Objectifs du cours
L'objectif principal du cours est d'introduire de nouvelles Big Data techniques d'intelligence d'affaires dans 4 secteurs de Telecom Business (Marketing/Ventes, Opération réseau, Opération financière et Relation client Management). Les étudiants seront introduits à suivre :
- Introduction à Big Data-ce qui est 4Vs (volume, vitesse, variété et veracité) dans Big Data- Génération, extraction et gestion de la perspective Telco
- Comment Big Data l'analytique diffère de l'analytique des données d'héritage
- La justification intérieure de la Big Data -Telco perspective
- Introduction à Hadoop Écosystème- familiarité avec tous les Hadoop outils tels que Hive, Pig, SPARC – quand et comment ils sont utilisés pour résoudre Big Data problème
- Comment Big Data est extrait pour l'analyse pour les outils d'analyse-comment Business Analysis’s peuvent réduire leurs points de douleur de collecte et d'analyse des données grâce à une approche intégrée Hadoop de tableau de bord
- Introduction fondamentale de l'analyse Insight, de l'analyse de la visualisation et de l'analyse prédictive pour Telco
- L'analyse client Churn et Big Data-comment Big Data peut réduire l'analyse client Churn et l'insatisfaction des clients dans les études de cas Telco
- Analyse d'échecs réseau et d'échecs de service à partir des méta-data réseau et IPDR
- Analyse financière-fraude, fraude et estimation du ROI à partir des ventes et des données opérationnelles
- Problème d'acquisition client-Marketing cible, segmentation client et cross-sales à partir des données de vente
- Introduction et résumé de tous Big Data produits d'analyse et où ils s'adaptent à l'espace d'analyse Telco
- Conclusion-comment prendre une approche étape par étape pour introduire Big Data Business Intelligence dans votre organisation
Audience cible
- Opération réseau, gestionnaires financiers, gestionnaires CRM et gestionnaires informatiques de premier plan dans le bureau du CIO de Telco.
- Business Analystes à Telco
- Gestionnaire de bureau / analystes
- gestionnaires opérationnels
- Général QA
A Practical Introduction to Data Science
35 HeuresLes participants qui suivent cette formation acquièrent une compréhension pratique et concrète du Data Science et des technologies, méthodologies et outils qui y sont associés.
Les participants auront l'occasion de mettre en pratique ces connaissances par le biais d'exercices pratiques. L'interaction en groupe et le retour d'information de l'instructeur constituent une composante importante du cours.
Le cours commence par une introduction aux concepts élémentaires de Data Science, puis progresse vers les outils et méthodologies utilisés dans Data Science.
Public
- Développeurs
- Analystes techniques
- Consultants en informatique
Format du cours
- En partie conférence, en partie discussion, exercices et pratique intensive.
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter.
Data Science for Big Data Analytics
35 HeuresLes données volumineuses sont des ensembles de données si volumineux et complexes qu'un logiciel de traitement de données traditionnel ne permet pas de les traiter. Les défis du Big Data incluent la capture, le stockage, l'analyse, la recherche, le partage, le transfert, la visualisation, l'interrogation, la mise à jour et la confidentialité des informations.
Data Science essential for Marketing/Sales professionals
21 HeuresCe cours est destiné aux Marketing professionnels de la vente qui souhaitent approfondir l'application de la science des données dans Marketing/Ventes. Le cours fournit une couverture détaillée des différentes techniques de science des données utilisées pour la « vente incitative », la « vente croisée », la segmentation du marché, le branding et le CLV.
Différence de Marketing et ventes – En quoi les ventes et le marketing sont-ils différents ?
En termes très simples, les ventes peuvent être décrites comme un processus qui se concentre ou cible des individus ou de petits groupes. Marketing s'adresse en revanche à un groupe plus large ou au grand public. Marketing comprend la recherche (identification des besoins du client), le développement de produits (production de produits innovants) et la promotion du produit (par le biais de publicités) et la sensibilisation au produit auprès des consommateurs. En tant que tel, le marketing signifie générer des prospects ou des prospects. Une fois le produit mis sur le marché, il incombe au vendeur de persuader le client d’acheter le produit. Les ventes consistent à convertir les leads ou les prospects en achats et en commandes, tandis que le marketing vise des termes plus longs, tandis que les ventes concernent des objectifs plus courts.
Introduction to Data Science
35 HeuresCette formation dirigée par un instructeur en direct (sur site ou à distance) s'adresse aux professionnels qui souhaitent débuter une carrière en Data Science .
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez Python et MySql.
- Comprenez ce qu'est Data Science et comment elle peut ajouter de la valeur à pratiquement n'importe quelle entreprise.
- Apprenez les bases du codage en Python
- Apprenez les techniques de Machine Learning supervisées et non supervisées, et comment les mettre en œuvre et interpréter les résultats.
Format du cours
- Conférence et discussion interactives.
- Beaucoup d'exercices et de pratique.
- Implémentation pratique dans un environnement de laboratoire en direct.
Options de personnalisation des cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Kaggle
14 HeuresCette formation en Canada (en ligne ou sur site) est destinée aux data scientists et aux développeurs qui souhaitent apprendre et développer leur carrière dans Data Science en utilisant Kaggle.
A l'issue de cette formation, les participants seront capables de :
- S'informer sur la science des données et l'apprentissage automatique.
- Explorer l'analyse des données.
- En savoir plus sur Kaggle et son fonctionnement.
MATLAB Fundamentals, Data Science & Report Generation
35 HeuresDans la première partie de cette formation, nous couvrons les fondamentaux de MATLAB et sa fonction à la fois comme langage et comme plateforme. Cette discussion comprend une introduction à la syntaxe de MATLAB, aux tableaux et aux matrices, à la visualisation de données, au développement de scripts et aux principes orientés objet.
Dans la deuxième partie, nous montrons comment utiliser MATLAB pour l'exploration de données, l'apprentissage automatique et l'analyse prédictive. Pour donner aux participants une perspective claire et pratique de l'approche et de la puissance de MATLAB, nous établissons des comparaisons entre l'utilisation de MATLAB et l'utilisation d'autres outils tels que les tableurs, le C, C++ et Visual Basic.
Dans la troisième partie de la formation, les participants apprennent à rationaliser leur travail en automatisant le traitement des données et la génération de rapports.
Tout au long de la formation, les participants mettront en pratique les idées apprises au moyen d'exercices pratiques dans un environnement de laboratoire. À la fin de la formation, les participants auront une connaissance approfondie des capacités de MATLAB et seront en mesure de l'utiliser pour résoudre des problèmes réels de science des données ainsi que pour rationaliser leur travail grâce à l'automatisation.
Des évaluations seront effectuées tout au long du cours pour mesurer les progrès réalisés.
Format du cours
- Le cours comprend des exercices théoriques et pratiques, y compris des discussions de cas, l'inspection d'exemples de code, et la mise en œuvre pratique.
Remarque
- Les sessions pratiques seront basées sur des modèles de rapports de données préétablis. Si vous avez des besoins spécifiques, veuillez nous contacter pour convenir d'un arrangement.
Machine Learning for Data Science with Python
21 HeuresCette formation en direct, animée par un formateur (en ligne ou sur site) s'adresse aux analystes de données intermédiaires, développeurs ou futurs scientifiques des données qui souhaitent appliquer les techniques d'apprentissage automatique dans Python pour extraire des insights, faire des prédictions et automatiser les décisions basées sur les données.
À la fin de cette formation, les participants seront capables de :
- Comprendre et différencier les principaux paradigmes d'apprentissage automatique.
- Explorer les techniques de prétraitement des données et les métriques d'évaluation des modèles.
- Appliquer des algorithmes d'apprentissage automatique pour résoudre des problèmes de données du monde réel.
- Utiliser les bibliothèques Python et les carnets Jupyter pour le développement pratique.
- Construire des modèles pour la prédiction, la classification, la recommandation et le regroupement.
Accelerating Python Pandas Workflows with Modin
14 HeuresCette formation en direct avec instructeur dans Canada (en ligne ou sur site) est destinée aux scientifiques des données et aux développeurs qui souhaitent utiliser Modin pour construire et mettre en œuvre des calculs parallèles avec Pandas afin d'accélérer l'analyse des données.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement nécessaire pour commencer à développer des flux de travail Pandas à l'échelle avec Modin.
- Comprendre les caractéristiques, l'architecture et les avantages de Modin.
- Connaître les différences entre Modin, Dask et Ray.
- Effectuer des opérations Pandas plus rapidement avec Modin.
- Mettre en œuvre l'ensemble de l'API et des fonctions Pandas.
Python Programming for Finance
35 HeuresPython est un langage de programmation qui a acquis une énorme popularité dans le secteur financier. Adopté par les plus grandes banques d’investissement et les hedge funds, il est utilisé pour créer un large éventail d’applications financières allant des programmes de négociation centraux aux systèmes de gestion des risques.
Dans cette formation en direct animée par un instructeur, les participants apprendront à utiliser Python pour développer des applications pratiques permettant de résoudre un certain nombre de problèmes spécifiques liés à la finance.
À la fin de cette formation, les participants seront en mesure de:
- Comprendre les fondamentaux du langage de programmation Python
- Télécharger, installer et maintenir les meilleurs outils de développement pour créer des applications financières en Python
- Sélectionner et utiliser les packages et techniques de programmation Python les plus appropriés pour organiser, visualiser et analyser les données financières provenant de diverses sources (CSV, Excel, bases de données, web, etc.)
- Développer des applications qui résolvent des problèmes liés à l’allocation d’actifs, à l’analyse des risques, à la performance des investissements et plus encore
- Déboguer, intégrer, déployer et optimiser une application Python
Public
- Développeurs
- Analystes
- Quants
Format du cours
- Partie magistrale, partie discussion, exercices et pratique intensive
Remarque
- Cette formation vise à fournir des solutions à certains des principaux problèmes rencontrés par les professionnels de la finance. Cependant, si vous avez un sujet, un outil ou une technique particulier(ère) que vous souhaitez approfondir ou élaborer, n’hésitez pas à nous contacter pour en discuter.
Python in Data Science
35 HeuresLe cours d'entraînement aidera les participants à se préparer au développement d'applications Web en utilisant Python Programming avec Data Analytics. Une telle visualisation de données est un excellent outil pour Top Management dans la prise de décision.
Qlik Sense for Data Science
14 HeuresCette formation en direct avec instructeur à Canada (en ligne ou sur site) est destinée aux analystes de données et aux développeurs web qui souhaitent développer des modèles associatifs dans Qlik Sense.
A l'issue de cette formation, les participants seront capables de :
- Appliquer Qlik Sense à la science des données.
- Utiliser et naviguer dans l'interface de Qlik Sense.
- Construire une force de travail compétente en matière de données avec l'interaction de l'IA.
- Créer une entreprise pilotée par les données avec Qlik Sense.
GPU Data Science with NVIDIA RAPIDS
14 HeuresCette formation en Canada (en ligne ou sur site) s'adresse aux data scientists et aux développeurs qui souhaitent utiliser RAPIDS pour construire des pipelines de données, des workflows et des visualisations accélérés par GPU, en appliquant des algorithmes d'apprentissage automatique, tels que XGBoost, cuML, etc.
A la fin de cette formation, les participants seront capables de :
- Mettre en place l'environnement de développement nécessaire pour construire des modèles de données avec NVIDIA RAPIDS.
- Comprendre les caractéristiques, les composants et les avantages de RAPIDS.
- Exploiter les GPU pour accélérer les pipelines de données et d'analyse de bout en bout.
- Mettre en œuvre la préparation des données et l'ETL accélérés par GPU avec cuDF et Apache Arrow.
- Apprendre à réaliser des tâches d'apprentissage automatique avec les algorithmes XGBoost et cuML.
- Construire des visualisations de données et exécuter des analyses graphiques avec cuXfilter et cuGraph.