Les formations Apache Spark en ligne ou sur site, animées par un instructeur, démontrent par la pratique comment Spark s'intègre dans l'écosystème Big Data, et comment utiliser Spark pour l'analyse des données.
La formation Apache Spark est disponible sous forme de "formation en ligne en direct" ou de "formation sur site en direct". La formation en ligne (également appelée "formation à distance") est dispensée par le biais d'un bureau interactif, à distance. La formation en direct sur site peut être réalisée localement dans les locaux du client Québec ou dans les centres de formation de l'entreprise NobleProg Québec.
NobleProg -- Votre fournisseur local de formation
Montreal - René Lévesque
1250 Boulevard René Lévesque Ouest, Montréal, Canada, H3B 4W8
Situé au centre-ville de Montréal, l'immeuble possède des stations de métro et des autoroutes à proximité, vous offrant un transport rapide et facile à travers la ville et au-delà.
Saint - Laurent- Dr Frederik-Philips
1111, Boulevard Dr Frederik-Philips, Saint - Laurent, Canada, H4M 2X6
Idéalement situé à proximité de l'autoroute 40 et du métro Côte-Vertu avec de nombreux restaurants à proximité.
Situé dans le quartier central des affaires de Laval, notre espace de travail du 2572 boulevard Daniel Johnson est au cœur d'un quartier high-tech, à proximité de Biotech City et facilement accessible depuis le centre-ville de Montréal ou via les autoroutes A-15 et A-460.
Conçu par un architecte de premier plan et équipé des dernières technologies économes en énergie. Accueillez des clients étrangers et voyagez facilement pour affaires à partir de cet endroit recherché, avec l'aéroport Montréal-Trudeau à 10 minutes en voiture.
Brossard - Complexe Dix 30
1040 rue du Lux # 410, Brossard, Canada, J4Y 0E3
Centre de style de vie commercial Quartier DIX30. Bien situé à côté de l'autoroute des Cantons-de-l'Est, le centre-ville de Montréal en moins de 20 minutes.
Levis - Rue de Courchevel
1190B Rue de Courchevel, Lévis, Canada, G6W 0M6
La rue De Courchevel abrite une communauté florissante de technologie, de recherche et de développement avec des liaisons de transport pratiques à proximité pour un accès facile à travers le Québec et au-delà.
Montreal - University Street
2001 Blvd. Robert Bourassa, Montreal, canada, H3A 2A6
Le Centre de la rue University occupe un immeuble de bureaux au cœur du quartier des affaires de Montréal. Il est niché parmi les nombreux gratte-ciels du centre-ville de Montréal et bénéficie d'une connexion directe au plus grand complexe souterrain du monde.
Quebec - Sainte Foy
2828 Boulevard Laurier, Suite 700, Quebec City, Canada, G1V 0B9
Stratégiquement situé à proximité de l'aéroport international et de l'intersection des grands axes routiers, le centre a pour voisins l'Université Laval, des commerces, des hôtels et de nombreux commerces.
Gatineau - Rue Montcalm
200 Rue Montcalm, Gatineau , Canada, J8Y 3B5
Situé dans la région de la capitale nationale du Canada, à l'intersection principale du centre-ville de Gatineau.
Québec-Centre d'Affaires Lebourgneuf
Suite 400, Rue de la Couronne, Québec, Canada, G1K 6P4
Emplacement d'Affaires Idéal au Cœur de la Ville de Québec
Implantez votre entreprise dans l'un des pôles commerciaux dynamiques de la ville de Québec. Notre espace de bureau au Centre d'Affaires Lebourgneuf, idéalement situé à quelques minutes de l'Autoroute 40, est facilement accessible en voiture, ou laissez votre véhicule à la maison et profitez de l'espace de stationnement pour vélos sur place.
Travaillez efficacement dans des bureaux lumineux et entièrement meublés, conçus pour la productivité, avec tout ce dont vous avez besoin pour réussir. Lorsque vient le moment de faire une pause, détendez-vous dans le confortable salon. Après une journée bien remplie, profitez du shopping ou des restaurants au centre commercial Galeries de la Capitale, situé à proximité.
Ville de Québec - Complexe Jules-Dallaire
2828 Boulevard Laurier, Ville de Québec, Canada, G1V 0B9
Situé dans le prestigieux développement du Complexe Jules Dallaire, facile d'accès grâce aux transports en commun pratiques du secteur.
Ce formation en direct (en ligne ou sur site) est destinée aux scientifiques des données et ingénieurs de niveau intermédiaire qui souhaitent utiliser Google Colab et Apache Spark pour le traitement et l'analyse de grandes masses de données.
À la fin de cette formation, les participants seront capables de :
Configurer un environnement big data en utilisant Google Colab et Spark.
Traiter et analyser des jeux de données volumineux efficacement avec Apache Spark.
Visualiser les grands ensembles de données dans un environnement collaboratif.
Intégrer Apache Spark avec des outils basés sur le cloud.
Stratio est une plateforme centrée sur les données qui intègre le big data, l'IA et la gouvernance dans une seule solution. Ses modules Rocket et Intelligence permettent une exploration rapide des données, leur transformation et des analyses avancées dans les environnements d’entreprise.
Cette formation dispensée par un formateur (en ligne ou sur site) s'adresse aux professionnels de niveau intermédiaire en données qui souhaitent utiliser efficacement les modules Rocket et Intelligence de Stratio avec PySpark, en se concentrant sur les structures de boucle, les fonctions définies par l'utilisateur et la logique des données avancée.
À la fin de cette formation, les participants pourront :
Naviguer et travailler au sein de la plateforme Stratio en utilisant les modules Rocket et Intelligence.
Appliquer PySpark dans le contexte d'ingestion, de transformation et d'analyse des données.
Utiliser des boucles et une logique conditionnelle pour contrôler les flux de travail des données et les tâches d'ingénierie des fonctionnalités.
Créer et gérer des fonctions définies par l'utilisateur (UDFs) pour les opérations réutilisables des données dans PySpark.
Format de la Formation
Cours interactif et discussion.
De nombreuses exercices et pratiques.
Implémentation pratique dans un environnement de laboratoire en direct.
Options de Personnalisation du Cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour en faire la demande.
Cette formation en Québec (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop et Python pour traiter, analyser et transformer des ensembles de données complexes et volumineux.
A l'issue de cette formation, les participants seront capables de :
Mettre en place l'environnement nécessaire pour commencer à traiter les big data avec Spark, Hadoop et Python.
Comprendre les fonctionnalités, les composants de base et l'architecture de Spark et Hadoop.
Apprendre à intégrer Spark, Hadoop et Python pour le traitement des big data.
Explorer les outils de l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka et Flume).
Construire des systèmes de recommandation par filtrage collaboratif similaires à Netflix, YouTube, Amazon, Spotify et Google.
Utiliser Apache Mahout pour mettre à l'échelle des algorithmes d'apprentissage automatique.
Cette formation en direct avec instructeur à Québec (en ligne ou sur site) s'adresse aux administrateurs système de niveau débutant à intermédiaire qui souhaitent déployer, maintenir et optimiser les clusters Spark.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark dans différents environnements.
Gérer les ressources du cluster et surveiller les applications Spark.
Optimiser les performances des clusters Spark.
Mettre en place des mesures de sécurité et assurer la haute disponibilité.
Déboguer et résoudre les problèmes courants liés à Spark.
Au cours de cette formation en direct avec instructeur à Québec, les participants apprendront à utiliser Python et Spark ensemble pour analyser les données volumineuses (big data) en travaillant sur des exercices pratiques.
A la fin de cette formation, les participants seront capables de :
Apprendre à utiliser Spark avec Python pour analyser Big Data.
Travailler sur des exercices qui imitent des cas réels.
Utiliser différents outils et techniques pour l'analyse des big data en utilisant PySpark.
L'analyse de données volumineuses implique l'examen de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.
L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.
Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.
À la fin de cette formation, les participants seront en mesure de:
Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
Comprendre les caractéristiques des données médicales
Appliquer des techniques Big Data pour traiter des données médicales
Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
Développeurs
Data Scientists
Format du cours
Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux administrateurs système qui souhaitent apprendre à mettre en place, déployer et gérer des clusters Hadoop au sein de leur organisation.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Hadoop.
Comprendre les quatre composants majeurs de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common.
Utiliser le système de fichiers distribués Hadoop (HDFS) pour faire évoluer un cluster vers des centaines ou des milliers de nœuds.
Configurer HDFS comme moteur de stockage pour les déploiements Spark sur site.
Configurer Spark pour accéder à des solutions de stockage alternatives telles qu'Amazon S3 et des systèmes de base de données NoSQL tels que Redis, Elasticsearch, Couchbase, Aerospike, etc.
Exécuter des tâches administratives telles que le provisionnement, la gestion, la surveillance et la sécurisation d'un cluster Apache Hadoop.
Dans cette formation dirigée par un instructeur, en direct à Québec (sur site ou à distance), les participants apprendront à configurer et intégrer différentes frameworks de traitement de flux avec des systèmes de stockage de données volumineuses existants ainsi qu'avec des applications logicielles et microservices associés.
Au terme de cette formation, les participants seront en mesure de :
Installer et configurer différentes frameworks de traitement de flux, comme Spark Streaming et Kafka Streaming.
Comprendre et sélectionner la framework la plus appropriée pour le travail à accomplir.
Traiter les données de manière continue, concurrente et par enregistrement.
Intégrer des solutions de traitement de flux avec des bases de données existantes, des entrepôts de données, des lacs de données, etc.
Intégrer la bibliothèque de traitement de flux la plus appropriée avec des applications d'entreprise et des microservices.
Cette formation en présentiel dirigée par un instructeur à Québec (en ligne ou sur site) est destinée aux scientifiques des données qui souhaitent utiliser la pile SMACK pour construire des plateformes de traitement de données pour des solutions de big data.
À la fin de cette formation, les participants seront capables de :
Mettre en œuvre une architecture de pipeline de données pour le traitement du big data.
Développer une infrastructure de cluster avec Apache Mesos et Docker.
Analyser les données avec Spark et Scala.
Gérer les données non structurées avec Apache Cassandra.
Cette formation en direct (en ligne ou sur site) s'adresse aux ingénieurs qui souhaitent mettre en place et déployer un système Apache Spark de traitement de très grandes quantités de données.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark.
Traiter et analyser rapidement de très grands ensembles de données.
Comprendre la différence entre Apache Spark et Hadoop MapReduce et savoir quand utiliser l'un ou l'autre.
Intégrer Apache Spark avec d'autres outils d'apprentissage automatique.
L'apprentissage d'Apache Spark présente une courbe d'apprentissage qui s'accélère lentement au début, nécessitant beaucoup d'efforts pour obtenir les premiers résultats. Ce cours vise à franchir la première partie difficile. Après avoir suivi ce cours, les participants comprendront les bases d'Apache Spark, distingueront clairement RDD de DataFrame, apprendront l'API Python et Scala, comprendront les exécuteurs et les tâches, etc. En suivant les meilleures pratiques, ce cours se concentre fortement sur le déploiement dans le cloud, Databricks et AWS. Les étudiants comprendront également les différences entre AWS EMR et AWS Glue, l'un des derniers services Spark d'AWS.
Ce cours introduira Apache Spark. Les étudiants apprendront comment Spark s'intègre dans l'écosystème Big Data, ainsi que comment utiliser Spark pour l'analyse des données. Le cours couvre le Spark shell pour l'analyse interactive des données, les internals de Spark, les API de Spark, Spark SQL, Spark streaming, et machine learning et GraphX.
Cette formation en Québec (en ligne ou sur site) s'adresse aux data scientists et aux développeurs qui souhaitent utiliser Spark NLP, construit sur Apache Spark, pour développer, implémenter et mettre à l'échelle des modèles et des pipelines de traitement de texte en langage naturel.
A la fin de cette formation, les participants seront capables de :
Mettre en place l'environnement de développement nécessaire pour commencer à construire des pipelines NLP avec Spark NLP.
Comprendre les caractéristiques, l'architecture et les avantages de l'utilisation de Spark NLP.
Utiliser les modèles pré-entraînés disponibles dans Spark NLP pour implémenter le traitement de texte.
Apprendre à construire, entraîner et mettre à l'échelle les modèles Spark NLP pour des projets de production.
Appliquer la classification, l'inférence et l'analyse des sentiments sur des cas d'utilisation réels (données cliniques, comportement des clients, etc.).
Apache Spark SQL est le module d'Apache Spark pour travailler avec des données structurées et non structurées. Spark SQL fournit des informations sur la structure des données ainsi que sur les calculs effectués. Ces informations peuvent être utilisées pour réaliser des optimisations. Deux utilisations courantes de Spark SQL sont:
- pour exécuter des requêtes SQL.
- pour lire des données à partir d'une installation Hive existante.
Dans cette formation dirigée par un instructeur (en présentiel ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL.
À la fin de cette formation, les participants seront en mesure de :
Installer et configurer Spark SQL.
Effectuer des analyses de données avec Spark SQL.
Interroger des jeux de données dans différents formats.
Visualiser les données et les résultats des requêtes.
Format du cours
Cours interactif et discussion.
Beaucoup d'exercices et de pratique.
Mise en œuvre pratique dans un environnement de laboratoire en direct.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
En savoir plus...
Dernière Mise À Jour:
Nos clients témoignent (8)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique
tâches pratiques
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
La machine virtuelle que j'ai beaucoup aimée
Le formateur était très compétent sur le sujet ainsi que sur d'autres sujets, il était très sympathique et accueillant
J'ai aimé les installations à Dubaï.
Safar Alqahtani - Elm Information Security
Formation - Big Data Analytics in Health
Traduction automatique
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Spark formation à Québec, Weekend Apache Spark cours à Québec, Soir Spark formation à Québec, Spark formateur en ligne à Québec, Spark formation à Québec, Spark cours du soir à Québec, Spark formation Intra à Québec, Apache Spark formation Intra Entreprise à Québec, Spark formation Inter à Québec, Apache Spark formation Inter Entreprise à Québec, Apache Spark instructeur à Québec, Apache Spark préparation aux examens à Québec, Soir Apache Spark cours à Québec, Spark coach à Québec, Spark préparation à Québec, Spark formateur à Québec, Spark coaching à Québec, Spark sur place à Québec, Spark professeur à Québec,Apache Spark cours à Québec, Apache Spark stage de préparation à Québec, Apache Spark entraînement à Québec, Weekend Apache Spark formation à Québec, Spark cours privé à Québec, Spark cours particuliers à Québec