Les formations Apache Spark en ligne ou sur site, animées par un instructeur, démontrent par la pratique comment Spark s'intègre dans l'écosystème Big Data, et comment utiliser Spark pour l'analyse des données.
La formation Apache Spark est disponible sous forme de "formation en ligne en direct" ou de "formation sur site en direct". La formation en ligne (également appelée "formation à distance") est dispensée par le biais d'un bureau interactif, à distance. La formation en direct sur site peut être réalisée localement dans les locaux du client Ontario ou dans les centres de formation de l'entreprise NobleProg Ontario.
NobleProg -- Votre fournisseur local de formation
Ottawa - Albert & Metcalfe
116 Albert Street, Ottawa, Canada, K1P 5G3
Across the street from the World Exchange Plaza. The Ottawa Shaw Centre and CF Rideau Centre shopping mall 10 minutes...
Across the street from the World Exchange Plaza. The Ottawa Shaw Centre and CF Rideau Centre shopping mall 10 minutes away.
On the top floor of a distinctive office tower that's highly visible from Highway 417, you'll find Regus 343 Prest...
On the top floor of a distinctive office tower that's highly visible from Highway 417, you'll find Regus 343 Preston Centre in Ottawa. Only a 10 minute drive from downtown Ottawa, a short stroll away from Dow’s Lake, and located near the lively intersection of Preston & Gladstone in Little Italy.
Mississauga - Airways
5925 Airport Road, Mississauga, Canada, L4V 1W1
Airways is a beautiful center located at 5925 Airport Road, directly across from Toronto Pearson International Airport off...
Airways is a beautiful center located at 5925 Airport Road, directly across from Toronto Pearson International Airport offering shuttle services. Adjacent to Highways 409 and 427, our center is easily accessible.
Oakville - Winston Park
2010 Winston Park Drive, Oakville, Canada, L6H 5R7
The Winston Park centre is located close to both the Queen Elizabeth Way and Ontario 403 giving easy access for Burlington...
The Winston Park centre is located close to both the Queen Elizabeth Way and Ontario 403 giving easy access for Burlington and Hamilton to the west and Mississauga and Toronto to the East.
West Toronto - Etobicoke
10 Four Seasons Place, Toronto, Canada, M9B 6H7
Etobicoke is a prestigious area located on the western fringe of Toronto, and is the cushion between Toronto and Mississau...
Etobicoke is a prestigious area located on the western fringe of Toronto, and is the cushion between Toronto and Mississauga. Easily accessible by public transportation (bus) and is 5 minutes from the local subway station.
Toronto - Toronto Street
36 Toronto Street, Toronto, Canada, M5C 2C5
Steps away from Toronto's prestigious financial core. Fast link to Pearson International Airport - less than 30 m...
Steps away from Toronto's prestigious financial core. Fast link to Pearson International Airport - less than 30 minutes away.
London - London City Centre
380 Wellington Street, London, Canada, N6A 5B5
The centre occupies the 6th floor of City Centre Building a conveniently-located corner complex in downtown London, Ontario.
...
The centre occupies the 6th floor of City Centre Building a conveniently-located corner complex in downtown London, Ontario.
Barrie - 49 High Street
49 High Street, Barrie, Canada, L4N 5J4
Balance work and leisure from our office space at 49 High Street. Barrie has a bustling commercial heart and enjoys great con...
Balance work and leisure from our office space at 49 High Street. Barrie has a bustling commercial heart and enjoys great connectivity – our central office space is just a few minutes’ drive from Highway 400
Brampton - Brampton County Court
2 County Court Blvd, Brampton, Canada, L6W 3W
The Brampton County Court business centre in Ontario is located in a modern building near the Grenville and William Davis ...
The Brampton County Court business centre in Ontario is located in a modern building near the Grenville and William Davis Court House in the downtown business district.
Brampton - 2 County Court
2 County Court Boulevard, Brampton, Canada, L6W 3W8
Look to the future with an office space at 2 County Court, a building with outstanding sustainability credentials. The third ...
Look to the future with an office space at 2 County Court, a building with outstanding sustainability credentials. The third largest city in Greater Toronto enjoys great transport links, while Toronto’s international airport is under 10 miles away.
Kitchener - 22 Frederick Street
22 Frederick Street, Kitchener, canada, N2H 6M6
Prominent office space in downtown location
Establish your business in the heart of downtown Kitchener. Work alongside leadi...
Prominent office space in downtown location
Establish your business in the heart of downtown Kitchener. Work alongside leading finance and insurance companies at our 22 Frederick Street offices on the corner of Frederick Street, giving you easy access to local amenities.
Richmond Hill - The Business Exchange
9225 Leslie Street, Richmond Hill, Canada, L4B 3H6
Place your business in the peaceful surroundings of Richmond Hill, home to leading global brands. Located in the northern sub...
Place your business in the peaceful surroundings of Richmond Hill, home to leading global brands. Located in the northern suburbs, our The Business Exchange workspace is just a 30-minute drive from central Toronto and the International Airport.
Scarborough – 10 Milner Business Court
10 Milner Business Court, Scarborough, Canada, M1B 3C6
The Milner Court centre occupies the third floor of a corner property. The centre is easy to get to by public transpo...
The Milner Court centre occupies the third floor of a corner property. The centre is easy to get to by public transport, both by bus and the rapid transit system.
Maximise opportunities in this forward-thinking city, a centre of knowledge that's home to several tech giants. Our well-conn...
Maximise opportunities in this forward-thinking city, a centre of knowledge that's home to several tech giants. Our well-connected 180 Northfield Drive West centre is on the city's Corporate Campus near the prestigious University of Waterloo.
Cette formation en direct (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop et Python pour traiter, analyser et transformer des ensembles de données volumineux et complexes.
A l'issue de cette formation, les participants seront capables de :
Mettre en place l'environnement nécessaire pour commencer à traiter les big data avec Spark, Hadoop et Python.
Comprendre les fonctionnalités, les composants de base et l'architecture de Spark et Hadoop.
Apprendre à intégrer Spark, Hadoop et Python pour le traitement des big data.
Explorer les outils de l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka et Flume).
Construire des systèmes de recommandation par filtrage collaboratif similaires à ceux de Netflix, YouTube, Amazon, Spotify et Google.
Utiliser Apache Mahout pour mettre à l'échelle des algorithmes d'apprentissage automatique.
Cette formation en direct avec instructeur à Ontario (en ligne ou sur site) s'adresse aux administrateurs système de niveau débutant à intermédiaire qui souhaitent déployer, maintenir et optimiser les clusters Spark.A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark dans différents environnements.
Gérer les ressources du cluster et surveiller les applications Spark.
Optimiser les performances des clusters Spark.
Mettre en place des mesures de sécurité et assurer la haute disponibilité.
Déboguer et résoudre les problèmes courants liés à Spark.
Dans cette formation en direct, dirigée par un instructeur, les participants apprendront à utiliser Python et Spark ensemble pour analyser les données volumineuses en travaillant sur des exercices pratiques.
A l'issue de cette formation, les participants seront capables de :
Apprendre à utiliser Spark avec Python pour analyser les Big Data.
Travailler sur des exercices qui imitent des cas réels.
Utiliser différents outils et techniques pour l'analyse des Big Data en utilisant PySpark.
OBJECTIF: Ce cours présentera Apache Spark . Les étudiants apprendront comment Spark s'intègre dans l'écosystème du Big Data et comment utiliser Spark pour l'analyse de données. Le cours couvre le shell Spark pour l'analyse de données interactive, les composants internes de Spark, les API Spark, Spark SQL , le streaming Spark, ainsi que l'apprentissage automatique et graphX. PUBLIC : Développeurs / Analystes de données
Cette formation en direct avec instructeur (en ligne ou sur site) présente Hortonworks Data Platform (HDP) et accompagne les participants dans le déploiement de la solution Spark + Hadoop.
A l'issue de cette formation, les participants seront capables de :
Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les flux de travail analytiques agiles de Spark.
Utiliser Hortonworks pour étudier, valider, certifier et prendre en charge chacun des composants d'un projet Spark.
Traiter différents types de données, notamment structurées, non structurées, en mouvement et au repos.
Magellan est un moteur d'exécution distribué à source ouverte pour l'analyse géospatiale sur les grandes données. Imployé au-dessus de Apache Spark, il étend Spark SQL et fournit une abstraction relative pour l'analyse géospatiale.
Cette formation guidée par l'instructeur, en direct introduit les concepts et les approches pour la mise en œuvre d'analyse géospatiale et marche les participants à travers la création d'une application d'analyse prédictive en utilisant Magellan sur Spark.
À la fin de cette formation, les participants seront en mesure de :
Demandez efficacement, parse et rejoignez des données géospatiales à l'échelle
Implémentation des données géospatiales dans les applications d'intelligence d'affaires et d'analyse prédictive
Utilisez un contexte spatial pour étendre les capacités des appareils mobiles, des capteurs, des logs et des portables
Le format du cours
Lecture et discussion interactives.
Beaucoup d’exercices et de pratiques.
La mise en œuvre dans un environnement de laboratoire en direct.
Options de personnalisation de cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Spark SQL est le module Apache Spark permettant de travailler avec des données structurées et non structurées. Spark SQL fournit des informations sur la structure des données ainsi que sur les calculs en cours. Ces informations peuvent être utilisées pour effectuer des optimisations. Les deux utilisations courantes de Spark SQL sont SQL suivantes: - pour exécuter SQL requêtes SQL . - lire les données d'une installation Hive existante. Lors de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL . À la fin de cette formation, les participants seront en mesure de:
Installez et configurez Spark SQL .
Effectuer une analyse de données à l'aide de Spark SQL .
Interrogez des ensembles de données dans différents formats.
Visualisez les données et les résultats de la requête.
Format du cours
Conférence interactive et discussion.
Beaucoup d'exercices et de pratique.
Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Dans cette formation dirigée par un instructeur en <loc> ; (sur site ou à distance), les participants apprendront comment configurer et intégrer différents Stream Processing frameworks avec des systèmes de stockage de big data existants et des applications logicielles et microservices connexes.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer différents Stream Processing frameworks, tels que Spark Streaming et Kafka Streaming.
Comprendre et sélectionner le framework le plus approprié pour le travail à effectuer.
Traiter des données en continu, de manière concurrente et enregistrement par enregistrement.
Intégrer les solutions Stream Processing aux bases de données existantes, aux entrepôts de données, aux lacs de données, etc.
Intégrer la bibliothèque de traitement de flux la plus appropriée avec les applications d'entreprise et les microservices.
L'analyse de données volumineuses implique l'examen de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles. L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique. Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire. À la fin de cette formation, les participants seront en mesure de:
Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
Comprendre les caractéristiques des données médicales
Appliquer des techniques Big Data pour traiter des données médicales
Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
Développeurs
Data Scientists
Format du cours
Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
La courbe d'apprentissage d' Apache Spark augmente lentement au début, il faut beaucoup d'efforts pour obtenir le premier retour. Ce cours vise à passer à travers la première partie difficile. Après avoir suivi ce cours, les participants comprendront les bases d’ Apache Spark , ils différencieront clairement RDD de DataFrame, ils apprendront les API Python et Scala , ils comprendront les exécuteurs et les tâches, etc. En suivant également les meilleures pratiques, ce cours est fortement axé sur déploiement en nuage, Databricks et AWS. Les étudiants comprendront également les différences entre AWS EMR et AWS Glue, l'un des derniers services Spark d'AWS. PUBLIC: Ingénieur de données, DevOps , Data Scientist
Cette formation en direct avec instructeur en <loc> ; (en ligne ou sur site) s'adresse aux ingénieurs logiciels qui souhaitent traiter des données volumineuses avec Spark Streaming et Scala.
A l'issue de cette formation, les participants seront capables de :
Créer des applications Spark avec le langage de programmation Scala.
Utiliser Spark Streaming pour traiter des flux continus de données.
Traiter des flux de données en temps réel avec Spark Streaming.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux data scientists qui souhaitent utiliser la pile SMACK pour construire des plateformes de traitement de données pour des solutions big data.
A l'issue de cette formation, les participants seront capables de :
Mettre en place une architecture de pipeline de données pour le traitement des big data.
Développer une infrastructure de cluster avec Apache Mesos et Docker.
Analyser les données avec Spark et Scala.
Gérer les données non structurées avec Apache Cassandra.
Cette formation en direct (en ligne ou sur site) s'adresse aux ingénieurs qui souhaitent mettre en place et déployer un système Apache Spark de traitement de très grandes quantités de données.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark.
Traiter et analyser rapidement de très grands ensembles de données.
Comprendre la différence entre Apache Spark et Hadoop MapReduce et savoir quand utiliser l'un ou l'autre.
Intégrer Apache Spark avec d'autres outils d'apprentissage automatique.
Cette formation en direct avec instructeur en <loc> ; (en ligne ou sur site) est destinée aux développeurs qui souhaitent effectuer des analyses de big data en utilisant Apache Spark dans leurs applications .NET.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark.
Comprendre comment .NET implémente les API Spark afin qu'elles soient accessibles à partir d'une application .NET.
Développer des applications de traitement de données en C# ou F#, capables de traiter des ensembles de données dont la taille se mesure en téraoctets et en pédaoctets.
Développer des fonctions d'apprentissage automatique pour une application .NET en utilisant les capacités d'Apache Spark.
Réaliser des analyses exploratoires à l'aide de SQL requêtes sur des ensembles de big data.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux administrateurs système qui souhaitent apprendre à mettre en place, déployer et gérer des clusters Hadoop au sein de leur organisation.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Hadoop.
Comprendre les quatre composants majeurs de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common.
Utiliser le système de fichiers distribués Hadoop (HDFS) pour faire évoluer un cluster vers des centaines ou des milliers de nœuds.
Configurer HDFS comme moteur de stockage pour les déploiements Spark sur site.
Configurer Spark pour accéder à des solutions de stockage alternatives telles qu'Amazon S3 et des systèmes de base de données NoSQL tels que Redis, Elasticsearch, Couchbase, Aerospike, etc.
Exécuter des tâches administratives telles que le provisionnement, la gestion, la surveillance et la sécurisation d'un cluster Apache Hadoop.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux data scientists et aux développeurs qui souhaitent utiliser Spark NLP, construit sur Apache Spark, pour développer, mettre en œuvre et mettre à l'échelle des modèles et des pipelines de traitement de texte en langage naturel.
A l'issue de cette formation, les participants seront capables de :
Mettre en place l'environnement de développement nécessaire pour commencer à construire des pipelines NLP avec Spark NLP.
Comprendre les caractéristiques, l'architecture et les avantages de l'utilisation de Spark NLP.
Utiliser les modèles pré-entraînés disponibles dans Spark NLP pour mettre en œuvre le traitement de texte.
Apprendre à construire, entraîner et mettre à l'échelle les modèles Spark NLP pour des projets de production.
MLlib est la bibliothèque d'apprentissage automatique (ML) de Spark. Son objectif est de rendre l'apprentissage pratique pratique évolutif et facile. Il comprend des algorithmes et des utilitaires d'apprentissage courants, notamment la classification, la régression, la mise en cluster, le filtrage collaboratif, la réduction de la dimensionnalité, ainsi que des primitives d'optimisation de niveau inférieur et des API de pipeline de niveau supérieur. Il se divise en deux paquets:
spark.mllib contient l'API d'origine construite sur les RDD.
spark.ml fournit des API de niveau supérieur construites à partir de DataFrames pour la construction de pipelines ML.
Public Ce cours s’adresse aux ingénieurs et aux développeurs qui souhaitent utiliser une bibliothèque de machines intégrée à Apache Spark
Dans cette formation en direct, dirigée par un instructeur, les participants découvriront les offres technologiques et les approches de mise en œuvre pour le traitement des données graphiques. L'objectif est d'identifier les objets du monde réel, leurs caractéristiques et leurs relations, puis de modéliser ces relations et de les traiter en tant que données à l'aide d'une approche Graph Computing (également connue sous le nom de Graph Analytics). Nous commencerons par une vue d'ensemble et nous nous concentrerons sur des outils spécifiques au fil d'une série d'études de cas, d'exercices pratiques et de déploiements en direct.
A l'issue de cette formation, les participants seront capables de :
Comprendre comment les données des graphes sont persistées et parcourues.
Sélectionner le meilleur framework pour une tâche donnée (des bases de données de graphes aux frameworks de traitement par lots.)
Mettre en œuvre Hadoop, Spark, GraphX et Pregel pour effectuer des calculs de graphes sur de nombreuses machines en parallèle.
Voir les problèmes de big data du monde réel en termes de graphes, de processus et de traversées.
En savoir plus...
Last Updated:
Nos Clients témoignent (10)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafał - Nordea
Formation - Apache Spark MLlib
Traduction automatique
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Engagement et volonté de clarifier les sujets secondaires.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Formation - Apache Spark Fundamentals
Traduction automatique
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Formation - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Formation - A Practical Introduction to Stream Processing
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Formation - Apache Spark in the Cloud
The VM I liked very much
The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly
I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Formation - Big Data Analytics in Health
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Formation - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Apache Spark formation à ontario, Weekend Spark cours à ontario, Soir Apache Spark formation à ontario, Spark formateur en ligne à ontario, Spark formation à ontario, Apache Spark cours du soir à ontario, Apache Spark formation Intra à ontario, Spark formation Intra Entreprise à ontario, Spark formation Inter à ontario, Apache Spark formation Inter Entreprise à ontario, Spark stage de préparation à ontario, Spark professeur à ontario,Apache Spark cours à ontario, Spark préparation à ontario, Weekend Apache Spark formation à ontario, Apache Spark formateur à ontario, Spark préparation aux examens à ontario, Apache Spark cours privé à ontario, Spark entraînement à ontario, Soir Apache Spark cours à ontario, Apache Spark coaching à ontario, Apache Spark coach à ontario, Spark instructeur à ontario, Apache Spark sur place à ontario, Apache Spark cours particuliers à ontario