Les formations Apache Spark en ligne ou sur site, animées par un instructeur, démontrent par la pratique comment Spark s'intègre dans l'écosystème Big Data, et comment utiliser Spark pour l'analyse des données.
La formation Apache Spark est disponible sous forme de "formation en ligne en direct" ou de "formation sur site en direct". La formation en ligne (également appelée "formation à distance") est dispensée par le biais d'un bureau interactif, à distance. La formation en direct sur site peut être réalisée localement dans les locaux du client Ontario ou dans les centres de formation de l'entreprise NobleProg Ontario.
NobleProg -- Votre fournisseur local de formation
London - London City Centre
380, rue Wellington, London, Canada, N6A 5B5
Le centre occupe le 6e étage du City Centre Building, un complexe d'angle idéalement situé au centre-ville de London, en Ontario.
West Toronto - Etobicoke
10 Four Seasons Place, Toronto, Canada, M9B 6H7
Etobicoke est un quartier prestigieux situé à l'ouest de Toronto, à mi-chemin entre Toronto et Mississauga. Facilement accessible par les transports en commun (bus) et à 5 minutes de la station de métro locale.
Scarborough – 10 Milner Business Court
10 Milner Business Court, Scarborough, Canada, M1B 3C6
Le Milner Court Centre occupe le troisième étage d'un immeuble d'angle. Il est facilement accessible par les transports en commun, que ce soit par autobus ou par le réseau de transport en commun rapide.
Oakville - Winston Park
2010, promenade Winston Park, Oakville, Canada, L6H 5R7
Le centre Winston Park est situé à proximité de la Queen Elizabeth Way et de l'Ontario 403, offrant un accès facile à Burlington et Hamilton à l'ouest et à Mississauga et Toronto à l'est.
Brampton - Brampton County Court
2 County Court Blvd, Brampton, Canada, L6W 3W
Le centre d'affaires du tribunal du comté de Brampton en Ontario est situé dans un bâtiment moderne du quartier des affaires du centre-ville, près du palais de justice de Grenville et de William Davis.
Barrie - 49 High Street
49 rue High , Barrie, Canada, L4N 5J4
Équilibrez travail et loisirs dans nos bureaux situés au 49 High Street. Barrie possède un centre commercial animé et bénéficie d’une excellente connectivité – nos bureaux centraux se trouvent à seulement quelques minutes en voiture de l’autoroute 400
Maximisez les opportunités dans cette ville avant-gardiste, un centre de connaissances qui abrite plusieurs géants de la technologie. Notre centre bien desservi du 180 Northfield Drive West se trouve sur le campus d'entreprise de la ville, près de la prestigieuse Université de Waterloo.
Kitchener - 22, rue Frederick
22, rue Frederick, Kitchener, canada, N2H 6M6
Espace de bureau de premier plan au centre-ville
Établissez votre entreprise au cœur du centre-ville de Kitchener. Travaillez aux côtés de sociétés financières et d'assurances de premier plan dans nos bureaux du 22 Frederick Street, au coin de Frederick Street, vous offrant un accès facile aux commodités locales.
Brampton - 2 County Court
2 County Court Boulevard, Brampton, Canada, L6W 3W8
Tournez-vous vers l’avenir avec un espace de bureau au 2 County Court, un bâtiment aux performances environnementales exceptionnelles. La troisième plus grande ville du Grand Toronto bénéficie d’excellentes liaisons de transport, tandis que l’aéroport international de Toronto se trouve à moins de 16 km.
Richmond Hill - The Business Exchange
9225 Rue Leslie, Richmond Hill, Canada, L4B 3H6
Implantez votre entreprise dans le cadre paisible de Richmond Hill, qui abrite de grandes marques mondiales. Situé dans la banlieue nord, notre espace de travail The Business Exchange se trouve à seulement 30 minutes en voiture du centre de Toronto et de l'aéroport international.
Ottawa - Albert & Metcalfe
116, rue Albert, Ottawa, Canada, K1P 5G3
En face du World Exchange Plaza. Le Centre Shaw d'Ottawa et le centre commercial CF Rideau Centre sont à 10 minutes.
Barrie-49 Rue High
3ᵉ étage, Rue Dunlop Ouest, Barrie, Canada, L4N 1A8
Un Parfait Équilibre entre Travail et Loisirs au Bord du Lac Simcoe
Alliez productivité et détente dans notre espace de bureau situé au 49 High Street. Situé au cœur du centre commercial animé de Barrie, cet espace de travail bénéficie d'une excellente connectivité, avec l'autoroute 400 à quelques minutes en voiture.
Travaillez efficacement dans un bâtiment en brique moderne avec une entrée vitrée, des espaces de travail magnifiquement conçus et des œuvres d'art dans toutes les salles de réunion. Après une journée productive, profitez des nombreux restaurants à proximité ou faites une promenade agréable jusqu'à Heritage Park en bord de mer pour vous détendre.
Toronto - Rue Toronto
36, rue Toronto, Toronto, Canada, M5C 2C5
À quelques pas du prestigieux centre financier de Toronto. Liaison rapide vers l'aéroport international Pearson - à moins de 30 minutes.
Ottawa - 343 Preston
Regus, 343, rue Preston, Ottawa, Canada, K1S 1N4
Au dernier étage d'une tour de bureaux distinctive, bien visible depuis l'autoroute 417, vous trouverez le Regus 343 Preston Centre à Ottawa. À seulement 10 minutes en voiture du centre-ville d'Ottawa, à quelques pas du lac Downs et à proximité de l'intersection animée de Preston Gladstone dans la Petite Italie.
Mississauga - Airways
5925, chemin de l'Aéroport, Mississauga, Canada, L4V 1W1
Airways est un magnifique centre situé au 5925 Airport Road, juste en face de l'aéroport international Pearson de Toronto, qui propose des services de navette. Adjacent aux autoroutes 409 et 427, notre centre est facilement accessible.
Cette formation en direct avec instructeur en Ontario (en ligne ou sur site) s'adresse aux data scientists et ingénieurs de niveau intermédiaire qui souhaitent utiliser Google Colab et Apache Spark pour le traitement et l'analyse des big data.
A l'issue de cette formation, les participants seront capables de :
Mettre en place un environnement big data en utilisant Google Colab et Spark.
Traiter et analyser efficacement de grands ensembles de données avec Apache Spark.
Visualiser les big data dans un environnement collaboratif.
Intégrer Apache Spark avec des outils basés sur le cloud.
Cette formation en Ontario (en ligne ou sur site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop et Python pour traiter, analyser et transformer des ensembles de données complexes et volumineux.
A l'issue de cette formation, les participants seront capables de :
Mettre en place l'environnement nécessaire pour commencer à traiter les big data avec Spark, Hadoop et Python.
Comprendre les fonctionnalités, les composants de base et l'architecture de Spark et Hadoop.
Apprendre à intégrer Spark, Hadoop et Python pour le traitement des big data.
Explorer les outils de l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka et Flume).
Construire des systèmes de recommandation par filtrage collaboratif similaires à Netflix, YouTube, Amazon, Spotify et Google.
Utiliser Apache Mahout pour mettre à l'échelle des algorithmes d'apprentissage automatique.
Cette formation en direct avec instructeur à Ontario (en ligne ou sur site) s'adresse aux administrateurs système de niveau débutant à intermédiaire qui souhaitent déployer, maintenir et optimiser les clusters Spark.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark dans différents environnements.
Gérer les ressources du cluster et surveiller les applications Spark.
Optimiser les performances des clusters Spark.
Mettre en place des mesures de sécurité et assurer la haute disponibilité.
Déboguer et résoudre les problèmes courants liés à Spark.
Au cours de cette formation en direct avec instructeur à Ontario, les participants apprendront à utiliser Python et Spark ensemble pour analyser les données volumineuses (big data) en travaillant sur des exercices pratiques.
A la fin de cette formation, les participants seront capables de :
Apprendre à utiliser Spark avec Python pour analyser Big Data.
Travailler sur des exercices qui imitent des cas réels.
Utiliser différents outils et techniques pour l'analyse des big data en utilisant PySpark.
Ce cours s'adresse aux développeurs et aux scientifiques des données qui souhaitent comprendre et mettre en œuvre l'IA dans leurs applications. Une attention particulière est accordée à l'analyse des données, à l'IA distribuée et au traitement du langage naturel.
L'analyse de données volumineuses implique l'examen de grandes quantités d'ensembles de données variés afin de découvrir des corrélations, des modèles cachés et d'autres informations utiles.
L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.
Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.
À la fin de cette formation, les participants seront en mesure de:
Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
Comprendre les caractéristiques des données médicales
Appliquer des techniques Big Data pour traiter des données médicales
Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
Développeurs
Data Scientists
Format du cours
Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Au cours de cette formation en direct à Ontario, les participants découvriront les offres technologiques et les approches de mise en œuvre pour le traitement des données graphiques. L'objectif est d'identifier les objets du monde réel, leurs caractéristiques et leurs relations, puis de modéliser ces relations et de les traiter en tant que données à l'aide d'une approche Graph Computing (également connue sous le nom de Graph Analytics). Nous commençons par une vue d'ensemble et nous nous concentrons sur des outils spécifiques à travers une série d'études de cas, d'exercices pratiques et de déploiements en direct.
A la fin de cette formation, les participants seront capables de :
Comprendre comment les données graphiques sont persistées et parcourues.
Sélectionner le meilleur framework pour une tâche donnée (des bases de données de graphes aux frameworks de traitement par lots).
Mettre en œuvre Hadoop, Spark, GraphX et Pregel pour effectuer des calculs de graphes sur de nombreuses machines en parallèle.
Voir les problèmes de big data du monde réel en termes de graphes, de processus et de traversées.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux administrateurs système qui souhaitent apprendre à mettre en place, déployer et gérer des clusters Hadoop au sein de leur organisation.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Hadoop.
Comprendre les quatre composants majeurs de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common.
Utiliser le système de fichiers distribués Hadoop (HDFS) pour faire évoluer un cluster vers des centaines ou des milliers de nœuds.
Configurer HDFS comme moteur de stockage pour les déploiements Spark sur site.
Configurer Spark pour accéder à des solutions de stockage alternatives telles qu'Amazon S3 et des systèmes de base de données NoSQL tels que Redis, Elasticsearch, Couchbase, Aerospike, etc.
Exécuter des tâches administratives telles que le provisionnement, la gestion, la surveillance et la sécurisation d'un cluster Apache Hadoop.
Cette formation en direct à Ontario (en ligne ou sur site) présente Hortonworks Data Platform (HDP) et accompagne les participants dans le déploiement de la solution Spark + Hadoop.
A l'issue de cette formation, les participants seront capables de :
Utiliser Hortonworks pour exécuter de manière fiable Hadoop à grande échelle.
Unifier les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les flux de travail analytiques agiles de Spark.
Utiliser Hortonworks pour étudier, valider, certifier et prendre en charge chacun des composants d'un projet Spark.
Traiter différents types de données, notamment structurées, non structurées, en mouvement et au repos.
Dans cette formation dirigée par un instructeur en <loc> ; (sur site ou à distance), les participants apprendront comment configurer et intégrer différents Stream Processing frameworks avec des systèmes de stockage de big data existants et des applications logicielles et microservices connexes.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer différents Stream Processing frameworks, tels que Spark Streaming et Kafka Streaming.
Comprendre et sélectionner le framework le plus approprié pour le travail à effectuer.
Traiter des données en continu, de manière concurrente et enregistrement par enregistrement.
Intégrer les solutions Stream Processing aux bases de données existantes, aux entrepôts de données, aux lacs de données, etc.
Intégrer la bibliothèque de traitement de flux la plus appropriée avec les applications d'entreprise et les microservices.
Cette formation en direct avec instructeur (en ligne ou sur site) s'adresse aux data scientists qui souhaitent utiliser la pile SMACK pour construire des plateformes de traitement de données pour des solutions big data.
A l'issue de cette formation, les participants seront capables de :
Mettre en place une architecture de pipeline de données pour le traitement des big data.
Développer une infrastructure de cluster avec Apache Mesos et Docker.
Analyser les données avec Spark et Scala.
Gérer les données non structurées avec Apache Cassandra.
Cette formation en direct (en ligne ou sur site) s'adresse aux ingénieurs qui souhaitent mettre en place et déployer un système Apache Spark de traitement de très grandes quantités de données.
A l'issue de cette formation, les participants seront capables de :
Installer et configurer Apache Spark.
Traiter et analyser rapidement de très grands ensembles de données.
Comprendre la différence entre Apache Spark et Hadoop MapReduce et savoir quand utiliser l'un ou l'autre.
Intégrer Apache Spark avec d'autres outils d'apprentissage automatique.
La courbe d'apprentissage d' Apache Spark augmente lentement au début, il faut beaucoup d'efforts pour obtenir le premier retour. Ce cours vise à passer à travers la première partie difficile. Après avoir suivi ce cours, les participants comprendront les bases d’ Apache Spark , ils différencieront clairement RDD de DataFrame, ils apprendront les API Python et Scala , ils comprendront les exécuteurs et les tâches, etc. En suivant également les meilleures pratiques, ce cours est fortement axé sur déploiement en nuage, Databricks et AWS. Les étudiants comprendront également les différences entre AWS EMR et AWS Glue, l'un des derniers services Spark d'AWS.
PUBLIC:
Ingénieur de données, DevOps , Data Scientist
OBJECTIF:
Ce cours présentera Apache Spark . Les étudiants apprendront comment Spark s'intègre dans l'écosystème du Big Data et comment utiliser Spark pour l'analyse de données. Le cours couvre le shell Spark pour l'analyse de données interactive, les composants internes de Spark, les API Spark, Spark SQL , le streaming Spark, ainsi que l'apprentissage automatique et graphX.
PUBLIC :
Développeurs / Analystes de données
Cette formation en Ontario (en ligne ou sur site) s'adresse aux data scientists et aux développeurs qui souhaitent utiliser Spark NLP, construit sur Apache Spark, pour développer, implémenter et mettre à l'échelle des modèles et des pipelines de traitement de texte en langage naturel.
A la fin de cette formation, les participants seront capables de :
Mettre en place l'environnement de développement nécessaire pour commencer à construire des pipelines NLP avec Spark NLP.
Comprendre les caractéristiques, l'architecture et les avantages de l'utilisation de Spark NLP.
Utiliser les modèles pré-entraînés disponibles dans Spark NLP pour implémenter le traitement de texte.
Apprendre à construire, entraîner et mettre à l'échelle les modèles Spark NLP pour des projets de production.
Appliquer la classification, l'inférence et l'analyse des sentiments sur des cas d'utilisation réels (données cliniques, comportement des clients, etc.).
Spark SQL est le module Apache Spark permettant de travailler avec des données structurées et non structurées. Spark SQL fournit des informations sur la structure des données ainsi que sur les calculs en cours. Ces informations peuvent être utilisées pour effectuer des optimisations. Les deux utilisations courantes de Spark SQL sont SQL suivantes: - pour exécuter SQL requêtes SQL . - lire les données d'une installation Hive existante.
Lors de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à analyser divers types de jeux de données à l'aide de Spark SQL .
À la fin de cette formation, les participants seront en mesure de:
Installez et configurez Spark SQL .
Effectuer une analyse de données à l'aide de Spark SQL .
Interrogez des ensembles de données dans différents formats.
Visualisez les données et les résultats de la requête.
Format du cours
Conférence interactive et discussion.
Beaucoup d'exercices et de pratique.
Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
MLlib est la bibliothèque d'apprentissage automatique (ML) de Spark. Son objectif est de rendre l'apprentissage pratique pratique évolutif et facile. Il comprend des algorithmes et des utilitaires d'apprentissage courants, notamment la classification, la régression, la mise en cluster, le filtrage collaboratif, la réduction de la dimensionnalité, ainsi que des primitives d'optimisation de niveau inférieur et des API de pipeline de niveau supérieur.
Il se divise en deux paquets:
spark.mllib contient l'API d'origine construite sur les RDD.
spark.ml fournit des API de niveau supérieur construites à partir de DataFrames pour la construction de pipelines ML.
Public
Ce cours s’adresse aux ingénieurs et aux développeurs qui souhaitent utiliser une bibliothèque de machines intégrée à Apache Spark
En savoir plus...
Dernière Mise À Jour:
Nos clients témoignent (10)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafal - Nordea
Formation - Apache Spark MLlib
Traduction automatique
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique
tâches pratiques
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
La machine virtuelle que j'ai beaucoup aimée
Le formateur était très compétent sur le sujet ainsi que sur d'autres sujets, il était très sympathique et accueillant
J'ai aimé les installations à Dubaï.
Safar Alqahtani - Elm Information Security
Formation - Big Data Analytics in Health
Traduction automatique
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Formation - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Traduction automatique
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Apache Spark formation à Ontario, Weekend Spark cours à Ontario, Soir Apache Spark formation à Ontario, Spark formateur en ligne à Ontario, Spark formation à Ontario, Apache Spark cours du soir à Ontario, Apache Spark formation Intra à Ontario, Spark formation Intra Entreprise à Ontario, Spark formation Inter à Ontario, Apache Spark formation Inter Entreprise à Ontario, Apache Spark coach à Ontario, Spark entraînement à Ontario, Spark professeur à Ontario,Apache Spark cours à Ontario, Soir Apache Spark cours à Ontario, Apache Spark formateur à Ontario, Apache Spark sur place à Ontario, Spark préparation à Ontario, Weekend Apache Spark formation à Ontario, Spark instructeur à Ontario, Apache Spark coaching à Ontario, Spark préparation aux examens à Ontario, Spark stage de préparation à Ontario, Apache Spark cours privé à Ontario, Apache Spark cours particuliers à Ontario