Plan du cours

spark.mllib : types de données, algorithmes et utilitaires

    Types de données Statistiques de base statistiques récapitulatives corrélations échantillonnage stratifié tests d'hypothèses streaming tests de signification génération de données aléatoires
Modèles linéaires de classification et de régression (SVM, régression logistique, régression linéaire)
  • Bayes naïf
  • arbres de décision
  • ensembles d'arbres (Random Forests et arbres boostés par dégradé)
  • régression isotonique
  • Filtrage collaboratif par moindres carrés alternés (ALS)
  • Clustering k-moyennes
  • Mélange gaussien
  • clustering d'itérations de puissance (PIC)
  • Allocation latente de Dirichlet (LDA)
  • k-moyennes bissectrices
  • streaming k-means
  • Décomposition en valeurs singulières de réduction de dimensionnalité (SVD)
  • analyse en composantes principales (ACP)
  • Extraction et transformation de fonctionnalités
  • Exploration fréquente de modèles de croissance FP
  • règles d'association
  • PréfixeSpan
  • Paramètres d'évaluation
  • Exportation de modèle PMML
  • Optimisation (développeur) descente de gradient stochastique
  • BFGS à mémoire limitée (L-BFGS)
  • spark.ml : API de haut niveau pour les pipelines ML
  • Présentation : estimateurs, transformateurs et pipelines Extraction, transformation et sélection d'entités Classification et régression Clustering Sujets avancés

    Pré requis

    Connaissance de l'un des domaines suivants

    • Java
    • Scala
    • Python
    • SparkR
     35 heures

    Nombre de participants



    Prix par participant

    Nos Clients témoignent (1)

    Cours Similaires

    Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

    21 heures

    Big Data Analytics in Health

    21 heures

    Hadoop and Spark for Administrators

    35 heures

    Hortonworks Data Platform (HDP) for Administrators

    21 heures

    A Practical Introduction to Stream Processing

    21 heures

    Magellan: Geospatial Analytics on Spark

    14 heures

    Apache Spark for .NET Developers

    21 heures

    SMACK Stack for Data Science

    14 heures

    Apache Spark Fundamentals

    21 heures

    Administration of Apache Spark

    35 heures

    Apache Spark in the Cloud

    21 heures

    Spark for Developers

    21 heures

    Scaling Data Pipelines with Spark NLP

    14 heures

    Python, Spark, and Hadoop for Big Data

    21 heures

    Apache Spark Streaming with Scala

    21 heures

    Catégories Similaires