Struttura del corso

Introduzione

Comprensione Big Data

Panoramica di Spark

Panoramica di Python

Panoramica di PySpark

  • Distribuzione dei dati tramite un framework di set di dati distribuiti resilienti
  • Distribuzione del calcolo tramite gli operatori API Spark

Configurazione di Python con Spark

Impostazione PySpark

Utilizzo di Amazon Web Services (AWS) istanze EC2 per Spark

Impostazione Databricks

Configurazione del cluster AWS EMR

Imparare le basi di Python Programming

  • Guida introduttiva Python
  • Utilizzo di Jupyter Notebook
  • Utilizzo di variabili e tipi di dati semplici
  • Lavorare con gli elenchi
  • Utilizzo delle istruzioni if
  • Utilizzo degli input dell'utente
  • Operazioni con i cicli while
  • Implementazione delle funzioni
  • Utilizzo delle classi
  • Utilizzo di file ed eccezioni
  • Utilizzo di progetti, dati e API

Apprendimento delle basi di Spark DataFrame

  • Introduzione ai dataframe Spark
  • Implementazione delle operazioni di base con Spark
  • Utilizzo di operazioni di raggruppamento e aggregazione
  • Utilizzo di timestamp e date

Utilizzo di un esercizio di progetto Spark DataFrame

Comprensione Machine Learning con MLlib

Utilizzo di MLlib, Spark e Python per Machine Learning

Informazioni sulle regressioni

  • Apprendimento della teoria della regressione lineare
  • Implementazione di un codice di valutazione della regressione
  • Lavorare su un esempio di esercizio di regressione lineare
  • Apprendimento della teoria della regressione logistica
  • Implementazione di un codice di regressione logistica
  • Utilizzo di un esempio di esercizio di regressione logistica

Comprendere gli Random Forest e gli alberi decisionali

  • Teoria dei metodi dell'albero di apprendimento
  • Implementazione degli alberi decisionali e dei codici Random Forest
  • Lavorare su un campione Random Forest Esercizio di classificazione

Utilizzo del clustering K-means

  • Comprendere la teoria del clustering K-means
  • Implementazione di un codice di clustering K-means
  • Utilizzo di un esercizio di clustering di esempio

Utilizzo dei sistemi di raccomandazione

Implementazione dell'elaborazione del linguaggio naturale

  • Comprensione Natural Language Processing (NLP)
  • Panoramica degli strumenti di NLP
  • Lavorare su un esempio di esercizio di PNL

Streaming con Spark attivo Python

  • Panoramica Streaming con Spark
  • Esempio Spark Streaming Esercizio

Osservazioni conclusive

Requisiti

  • Competenze generali di programmazione

Pubblico

  • Gli sviluppatori
  • Professionisti IT
  • Scienziati dei dati
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (6)

Corsi in Arrivo

Categorie relative