Struttura del corso

Introduzione a Google Colab e Apache Spark

  • Panoramica di Google Colab
  • Introduzione a Apache Spark
  • Configurazione di Spark in Google Colab

Elaborazione dati con Apache Spark

  • Utilizzo di RDD e DataFrame
  • Caricamento ed elaborazione di set di dati di grandi dimensioni
  • Utilizzo di Spark SQL per l'esecuzione di query sui dati strutturati

Analisi avanzata con Spark

  • Apprendimento automatico con Spark MLlib
  • Esecuzione dell'analisi dei dati in tempo reale
  • Calcolo distribuito con Spark

Visualizzazione e Collaboration in Google Colab

  • Integrazione di Colab con le librerie di visualizzazione più diffuse
  • Flussi di lavoro collaborativi con i notebook Colab
  • Condivisione ed esportazione dei risultati

Ottimizzazione dei flussi di lavoro Big Data

  • Ottimizzazione di Spark per le prestazioni
  • Ottimizzazione dell'utilizzo della memoria e dello storage
  • Scalabilità dei flussi di lavoro per set di dati di grandi dimensioni

Big Data nel cloud

  • Integrazione di Google Colab con strumenti basati su cloud
  • Utilizzo dell'archiviazione cloud per i Big Data
  • Utilizzo di Spark in ambienti cloud distribuiti

Casi di studio e best practice

  • Revisione delle applicazioni dei big data del mondo reale
  • Casi di studio utilizzando Apache Spark e Colab
  • Best practice per l'analisi dei big data

Riepilogo e passaggi successivi

Requisiti

  • Conoscenza di base dei concetti di data science
  • Familiarità con Apache Spark
  • Python Competenze di programmazione

Pubblico

  • Scienziati dei dati
  • Ingegneri dei dati
  • Ricercatori che lavorano con i big data
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative