Struttura del corso
Introduzione a Google Colab e Apache Spark
- Panoramica di Google Colab
- Introduzione a Apache Spark
- Configurazione di Spark in Google Colab
Elaborazione dati con Apache Spark
- Utilizzo di RDD e DataFrame
- Caricamento ed elaborazione di set di dati di grandi dimensioni
- Utilizzo di Spark SQL per l'esecuzione di query sui dati strutturati
Analisi avanzata con Spark
- Apprendimento automatico con Spark MLlib
- Esecuzione dell'analisi dei dati in tempo reale
- Calcolo distribuito con Spark
Visualizzazione e Collaboration in Google Colab
- Integrazione di Colab con le librerie di visualizzazione più diffuse
- Flussi di lavoro collaborativi con i notebook Colab
- Condivisione ed esportazione dei risultati
Ottimizzazione dei flussi di lavoro Big Data
- Ottimizzazione di Spark per le prestazioni
- Ottimizzazione dell'utilizzo della memoria e dello storage
- Scalabilità dei flussi di lavoro per set di dati di grandi dimensioni
Big Data nel cloud
- Integrazione di Google Colab con strumenti basati su cloud
- Utilizzo dell'archiviazione cloud per i Big Data
- Utilizzo di Spark in ambienti cloud distribuiti
Casi di studio e best practice
- Revisione delle applicazioni dei big data del mondo reale
- Casi di studio utilizzando Apache Spark e Colab
- Best practice per l'analisi dei big data
Riepilogo e passaggi successivi
Requisiti
- Conoscenza di base dei concetti di data science
- Familiarità con Apache Spark
- Python Competenze di programmazione
Pubblico
- Scienziati dei dati
- Ingegneri dei dati
- Ricercatori che lavorano con i big data
Recensioni (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Corso - ArcGIS Fundamentals
Esercizio di laboratorio
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Corso - Automated Monitoring with Zabbix
Traduzione automatica
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Corso - QGIS for Geographic Information System
Mi è piaciuto lo stile di Pablo, il fatto che abbia trattato molti argomenti, dalla progettazione di report, alla personalizzazione con html all'implementazione di semplici algoritmi ML. Good equilibrio informazioni teoriche / esercizi. Pablo ha davvero coperto tutti gli argomenti che mi interessavano e ha dato risposte esaurienti alle mie domande.
Cristian Tudose - SC Automobile Dacia SA
Corso - Advanced Data Analysis with TIBCO Spotfire
Traduzione automatica
Actual application of spotfire and all basic functions.