Struttura del corso
Introduzione a Apache Spark
- Il ruolo di Spark nell'elaborazione dei big data
- Architettura Spark e relativi componenti
Impostazione Apache Spark
- Requisiti hardware e software
- Procedure di installazione per le modalità autonoma e cluster
- Procedure consigliate per la configurazione per gli amministratori di sistema
Amministrazione di cluster SparkAdadministration Spark Clusters
- Strumenti e tecniche di gestione dei cluster
- Monitoraggio delle applicazioni Spark e delle risorse del cluster
- Configurazioni di sicurezza e gestione degli utenti
Ottimizzazione e ottimizzazione delle prestazioni
- Allocazione e pianificazione delle risorse
- Tuning Spark per prestazioni ottimali
- Identificazione e risoluzione dei colli di bottiglia comuni
Risoluzione dei problemi e risoluzione dei problemi
- Problemi comuni di amministrazione di Spark
- Strumenti diagnostici e tecniche per la risoluzione dei problemi
- Approccio graduale alla risoluzione dei problemi più comuni
- Procedure consigliate per mantenere un ambiente Spark integro
Argomenti relativi all'amministrazione avanzata
- Integrazione con altri strumenti per i big data
- Garantire l'alta disponibilità e il ripristino di emergenza
- Aggiornamento e ridimensionamento dei cluster SparkUpgrading and scaling Spark clusters
Riepilogo e prossime tappe
Requisiti
- Conoscenza di base della configurazione e della gestione della rete
- Familiarità con il sistema operativo Linux e l'interfaccia della riga di comando
- Interesse per l'apprendimento dei sistemi di calcolo distribuito e della gestione dei big data
Pubblico
- Amministratori di sistema
Recensioni (5)
Un sacco di esempi pratici, modi diversi di affrontare lo stesso problema, e a volte trucchi non così ovvi su come migliorare la soluzione attuale
Rafal - Nordea
Corso - Apache Spark MLlib
Traduzione automatica
The live examples
Ahmet Bolat - Accenture Industrial SS
Corso - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Corso - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Corso - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift