Struttura del corso

Introduzione

Panoramica delle funzionalità e dell'architettura di Spark Streaming

  • Origini dati supportate
  • API di base

Preparare l'ambiente

  • Dipendenze
  • Contesto di Spark e streaming
  • Collegamento a Kafka

Elaborazione dei messaggi

  • Analisi dei messaggi in entrata come JSON
  • Processi ETL
  • Avvio del contesto di streaming

Esecuzione di una finestra Stream Processing

  • Intervallo diapositive
  • Configurazione del recapito del checkpoint
  • Lancio dell'ambiente

Prototipazione del codice di elaborazione

  • Collegamento a un argomento Kafka
  • Recupero di JSON dall'origine dati utilizzando Paw
  • Variazioni ed elaborazioni aggiuntive

Streaming del codice

  • Variabili di controllo dei processi
  • Definizione dei valori da abbinare
  • Funzioni e condizioni

Acquisizione dell'output del flusso

  • Contatori
  • Output Kafka (abbinato e non abbinato)

Risoluzione dei problemi

Riassunto e conclusione

Requisiti

  • Esperienza con Python e Apache Kafka
  • Familiarità con le piattaforme di elaborazione dei flussi

Pubblico

  • Ingegneri dei dati
  • Scienziati dei dati
  • Programmatori
 7 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative