Struttura del corso

Introduzione

  • Panoramica di Databricks e Apache Spark
  • Comprendere l'architettura Databricks

Introduttiva

  • Configurazione dell'ambiente
  • Impostazione e configurazione Databricks
  • Navigazione nell'interfaccia utente Databricks
  • Creazione di un'area di lavoro Databricks

Utilizzo dei dati in Databricks

  • Connessione a un'origine dati Apache Spark
  • Informazioni di base sulle colonne e sui tipi di dati
  • Gestione del file system nei blocchi appunti

Gestione di processi e cluster

  • Creazione e configurazione di cluster
  • Creazione di processi tramite Notebook
  • Esecuzione di processi
  • Visualizzazione dei processi e dei dettagli dei processi

Utilizzo di Delta Lake in Databricks

  • Caricamento dei dati in Delta Lake
  • Gestione dei dati in Delta Lake

Messa in sicurezza Databricks

  • Gestione Databricks della sicurezza
  • Gestione del backup e del ripristino

Risoluzione dei problemi

Riepilogo e passaggi successivi

Requisiti

  • Conoscenza di base dell'analisi dei dati
  • Conoscenza di Apache Spark

Pubblico

  • Ingegneri dei dati
  • Scienziati dei dati
  • Gli sviluppatori
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative