Struttura del corso
Introduzione
- Banche dati e librerie a grafo
Informazioni sui dati grafici
- Il grafo come struttura dati
- Utilizzo di vertici (punti) e bordi (linee) per modellare scenari del mondo reale
Utilizzo dei grafici Database per modellare, persistere ed elaborare i dati dei grafici
- Algoritmi/attraversamenti di grafi locali
- neo4j, OrientDB e Titan
Esercizio: Modellazione dei dati del grafo con neo4j
- Modellazione dei dati della lavagna
Oltre il grafico Database: Graph Computing
- Informazioni sul grafico delle proprietà
- Modellazione di diversi scenari (grafico software, grafico di discussione, grafico concettuale)
Risoluzione di problemi reali con gli attraversamenti
- Camminata algoritmica/diretta sul grafo
- Determinazione delle pendenze circolari
Caso di studio: Classifica dei contributori alla discussione
- Classifica per numero e profondità delle discussioni contribuite
- Una nota sull'analisi del sentiment e dei concetti
Graph Computing: Toolkit per grafici in memoria locali
- Analisi e visualizzazione dei grafici
- JUNG, NetworkX e iGraph
Esercizio: Modellazione dei dati dei grafi con NetworkX
- Utilizzo di NetworkX per modellare un sistema complesso
Graph Computing: Framework grafici per l'elaborazione batch
- Utilizzo di Hadoop per l'archiviazione (HDFS) e l'elaborazione (MapReduce)
- Panoramica degli algoritmi iterativi
- Hama, Giraph e GraphLab
Graph Computing: Calcolo grafo-parallelo
- Unificare ETL, analisi esplorativa e calcolo iterativo dei grafi all'interno di un unico sistema
- GraphX
Configurazione e installazione
- Hadoop e Spark
GraphX Operatori
- Proprietà, strutturale, join, aggregazione di quartiere, caching e uncaching
Iterazione con l'API Pregel
- Passaggio di argomenti per l'invio, la ricezione e l'elaborazione
Costruire un grafico
- Utilizzo di vertici e bordi in un RDD o su disco
Progettazione di Scalable Algoritmi
- GraphX Ottimizzazione
AccessAlgoritmi aggiuntivi
- PageRank, Componenti connessi, Conteggio dei triangoli
Esercis: Page Rank e Utenti Migliori
- Costruzione ed elaborazione di dati grafici utilizzando file di testo come input
Distribuzione in produzione
Osservazioni conclusive
Requisiti
- Un approfondimento della programmazione e dei framework Java
- Una comprensione generale di Python è utile ma non richiesta
- Una comprensione generale dei concetti relativi ai database
Pubblico
- Gli sviluppatori
Recensioni (2)
Very nice training
Maira Frisch - Novartis Pharma AG
Corso - SPARQL
He was interactive.