Struttura del corso
Introduzione a Data Analysis e Big Data
- Cosa rende Big Data "grande"?
- Velocità, volume, varietà, veridicità (VVVV)
- Limiti al trattamento tradizionale dei dati
- Elaborazione distribuita
- Analisi statistica
- Tipi di analisi Machine Learning
- Data Visualization
Big Data Ruoli e responsabilità
- Gli amministratori
- Gli sviluppatori
- Analisti di dati
Languages Usato per Data Analysis
- R Language
- Perché R per Data Analysis?
- Manipolazione dei dati, calcolo e visualizzazione grafica
- Python
- Perché Python per Data Analysis?
- Manipolazione, elaborazione, pulizia ed elaborazione dei dati
Approcci a Data Analysis
- Analisi statistica
- Analisi delle serie temporali
- Forecasting con modelli di correlazione e regressione
- Inferenziale Statistics (stima)
- Descrittivo Statistics in Big Data insiemi (ad es. calcolo della media)
- Machine Learning
- Apprendimento supervisionato vs non supervisionato
- Classificazione e clustering
- Stima del costo di metodi specifici
- Filtraggio
- Elaborazione del linguaggio naturale
- Elaborazione del testo
- Comprensione del significato del testo
- Generazione automatica di testo
- Analisi del sentiment / analisi degli argomenti
- Computer Vision
- Acquisizione, elaborazione, analisi e comprensione delle immagini
- Ricostruire, interpretare e comprendere scene 3D
- Utilizzo dei dati delle immagini per prendere decisioni
Big Data Infrastrutture
- Archiviazione dei dati
- Banche dati relazionali (SQL)
- MySQL
- Postgres
- Oracle
- Banche dati non relazionali (NoSQL)
- Cassandra
- MongoDB
- Neo4js
- Capire le sfumature
- Banche dati gerarchiche
- Banche dati orientate agli oggetti
- Banche dati orientate ai documenti
- Banche dati orientate ai grafi
- Altro
- Banche dati relazionali (SQL)
- Elaborazione distribuita
- Hadoop
- HDFS come filesystem distribuito
- MapReduce per l'elaborazione distribuita
- Scintilla
- Framework di cluster computing in-memory all-in-one per l'elaborazione di dati su larga scala
- Streaming strutturato
- Scintilla SQL
- Machine Learning librerie: MLlib
- Elaborazione di grafici con GraphX
- Hadoop
- Scalabilità
- Cloud pubblico
- AWS, Google, Aliyun, ecc.
- Cloud privato
- OpenStack, Cloud Foundry, ecc.
- Scalabilità automatica
- Cloud pubblico
Scegliere la soluzione giusta per il problema
Il futuro di Big Data
Riepilogo e passaggi successivi
Requisiti
- Una comprensione generale della matematica
- Una comprensione generale della programmazione
- Una comprensione generale delle banche dati
Pubblico
- Sviluppatori / programmatori
- Consulenti IT
Recensioni (7)
Come funzionano i big data, i programmi di dati, una maggiore conoscenza di come funziona il nostro mondo attuale utilizzando i dati
Ozayr Hussain - Vodacom
Corso - A Practical Introduction to Data Analysis and Big Data
Traduzione automatica
Il lato pratico della formazione.
Patrick - Vodacom PTy Ltd
Corso - A Practical Introduction to Data Analysis and Big Data
Traduzione automatica
Interactive topics and the style used by the lecture to simplified the topics for the students
Miran Saeed - Sulaymaniyah Asayish Agency
Corso - A Practical Introduction to Data Analysis and Big Data
the trainer and his ability to lecture
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Corso - A Practical Introduction to Data Analysis and Big Data
Practical exercises
JOEL CHIGADA - University of the Western Cape
Corso - A Practical Introduction to Data Analysis and Big Data
R programming
Osden Jokonya - University of the Western Cape
Corso - A Practical Introduction to Data Analysis and Big Data
Overall the Content was good.