Struttura del corso
Introduzione
- Il processo Data Science
- Ruoli e responsabilità di un Data Scientist
Preparazione dell'ambiente di sviluppo
- Librerie, framework, linguaggi e strumenti
- Sviluppo locale
- Sviluppo collaborativo basato sul web
Raccolta dei dati
- Diversi tipi di dati
- Strutturato
- Banche dati locali
- Database Connettori
- Formati comuni: xlxs, XML, Json, csv, ...
- Non strutturato
- Clic, censure, smartphone
- Api
- Internet of Things (IoT)
- Documenti, immagini, video, suoni
- Strutturato
- Caso di studio: Raccolta continua di grandi quantità di dati non strutturati
Archiviazione dei dati
- Database relazionali
- Database non relazionali
- Hadoop: File system distribuito (HDFS)
- Spark: Set di dati distribuito resiliente (RDD)
- Archiviazione cloud
Preparazione dei dati
- Ingestione, selezione, pulizia e trasformazione
- Garantire la qualità dei dati: correttezza, significatività e sicurezza
- Rapporti sulle eccezioni
Languages utilizzato per la preparazione, l'elaborazione e l'analisi
- Linguaggio R
- Introduzione a R
- Manipolazione dei dati, calcolo e visualizzazione grafica
- Python
- Introduzione a Python
- Manipolazione, elaborazione, pulizia ed elaborazione dei dati
Analisi dei dati
- Analisi esplorativa
- Statistiche di base
- Visualizzazioni bozza
- Comprendere i dati
- Causalità
- Funzionalità e trasformazioni
- Machine Learning
- Supervisionato vs non sorpreso
- Quando utilizzare quale modello
- Natural Language Processing (NLP)
Data Visualization
- Migliori pratiche
- Selezione del grafico giusto per i dati giusti
- Palette di colori
- Portandolo al livello successivo
- Dashboard
- Visualizzazioni interattive
- Narrazione con i dati
Riassunto e conclusione
Requisiti
- Una comprensione generale dei concetti relativi ai database
- Una conoscenza di base della statistica
Recensioni (4)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Corso - ArcGIS Fundamentals
Esercizio di laboratorio
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Corso - Automated Monitoring with Zabbix
Traduzione automatica
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Corso - QGIS for Geographic Information System
The thing I liked the most about the training was the organization and the location