Corso di formazione Jupyter for Data Science Teams
Jupyter è un IDE interattivo open source basato sul Web e un ambiente informatico.
Questo corso di formazione dal vivo con istruttore (online o in loco) introduce l'idea di sviluppo collaborativo nella scienza dei dati e dimostra come utilizzare Jupyter per monitorare e partecipare come team al "ciclo di vita di un'idea computazionale". Guida i partecipanti attraverso la creazione di un progetto di data science di esempio basato sull'ecosistema Jupyter.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Installa e configura Jupyter, inclusa la creazione e l'integrazione di un repository del team su Git.
- Usa le funzionalità di Jupyter come estensioni, widget interattivi, modalità multiutente e altro ancora per abilitare la collaborazione al progetto.
- Crea, condividi e organizza Jupyter Notebooks con i membri del team.
- Scegliere tra Scala, Python, R, per scrivere ed eseguire codice su sistemi di Big Data come Apache Spark, il tutto tramite l'interfaccia Jupyter.
Formato del corso
- Lezione interattiva e discussione.
- Un sacco di esercizi e pratica.
- Implementazione pratica in un ambiente di laboratorio dal vivo.
Opzioni di personalizzazione del corso
- Jupyter Notebook supporta oltre 40 lingue, tra cui R, Python, Scala, Julia e così via. Per personalizzare questo corso in base alla lingua o alle lingue di tua scelta, contattaci per organizzarlo.
Struttura del corso
Introduzione a Jupyter
- Panoramica di Jupyter e del suo ecosistema
- Installazione e configurazione
- Configurazione di Jupyter per la collaborazione in team
Funzionalità collaborative
- Utilizzo di Git per il controllo della versione
- Estensioni e widget interattivi
- Modalità multiutente
Creazione e gestione di blocchi appunti
- Struttura e funzionalità del notebook
- Condivisione e organizzazione di blocchi appunti
- Best practice per la collaborazione
Programming con Jupyter
- Scelta e utilizzo dei linguaggi di programmazione (Python, R, Scala)
- Scrittura ed esecuzione di codice
- Integrazione con i sistemi di big data (Apache Spark)
Funzionalità avanzate di Jupyter
- Personalizzazione dell'ambiente Jupyter
- Automazione dei flussi di lavoro con Jupyter
- Esplorazione di casi d'uso avanzati
Sessioni pratiche
- Laboratori pratici
- Progetti di data science nel mondo reale
- Esercitazioni di gruppo e peer review
Riepilogo e passaggi successivi
Requisiti
- Programming esperienza in lingue come Python, R, Scala, ecc.
- Un background in scienza dei dati
Pubblico
- Team di data science
I corsi di formazione interaziendali richiedono più di 5 partecipanti.
Corso di formazione Jupyter for Data Science Teams - Booking
Corso di formazione Jupyter for Data Science Teams - Enquiry
Jupyter for Data Science Teams - Richiesta di consulenza
Richiesta di consulenza
Recensioni (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Corso - Jupyter for Data Science Teams
Corsi in Arrivo
Corsi relativi
Introduction to Data Science and AI using Python
35 oreQuesto è un introduttivo di 5 giorni a Data Science e AI.
Il corso viene fornito con esempi ed esercizi con Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 oreQuesta formazione dal vivo con istruttore in Italia (online o in loco) è rivolta a partecipanti di livello intermedio che desiderano automatizzare e gestire i flussi di lavoro di apprendimento automatico, tra cui l'addestramento, la convalida e l'implementazione del modello utilizzando Apache Airflow.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Configurare Apache Airflow per l'orchestrazione del flusso di lavoro di machine learning.
- Automatizza le attività di pre-elaborazione dei dati, addestramento dei modelli e convalida.
- Integra Airflow con framework e strumenti di machine learning.
- Distribuisci modelli di machine learning usando pipeline automatizzate.
- Monitora e ottimizza i flussi di lavoro di machine learning in produzione.
Anaconda Ecosystem for Data Scientists
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto ai data scientist che desiderano utilizzare l'ecosistema Anaconda per acquisire, gestire e distribuire pacchetti e flussi di lavoro di analisi dei dati in un'unica piattaforma.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Installare e configurare Anaconda componenti e librerie.
- Comprendere i concetti fondamentali, le caratteristiche e i vantaggi di Anaconda.
- Gestisci pacchetti, ambienti e canali utilizzando Anaconda Navigator.
- Usa i pacchetti Conda, R e Python per l'analisi scientifica dei dati e l'apprendimento automatico.
- Scopri alcuni casi d'uso pratici e tecniche per la gestione di più ambienti di dati.
AWS Cloud9 for Data Science
28 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e analisti di livello intermedio che desiderano utilizzare AWS Cloud9 per flussi di lavoro semplificati di data science.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Configura un ambiente di data science in AWS Cloud9.
- Esegui l'analisi dei dati utilizzando Python, R e Jupyter Notebook in Cloud9.
- Integra AWS Cloud9 con i servizi dati AWS come S3, RDS e Redshift.
- Utilizza AWS Cloud9 per lo sviluppo e la distribuzione di modelli di machine learning.
- Ottimizza i flussi di lavoro basati su cloud per l'analisi e l'elaborazione dei dati.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 oredi Overview
I fornitori di servizi (CSP) sono sotto pressione per ridurre i costi e massimizzare il reddito medio per utente (ARPU), assicurando al contempo un'ottima esperienza clienti, ma i volumi dei dati continuano a crescere. Il traffico globale dei dati mobili crescerà a un tasso di crescita annuale combinato (CAGR) del 78 per cento entro il 2016, raggiungendo 10,8 exabiti al mese.
Nel frattempo, i CSP generano grandi volumi di dati, tra cui registri dettagliati delle chiamate (CDR), dati di rete e dati dei clienti. Le aziende che sfruttano pienamente questi dati guadagnano un margine competitivo. Secondo un recente sondaggio di The Economist Intelligence Unit, le aziende che utilizzano la presa di decisioni basate sui dati godono di un aumento della produttività del 5-6%. Tuttavia, il 53% delle aziende utilizza solo la metà dei loro dati preziosi, e un quarto degli intervistati ha notato che enormi quantità di dati utili non sono stati utilizzati. I volumi dei dati sono così alti che l'analisi manuale è impossibile, e la maggior parte dei sistemi software ereditari non può mantenere, il che porta a dati preziosi che vengono rimossi o ignorati.
Con Big Data & Analytics’ software di big data ad alta velocità, scalabile, i CSP possono minare tutti i loro dati per una migliore presa di decisioni in meno tempo. Diversi prodotti e tecniche forniscono una piattaforma software end-to-end per la raccolta, la preparazione, l'analisi e la presentazione di insegnamenti provenienti da grandi dati. Le aree di applicazione includono il monitoraggio del rendimento della rete, la rilevazione della frode, la rilevazione del cliente e l'analisi del rischio di credito. Big Data & Scala dei prodotti di analisi per gestire terabiti di dati ma l'implementazione di tali strumenti richiede un nuovo tipo di sistema di database basato sul cloud come Hadoop o processore di computer parallelo di scala massiccia (KPU, ecc.)
Questo corso funziona su Big Data BI per Telco copre tutte le nuove aree emergenti in cui i CSP stanno investendo per aumentare la produttività e aprire nuovi flussi di reddito aziendale. Il corso fornirà una panoramica completa di 360 gradi di Big Data BI in Telco in modo che i decisori e i manager possano avere una panoramica molto ampia e completa delle possibilità di Big Data BI in Telco per la produttività e il guadagno delle entrate.
Obiettivi corsi
L'obiettivo principale del corso è quello di introdurre nuove Big Data tecniche di intelligenza aziendale in 4 settori di Telecom Business (Marketing/Vendite, Operazione di rete, Operazione finanziaria e Relazioni con i clienti Management). Gli studenti saranno invitati a seguire:
- Introduzione a Big Data-che è 4Vs (volume, velocità, varietà e veracità) in Big Data- Generazione, estrazione e gestione dalla prospettiva Telco
- Come Big Data l'analisi differisce dall'analisi dei dati di eredità
- In-house giustificazione di Big Data -Telco prospettiva
- Introduzione a Hadoop Ecosistema- familiarità con tutti gli strumenti Hadoop come Hive, Pig, SPARC –quando e come vengono utilizzati per risolvere il problema Big Data
- Come Big Data viene estratto per l'analisi per lo strumento di analisi-come Business Analysis’s può ridurre i loro punti di dolore di raccolta e analisi dei dati attraverso un approccio integrato Hadoop dashboard
- Introduzione di base all'analisi di Insight, all'analisi di visualizzazione e all'analisi preditiva per Telco
- L'analisi del cliente Churn e Big Data-how Big Data analisi possono ridurre il timore del cliente e l'insoddisfazione del cliente negli studi del caso Telco
- Analisi di fallimenti di rete e fallimenti di servizio da metadati di rete e IPDR
- Analisi finanziaria - frode, scorta e stima del ROI dalle vendite e dai dati operativi
- Problemi di acquisizione dei clienti-Marketing target, segmentazione dei clienti e cross-sales dai dati di vendita
- Introduzione e sintesi di tutti i Big Data prodotti analitici e dove si adattano allo spazio analistico di Telco
- Conclusione-come prendere un approccio passo dopo passo per introdurre Big Data Business Intelligence nella tua organizzazione
Pubblicità target
- Operazioni di rete, Manageri finanziari, manageri CRM e top IT manageri presso l'ufficio Telco CIO.
- Business Gli analisti di Telco
- Direttori/analisti di CFO
- Direttori operativi
- Direttore QA
Introduction to Google Colab for Data Science
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist di livello principiante e professionisti IT che desiderano apprendere le basi della scienza dei dati utilizzando Google Colab.
Al termine di questa formazione, i partecipanti saranno in grado di:
- Configura e naviga Google Colab.
- Scrivere ed eseguire codice di base Python.
- Importare e gestire i set di dati.
- Creare visualizzazioni utilizzando le librerie Python.
A Practical Introduction to Data Science
35 oreI partecipanti che completano questa formazione acquisiranno una comprensione pratica e reale di Data Science e delle relative tecnologie, metodologie e strumenti.
I partecipanti avranno l'opportunità di mettere in pratica queste conoscenze attraverso esercizi pratici. L'interazione di gruppo e il feedback dell'istruttore costituiscono una componente importante della classe.
Il corso inizia con un'introduzione ai concetti elementari di Data Science, quindi progredisce negli strumenti e nelle metodologie utilizzate in Data Science.
Pubblico
- Gli sviluppatori
- Analisti tecnici
- Consulenti informatici
Formato del corso
- In parte lezione, in parte discussione, esercizi e pratica pratica pesante
Nota
- Per richiedere una formazione personalizzata per questo corso, contattateci per l'organizzazione.
Data Science for Big Data Analytics
35 oreI big data sono insiemi di dati così voluminosi e complessi che i tradizionali software applicativi per l'elaborazione dei dati non sono adeguati per gestirli. Le sfide relative ai big data comprendono l'acquisizione di dati, l'archiviazione dei dati, l'analisi dei dati, la ricerca, la condivisione, il trasferimento, la visualizzazione, l'interrogazione, l'aggiornamento e la riservatezza delle informazioni.
Data Science essential for Marketing/Sales professionals
21 oreQuesto corso è destinato a Marketing professionisti delle vendite che intendono approfondire l'applicazione della scienza dei dati in Marketing/ Vendite. Il corso si propone di Copertura dettagliata delle diverse tecniche di data science utilizzate per "upsale", "cross-sale", segmentazione del mercato, branding e CLV.
Differenza tra Marketing e vendite - In che modo le vendite e il marketing sono diversi?
In parole molto semplici, le vendite possono essere definite come un processo che si concentra o si rivolge a individui o piccoli gruppi. Marketing D'altra parte, si rivolge a un gruppo più ampio o al pubblico in generale. Marketing comprende la ricerca (identificazione delle esigenze del cliente), lo sviluppo di prodotti (produzione di prodotti innovativi) e la promozione del prodotto (attraverso la pubblicità) e la creazione di consapevolezza del prodotto tra i consumatori. In quanto tale, fare marketing significa generare lead o potenziali clienti. Una volta che il prodotto è uscito sul mercato, è compito dell'addetto alle vendite persuadere il cliente ad acquistare il prodotto. Vendere significa convertire i lead o i potenziali clienti in acquisti e ordini, mentre il marketing è mirato a termini più lunghi, le vendite riguardano obiettivi più brevi.
Introduction to Data Science
35 oreQuesta formazione dal vivo con istruttore (in loco o remoto) è rivolta a professionisti che desiderano iniziare una carriera nel campo Data Science .
Al termine di questa formazione, i partecipanti saranno in grado di:
- Installa e configura Python e MySql.
- Comprendi cos'è Data Science e come può aggiungere valore praticamente a qualsiasi azienda.
- Scopri i fondamenti della codifica in Python
- Impara le tecniche di Machine Learning supervisionate e non supervisionate e come implementarle e interpretare i risultati.
Formato del corso
- Conferenza e discussione interattiva.
- Molti esercizi e pratiche.
- Implementazione pratica in un ambiente live-lab.
Opzioni di personalizzazione del corso
- Per richiedere una formazione personalizzata per questo corso, ti preghiamo di contattarci per organizzare.
Kaggle
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano apprendere e costruire la propria carriera in Data Science utilizzando Kaggle.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Scopri di più sulla scienza dei dati e sull'apprendimento automatico.
- Esplora l'analisi dei dati.
- Scopri di più su Kaggle e su come funziona.
Data Science with KNIME Analytics Platform
21 oreKNIME La piattaforma di analisi è un'opzione open source per l'innovazione basata sui dati, che ti aiuta a scoprire il potenziale nascosto nei tuoi dati, minare per nuove conoscenze o prevedere nuovi futuri. Con più di 1000 moduli, centinaia di esempi pronti a funzionare, una vasta gamma di strumenti integrati e la più ampia scelta di algoritmi avanzati disponibili, KNIME Analytics Platform è la scatola di strumenti perfetta per qualsiasi scienziato di dati e analista aziendale.
Questo corso per KNIME Analytics Platform è un'opportunità ideale per i principianti, gli utenti avanzati e gli esperti di essere introdotti a KNIME, per imparare come utilizzarlo in modo più efficace, e come creare rapporti chiari e completi basati su KNIME flussi di lavoro
Questo istruttore guidato, la formazione in diretta (online o on-site) è rivolto ai professionisti dei dati che vogliono utilizzare KNIME per risolvere le complesse esigenze aziendali.
Si rivolge al pubblico che non conosce la programmazione e intende utilizzare strumenti di punta per implementare scenari di analisi.
Al termine di questo corso, i partecipanti saranno in grado di:
- Installazione e configurazione KNIME.
- Sceneggiatura Data Science Sceneggiatura
- Treno, test e modelli validati
- Implementazione fine alla catena di valore finale dei modelli di scienza dei dati
Il formato del corso
- Interattiva lezione e discussione.
- Molti esercizi e pratiche.
- Implementazione a mano in un ambiente live-lab.
Opzioni di personalizzazione del corso
- Per richiedere una formazione personalizzata per questo corso o per saperne di più su questo programma, si prega di contattarci per organizzare.
MATLAB Fundamentals, Data Science & Report Generation
35 oreNella prima parte di questo corso di formazione, tratteremo i fondamenti di MATLAB e la sua funzione sia come linguaggio che come piattaforma. In questa discussione è inclusa un'introduzione alla sintassi MATLAB, agli array e alle matrici, alla visualizzazione dei dati, allo sviluppo di script e ai principi orientati agli oggetti.
Nella seconda parte, dimostriamo come utilizzare MATLAB per il data mining, l'apprendimento automatico e l'analisi predittiva. Per fornire ai partecipanti una prospettiva chiara e pratica dell'approccio e della potenza di MATLAB, facciamo confronti tra l'uso di MATLAB e l'uso di altri strumenti come fogli di calcolo, C, C++ e Visual Basic.
Nella terza parte della formazione, i partecipanti imparano come semplificare il loro lavoro automatizzando l'elaborazione dei dati e la generazione di report.
Durante il corso, i partecipanti metteranno in pratica le idee apprese attraverso esercizi pratici in un ambiente di laboratorio. Al termine della formazione, i partecipanti avranno una conoscenza approfondita delle capacità di MATLAB e saranno in grado di utilizzarle per risolvere problemi di scienza dei dati del mondo reale e per semplificare il loro lavoro attraverso l'automazione.
Durante il corso verranno condotte valutazioni per valutare i progressi.
Formato del corso
- Il corso include esercizi teorici e pratici, tra cui discussioni di casi, ispezione di codici di esempio e implementazione pratica.
Nota
- Le sessioni di pratica si baseranno su modelli di report di dati di esempio prestabiliti. Se avete esigenze specifiche, vi preghiamo di contattarci per organizzare.
Accelerating Python Pandas Workflows with Modin
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano utilizzare Modin per creare e implementare calcoli paralleli con Pandas per un'analisi più rapida dei dati.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Configura l'ambiente necessario per iniziare a sviluppare Pandas flussi di lavoro su larga scala con Modin.
- Comprendere le caratteristiche, l'architettura e i vantaggi di Modin.
- Conosci le differenze tra Modin, Dask e Ray.
- Esegui Pandas operazioni più velocemente con Modin.
- Implementa l'intera API e le funzioni Pandas.
GPU Data Science with NVIDIA RAPIDS
14 oreQuesto corso di formazione dal vivo con istruttore in Italia (online o in loco) è rivolto a data scientist e sviluppatori che desiderano utilizzare RAPIDS per creare pipeline di dati, flussi di lavoro e visualizzazioni accelerate da GPU, applicando algoritmi di apprendimento automatico, come XGBoost, cuML, ecc.
Al termine di questo corso di formazione, i partecipanti saranno in grado di:
- Impostare l'ambiente di sviluppo necessario per costruire modelli di dati con NVIDIA RAPIDS.
- Comprendere le caratteristiche, i componenti e i vantaggi di RAPIDS.
- Sfrutta GPU per accelerare le pipeline di dati e analisi end-to-end.
- Implementare la preparazione dei dati accelerata GPU e l'ETL con cuDF e Apache Arrow.
- Scopri come eseguire attività di machine learning con gli algoritmi XGBoost e cuML.
- Crea visualizzazioni di dati ed esegui analisi grafiche con cuXfilter e cuGraph.