Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione a Large Language Models (LLMs)
- Panoramica degli LLM
- Definizione e significato
- Applicazioni dell'IA oggi
Architettura del trasformatore
- Che cos'è un trasformatore e come funziona?
- Componenti e caratteristiche principali
- Incorporamento e codifica posizionale
- Attenzione a più teste
- Rete neurale feed-forward
- Normalizzazione e connessioni residue
Modelli di trasformatori
- Meccanismo di auto-attenzione
- Architettura encoder-decoder
- Incorporamenti posizionali
- BERT (Rappresentazioni di encoder bidirezionali da trasformatori)
- GPT (Trasformatore generativo preaddestrato)
Ottimizzazione delle prestazioni e insidie
- Lunghezza del contesto
- Mamba e modelli nello spazio degli stati
- Attenzione al flash
- Trasformatori sparsi
- Trasformatori di visione
- Importanza della quantizzazione
Migliorare i trasformatori
- Recupero della generazione di testo aumentato
- Mix di modelli
- Albero dei pensieri
Messa a punto
- Teoria dell'adattamento di basso rango
- Messa a punto con QLora
Leggi di scalabilità e ottimizzazione negli LLM
- Importanza delle leggi di scalabilità per gli LLM
- Ridimensionamento delle dimensioni dei dati e del modello
- Scalabilità computazionale
- Ridimensionamento dell'efficienza dei parametri
Ottimizzazione
- Relazione tra le dimensioni del modello, le dimensioni dei dati, il budget di calcolo e i requisiti di inferenza
- Ottimizzazione delle prestazioni e dell'efficienza degli LLM
- Best practice e strumenti per la formazione e la messa a punto degli LLM
Formazione e messa a punto degli LLM
- Fasi e sfide della formazione degli LLM da zero
- Acquisizione e manutenzione dei dati
- Requisiti di dati, CPU e memoria su larga scala
- Sfide di ottimizzazione
- Panorama degli LLM open source
Fondamenti di Reinforcement Learning (RL)
- Introduzione a Reinforcement Learning
- Apprendimento attraverso il rinforzo positivo
- Definizione e concetti fondamentali
- Processo decisionale di Markov (MDP)
- Programmazione dinamica
- Metodi Monte Carlo
- Apprendimento delle differenze temporali
Profondo Reinforcement Learning
- Reti Q profonde (DQN)
- Ottimizzazione delle politiche prossimali (PPO)
- Element di Reinforcement Learning
Integrazione di LLM e Reinforcement Learning
- Combinazione di LLM con Reinforcement Learning
- Come viene utilizzato RL negli LLM
- Reinforcement Learning con Human Feedback (RLHF)
- Alternative a RLHF
Casi di studio e applicazioni
- Applicazioni nel mondo reale
- Storie di successo e sfide
Argomenti avanzati
- Tecniche avanzate
- Metodi di ottimizzazione avanzati
- Ricerca e sviluppo all'avanguardia
Riepilogo e prossime tappe
Requisiti
- Conoscenza di base di Machine Learning
Pubblico
- Scienziati dei dati
- Ingegneri del software
21 ore