Struttura del corso

Introduzione a Large Language Models (LLMs)

  • Panoramica degli LLM
  • Definizione e significato
  • Applicazioni dell'IA oggi

Architettura del trasformatore

  • Che cos'è un trasformatore e come funziona?
  • Componenti e caratteristiche principali
  • Incorporamento e codifica posizionale
  • Attenzione a più teste
  • Rete neurale feed-forward
  • Normalizzazione e connessioni residue

Modelli di trasformatori

  • Meccanismo di auto-attenzione
  • Architettura encoder-decoder
  • Incorporamenti posizionali
  • BERT (Rappresentazioni di encoder bidirezionali da trasformatori)
  • GPT (Trasformatore generativo preaddestrato)

Ottimizzazione delle prestazioni e insidie

  • Lunghezza del contesto
  • Mamba e modelli nello spazio degli stati
  • Attenzione al flash
  • Trasformatori sparsi
  • Trasformatori di visione
  • Importanza della quantizzazione

Migliorare i trasformatori

  • Recupero della generazione di testo aumentato
  • Mix di modelli
  • Albero dei pensieri

Messa a punto

  • Teoria dell'adattamento di basso rango
  • Messa a punto con QLora

Leggi di scalabilità e ottimizzazione negli LLM

  • Importanza delle leggi di scalabilità per gli LLM
  • Ridimensionamento delle dimensioni dei dati e del modello
  • Scalabilità computazionale
  • Ridimensionamento dell'efficienza dei parametri

Ottimizzazione

  • Relazione tra le dimensioni del modello, le dimensioni dei dati, il budget di calcolo e i requisiti di inferenza
  • Ottimizzazione delle prestazioni e dell'efficienza degli LLM
  • Best practice e strumenti per la formazione e la messa a punto degli LLM

Formazione e messa a punto degli LLM

  • Fasi e sfide della formazione degli LLM da zero
  • Acquisizione e manutenzione dei dati
  • Requisiti di dati, CPU e memoria su larga scala
  • Sfide di ottimizzazione
  • Panorama degli LLM open source

Fondamenti di Reinforcement Learning (RL)

  • Introduzione a Reinforcement Learning
  • Apprendimento attraverso il rinforzo positivo
  • Definizione e concetti fondamentali
  • Processo decisionale di Markov (MDP)
  • Programmazione dinamica
  • Metodi Monte Carlo
  • Apprendimento delle differenze temporali

Profondo Reinforcement Learning

  • Reti Q profonde (DQN)
  • Ottimizzazione delle politiche prossimali (PPO)
  • Element di Reinforcement Learning

Integrazione di LLM e Reinforcement Learning

  • Combinazione di LLM con Reinforcement Learning
  • Come viene utilizzato RL negli LLM
  • Reinforcement Learning con Human Feedback (RLHF)
  • Alternative a RLHF

Casi di studio e applicazioni

  • Applicazioni nel mondo reale
  • Storie di successo e sfide

Argomenti avanzati

  • Tecniche avanzate
  • Metodi di ottimizzazione avanzati
  • Ricerca e sviluppo all'avanguardia

Riepilogo e prossime tappe

Requisiti

  • Conoscenza di base di Machine Learning

Pubblico

  • Scienziati dei dati
  • Ingegneri del software
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative