Struttura del corso

Introduzione ai modelli linguistici di piccole dimensioni (SLM)

  • Panoramica dei modelli linguistici
  • Evoluzione dai modelli linguistici di grandi dimensioni a quelli di piccole dimensioni
  • Architettura e progettazione di SLM
  • Vantaggi e limiti degli SLM

Fondamenti tecnici

  • Comprendere le reti neurali e i parametri
  • Processi di formazione per SLM
  • Requisiti dei dati e ottimizzazione del modello
  • Metriche di valutazione per i modelli linguistici

SLM nell'elaborazione del linguaggio naturale

  • Generazione di testo con SLM
  • Traduzione e localizzazione linguistica
  • Analisi del sentiment e classificazione del testo
  • Risposta alle domande e chatbot

Applicazioni reali degli SLM

  • Applicazioni per dispositivi mobili: elaborazione linguistica sul dispositivo
  • Sistemi embedded: SLM nei dispositivi IoT
  • IA che preserva la privacy: trattamento locale dei dati
  • Edge computing: SLM in ambienti a bassa latenza

Casi di studio

  • Analisi delle distribuzioni riuscite di SLM
  • Applicazioni specifiche del settore (Sanità, Finance, ecc.)
  • Studio comparativo: SLM vs. modelli di grandi dimensioni in produzione

Direzioni future

  • Tendenze della ricerca negli SLM
  • Sfide in termini di scalabilità e distribuzione
  • Considerazioni etiche e IA responsabile
  • La strada da percorrere: SLM di nuova generazione

Laboratori pratici

  • Creazione di un semplice SLM per la generazione di testo
  • Integrazione di SLM nelle app per dispositivi mobili
  • Messa a punto di SLM per attività specifiche
  • Analisi delle prestazioni e interpretabilità dei modelli

Progetto Capstone

  • Identificazione di uno spazio problematico per l'applicazione SLM
  • Progettazione e implementazione di una soluzione SLM
  • Test e iterazione del modello
  • Presentazione del progetto e dei risultati

Riepilogo e prossime tappe

Requisiti

  • Conoscenza di base dei concetti di Machine Learning
  • Familiarità con la programmazione Python
  • Conoscenza delle reti neurali e del deep learning

Pubblico

  • Scienziati dei dati
  • Sviluppatori di software
  • Appassionati di IA
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative