Struttura del corso

Introduzione all'IA multimodale

  • Informazioni sui dati multimodali
  • Concetti chiave e definizioni
  • Storia ed evoluzione dell'apprendimento multimodale

Elaborazione dati multimodale

  • Raccolta e pre-elaborazione dei dati
  • Estrazione di feature da diverse modalità
  • Tecniche di fusione dei dati

Apprendimento della rappresentazione multimodale

  • Rappresentazioni congiunte di apprendimento
  • Incorporamenti cross-modali
  • Trasferisci l'apprendimento tra le modalità

Allineamento e traslazione multimodale

  • Allineamento dei dati provenienti da più modalità
  • Sistemi di recupero intermodali
  • Traduzione tra modalità (ad esempio, da testo a immagine, da immagine a testo)

Ragionamento e inferenza multimodale

  • Logica e ragionamento con dati multimodali
  • Tecniche di inferenza nell'IA multimodale
  • Domande in questione, risposta e processo decisionale

Modelli generativi nell'IA multimodale

  • Generative Adversarial Networks (GAN) per dati multimodali
  • Autoencoder variazionali (VAE) per la generazione cross-modale
  • Applicazioni creative dell'IA generativa multimodale

Tecniche di fusione multimodale

  • Metodi di fusione precoce, tardiva e ibrida
  • Meccanismi di attenzione nella fusione multimodale
  • Fusion per una percezione e un'interazione robuste

Applicazioni dell'IA multimodale

  • Interazione uomo-macchina multimodale
  • L'IA nei veicoli autonomi
  • Applicazioni sanitarie (ad es. diagnostica e diagnostica per immagini mediche)

Considerazioni e sfide etiche

  • Bias ed equità nei sistemi multimodali
  • Problemi di privacy con i dati multimodali
  • Progettazione etica e diffusione di sistemi di IA multimodali

Argomenti avanzati sull'IA multimodale

  • Trasformatori multimodali
  • Apprendimento auto-supervisionato nell'IA multimodale
  • Il futuro dell'apprendimento automatico multimodale

Riepilogo e prossime tappe

Requisiti

  • Conoscenza di base dell'intelligenza artificiale e dell'apprendimento automatico
  • Competenza nella programmazione Python
  • Familiarità con la gestione e la pre-elaborazione dei dati

Pubblico

  • Ricercatori di IA
  • Scienziati dei dati
  • Ingegneri dell'apprendimento automatico
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative