Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione a Reinforcement Learning
- Panoramica dell'apprendimento per rinforzo e delle sue applicazioni
- Differenze tra apprendimento supervisionato, non supervisionato e per rinforzo
- Concetti chiave: agente, ambiente, ricompense e politica
Processi decisionali di Markov (MDP)
- Comprendere gli stati, le azioni, le ricompense e le transizioni di stato
- Funzioni di valore e l'equazione di Bellman
- Programmazione dinamica per la risoluzione di MDP
Algoritmi RL di base
- Metodi tabulari: Q-Learning e SARSA
- Metodi basati su policy: algoritmo REINFORCE
- Quadri attori-critici e loro applicazioni
Profondo Reinforcement Learning
- Introduzione a Deep Q-Networks (DQN)
- Replay dell'esperienza e reti target
- Gradienti di policy e metodi RL profondi avanzati
Framework e strumenti RL
- Introduzione a OpenAI Palestra e altri ambienti RL
- Utilizzo di PyTorch o TensorFlow per lo sviluppo di modelli RL
- Formazione, test e benchmarking degli agenti RL
Sfide in RL
- Bilanciare esplorazione e valorizzazione nella formazione
- Gestire ricompense scarse e problemi di assegnazione dei crediti
- ScalaProblemi di bilità e computazionalità nella RL
Hands-On Activities
- Implementazione di algoritmi Q-Learning e SARSA da zero
- Addestrare un agente basato su DQN a giocare a un semplice gioco in OpenAI Palestra
- Ottimizzazione dei modelli RL per migliorare le prestazioni in ambienti personalizzati
Riepilogo e passaggi successivi
Requisiti
- Profonda comprensione dei principi e degli algoritmi di apprendimento automatico
- Competenza nella programmazione Python
- Familiarità con le reti neurali e i framework di deep learning
Pubblico
- Ingegneri dell'apprendimento automatico
- Specialisti dell'intelligenza artificiale
14 ore
Recensioni (1)
Formatore che risponde alle domande in tempo reale.
Adrian
Corso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traduzione automatica