Durante il corso, discuteremo gli algoritmi più diffusi e conosciuti, sia da un punto di vista teorico che pratico, commentando e proponendo agli studenti codice in Python e PyTorch.
Grazie a questo corso, non solo lo studente avrà la possibilità di comprendere come sia possibile battere un campione mondiale di Go o scacchi utilizzando un computer, ma verrà anche descritto come le impressionanti capacità di conversazione di ChatGPT siano dovute all’utilizzo di algoritmi legati a questo mondo, quali ad esempio PPO e TRPO.
Esclusivamente in presenza (sede di Leonardo), in italiano e riservato ai soci AIM.
È necessario iscriversi tramite il seguente form, i posti sono limitati: https://forms.gle/tNs3uq9kH6timYhm9
Il calendario può essere consultato nella pagina Eventi.
Prerequisiti
Per una completa e dettagliata comprensione degli argomenti trattati, è consigliato (anche se non strettamente necessario) che lo studente soddisfi i seguenti prerequisiti:
-
Familiarità con Markov Chains e/o Markov Decision Processes (MDPs);
-
Familiarità con il mondo del Machine Learning e Deep Learning (reti neurali, backpropagation, activation functions). La conoscenza di Pytorch e Python, pur non essendo necessaria, è consigliata per meglio comprendere il materiale fornito: capire un algoritmo significa infatti comprendere anche la sua implementazione pratica, riflettendo sulle oramai sempre maggiori differenze tra pratica e teoria nel mondo dell’Intelligenza Artificiale;
-
Familiarità con concetti base di Probabilità, quali ad esempio valori attesi (condizionati e non), Monte Carlo estimation. Tali argomenti verranno trattati nuovamente durante il corso ed applicati alla materia, ma una conoscenza preliminare è utile per meglio comprendere la filosofia che si nasconde dietro ai più comuni e performanti algoritmi in letteratura.
Relatori
I relatori sono tutti ex-studenti di Ingegneria Matematica e soci onorari di AIM.
-
Riccardo Brioschi
-
MSc in Data Science @ EPFL
-
Research Student in Causal Inference & NLP
-
Incoming Research Scientist Intern @ Google Research, Zurich
-
-
Federico Arangath
-
MSc in Applied Mathematics (Minor: Machine Learning) @ ETH
-
Research Student in Reinforcement Learning
-
Teaching Assistant nel Corso “Probabilistic Artificial Intelligence”
-
-
Matteo Hessel
-
Research Engineer @ Google DeepMind
-
Lecturer per il corso di Reinforcement Learning @ UCL
-
Materiale
Durante il corso, presenteremo contenuti e materiale provenienti da risorse e fonti diverse, tra le quali notiamo:
-
Slides dal Corso “Reinforcement Learning” @ EPFL;
-
Slides e dispense dal Corso “Probabilistic Artificial Intelligence” @ ETH;
-
Reinforcement Learning: An Introduction (Sutton & Barto);
-
Papers by Google DeepMind, Stanford, OpenAI.