İTÜ Big Data and Business Analytics Master of Science Programme

Course Objectives

Topics

Reinforcement Learning Foundations
Multi-Armed Bandit
Markov Decision Processes
Value Iteration – Policy Iteration
Monte Carlo Methods
Q-Learning, SARSA
Eligibility Traces
Exploration vs. Exploitation
Function Approximation: Stochastic-gradient, Semi-gradient TD Update, Least-squares TD
Value-based Deep RL: Q-network
Policy-based Deep RL: REINFORCE