Reference Learning and Control as Probabilistic Inference: Tutorial and Review 논문 리뷰

리뷰 작성: 김장원 (jangwonkim@postech.ac.kr)

논문 리뷰 슬라이드 작업본입니다.

Multi-Agent Constrained Policy Optimisation(MACPO, MAPPO-Lagrangian) 논문리뷰 (0)	2024.02.19
Planning with Goal-Conditioned Policies (2019) 논문 리뷰 (3)	2023.05.14
Variational Adversarial Imitation Learning (VAIL) 논문리뷰 (0)	2022.02.26
Trust Region Policy Optimization 논문 리뷰 (1)	2022.02.22
Natural Policy Gradient 논문 리뷰 (0)	2022.02.14

RLwithMe