본문 바로가기

RL2

[논문리뷰] (MPLight) Toward a thousand lights:Decentralized deep reinforcement learning for large-scale traffic signal control 이번에 리뷰할 논문은 교통공학 논문으로 AAAI 2020에 게재된 Toward a thousand lights:Decentralized deep reinforcement learning for large-scale traffic signal control 입니다. 자세한 내용은 원본 paper인 링크를 참조해주세요. Motivation Traffic congestion은 급격한 도시화로 인한 사회적 문제로 대두되고 있고, 이로 인해서 발생하는 이산화탄소와 같은 가스 발생량은 23%를 차지하고 있으며, 그 중 교통신호 시스템으로 인해 발생하는 배기가스는 40%에 달한다고 합니다. 이에 최근에는 효율적으로 제어하기 위해 Reinforcement Learning method를 적용하려는 시도들이 계속되고 있습.. 2021. 7. 17.
[논문 리뷰](MADDPG)Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments(NIPS 2017), 이번에는 NIPS 2017 Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments을 리뷰하려고 합니다. 자세한 내용은 논문을 참조해주세요 Introduction & Background 강화학습, RL이 발전함에 따라서 더 복잡한 task를 다루어야 했고, 단순한 작업이라고 착각했던 로봇의 관절 움직임 같은 것들을 제어하는 데에 있어서 Multi-agent RL을 통해서 진행하는데에 어려움이 있어왔습니다. Multi-agent reinforcement learning을 다루는데에 있어서 기존의 전통적인 방법들에는 다음과 같은 문제들이 있습니다. 1. Q-learning 기본적으로 Q-learning은 어떤 state $S$에서 act.. 2021. 6. 30.