본문 바로가기

분류 전체보기18

[논문리뷰] (MPLight) Toward a thousand lights:Decentralized deep reinforcement learning for large-scale traffic signal control 이번에 리뷰할 논문은 교통공학 논문으로 AAAI 2020에 게재된 Toward a thousand lights:Decentralized deep reinforcement learning for large-scale traffic signal control 입니다. 자세한 내용은 원본 paper인 링크를 참조해주세요. Motivation Traffic congestion은 급격한 도시화로 인한 사회적 문제로 대두되고 있고, 이로 인해서 발생하는 이산화탄소와 같은 가스 발생량은 23%를 차지하고 있으며, 그 중 교통신호 시스템으로 인해 발생하는 배기가스는 40%에 달한다고 합니다. 이에 최근에는 효율적으로 제어하기 위해 Reinforcement Learning method를 적용하려는 시도들이 계속되고 있습.. 2021. 7. 17.
[논문 리뷰](MADDPG)Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments(NIPS 2017), 이번에는 NIPS 2017 Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments을 리뷰하려고 합니다. 자세한 내용은 논문을 참조해주세요 Introduction & Background 강화학습, RL이 발전함에 따라서 더 복잡한 task를 다루어야 했고, 단순한 작업이라고 착각했던 로봇의 관절 움직임 같은 것들을 제어하는 데에 있어서 Multi-agent RL을 통해서 진행하는데에 어려움이 있어왔습니다. Multi-agent reinforcement learning을 다루는데에 있어서 기존의 전통적인 방법들에는 다음과 같은 문제들이 있습니다. 1. Q-learning 기본적으로 Q-learning은 어떤 state $S$에서 act.. 2021. 6. 30.
[논문 리뷰] Regularizing Class-wise Predictions via Self-knowledge Distillation (CVPR 2020) 이번에는 CVPR 2020 poster session에 게재된 Regularizing Class-wise Predictions via Self-knowledge Distillation 논문을 리뷰하려고 합니다. 논문은 링크를 참조해주세요. Introduction Deep Neural Network(DNN)이 발전함에 따라서 scale이 커지고 깊어진 network들이 등장하였습니다. (DenseNet, ResNet, etc.) 이러한 parameter들의 증가는 overfitting이나 poor generalization 문제가 발생하기 쉽게 만들었습니다. 이러한 문제점들을 극복하기 위해서 사람들은 regularization method를 사용해왔습니다. 이를테면, early stopping, dropo.. 2021. 6. 22.
[논문 리뷰] Temporal Spike Sequence Learning via Backpropagation for Deep Spiking Neural Networks(NIPS 2020) 이하 글들은 (https://kdst.re.kr)에 게재한 글과 동일 저자가 작성한 글임을 밝힙니다. 이번 글에서는 NeurIPS 2020에 Spotlight로 선정된 “Temporal Spike Sequence Learning via Backpropagation for Deep Spiking Neural Networks” 논문을 소개해드리려고 합니다. 해당 논문의 자세한 내용은 링크와 github를 참고해주세요 Introduction - Spiking Neural Network(SNN)은 뇌의 행동을 모방하여 동작할 수 있는 모델로 기존 DNN(Deep Neural Network)와 달리 Time data 또한 영향을 끼치는 모델입니다. 최근 DNN의 많은 에너지 사용 대신 효율적으로 사용하는 뇌를 모.. 2021. 6. 22.