コンテンツは Robin Ranjit Singh Chauhan によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Robin Ranjit Singh Chauhan またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!
Player FMアプリでオフラインにしPlayer FMう!
Roman Ring
Manage episode 282009529 series 2536330
コンテンツは Robin Ranjit Singh Chauhan によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Robin Ranjit Singh Chauhan またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Roman Ring is a Research Engineer at DeepMind.
Featured References
Grandmaster level in StarCraft II using multi-agent reinforcement learning
Vinyals et al, 2019
Replicating DeepMind StarCraft II Reinforcement Learning Benchmark with Actor-Critic Methods
Roman Ring, 2018
Additional References
- Relational Deep Reinforcement Learning, Zambaldi et al 2018
- StarCraft II: A New Challenge for Reinforcement Learning, Vinyals et al 2017
- Safe and Efficient Off-Policy Reinforcement Learning [Retrace(λ)], Munos et al 2016
- Sample Efficient Actor-Critic with Experience Replay [ACER], Wang et al 2016
- IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures [IMPALA/V-trace], Espeholt et al 2018
53 つのエピソード
Manage episode 282009529 series 2536330
コンテンツは Robin Ranjit Singh Chauhan によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Robin Ranjit Singh Chauhan またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作権で保護された作品をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal。
Roman Ring is a Research Engineer at DeepMind.
Featured References
Grandmaster level in StarCraft II using multi-agent reinforcement learning
Vinyals et al, 2019
Replicating DeepMind StarCraft II Reinforcement Learning Benchmark with Actor-Critic Methods
Roman Ring, 2018
Additional References
- Relational Deep Reinforcement Learning, Zambaldi et al 2018
- StarCraft II: A New Challenge for Reinforcement Learning, Vinyals et al 2017
- Safe and Efficient Off-Policy Reinforcement Learning [Retrace(λ)], Munos et al 2016
- Sample Efficient Actor-Critic with Experience Replay [ACER], Wang et al 2016
- IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures [IMPALA/V-trace], Espeholt et al 2018
53 つのエピソード
すべてのエピソード
×プレーヤーFMへようこそ!
Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。