The problem with reinforcement learning is that if rewards are sparse and delayed, it's too hard; and if they're not, supervised learning will do.
-
-
Vastauksena käyttäjälle @pmddomingos
Not if the environment is changing.
1 vastaus 0 uudelleentwiittausta 0 tykkäystä
Vastauksena käyttäjälle @nmaquaire
That’s even harder for RL, and an established subfield of supervised learning (a.k.a. concept drift).
11.00 - 7. syysk. 2021
0 vastausta
0 uudelleentwiittausta
1 tykkäys
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.