Why is it too hard? Thought Q learning will help
-
-
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
It can sometimes be tricky to give supervised examples to robots. Its easier if they “explore” the environment themselves. Don’t you think?
-
Rewards are supervision, which takes us back to my original tweet.
Keskustelun loppu
Uusi keskustelu -
-
-
... and that's when hierarchical reinforcement learning comes in.
-
We've been trying that for decades, but we're not there yet.
Keskustelun loppu
Uusi keskustelu -
-
-
Don't give up, Pedro. You'll work it out eventually. ;)
-
I was counting on you for that.
- Näytä vastaukset
Uusi keskustelu -
-
-
How about have the agent learn the context first and use that as a prior or condition to help in learning. Knowing whether it is the sea or land first, can tell you whether to swim or walk.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
What's your opinion on Decision Transformers?
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
I might disagree a little bit with the second part. Supervised learning is never closed loop, while reinforcement learning is by definition.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.