some agents trained with reinforcement learning at OpenAI already did this https://openai.com/blog/emergent-tool-use/ …
-
-
- Keskustelun loppu
Uusi keskustelu -
-
-
This is exactly what reinforcement learning will do.
-
If he do, it will be considered a bug
Keskustelun loppu
Uusi keskustelu -
-
-
RL often ends up 'solving' the specified problem in unexpected, and often undesirable, ways. This looks a lot like one of my RL experiments.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
Name it the Captain Kirk. Kobayashi maru!
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
When will we be able to tell?
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
It's a property of the environment. RL algorithms are pretty good at exploiting buggy environments, e.g. simplified physics engines or game economies..
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
RL does it :)
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
Im literally laughing here.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.