Stuart Russell argues at Asilomar for treating RL "rewards" as information about an unknown utility function:https://www.youtube.com/watch?v=pARXQnX6QS8 …
0 replies
1 proslijeđeni tweet
2 korisnika označavaju da im se sviđa
Čini se da učitavanje traje već neko vrijeme.
Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.