DeepMind's research direction for scalable agent alignment via reward modeling. Paper: http://ow.ly/T5nH30mGMGl
09:11 - 20. stu 2018.
0 replies
13 proslijeđenih tweetova
24 korisnika označavaju da im se sviđa
Čini se da učitavanje traje već neko vrijeme.
Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.