Alignment Newsletter #79: Recursive reward modeling as an alignment technique integrated with deep RL - https://mailchi.mp/8d9e3703fbde/an-79-recursive-reward-modeling-as-an-alignment-technique-integrated-with-deep-rl …
09:59 - 1. sij 2020.
0 replies
2 proslijeđena tweeta
10 korisnika označava da im se sviđa
Čini se da učitavanje traje već neko vrijeme.
Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.