Preskoči na sadržaj
Korištenjem servisa na Twitteru pristajete na korištenje kolačića. Twitter i partneri rade globalno te koriste kolačiće za analize, personalizaciju i oglase.

Za najbolje sučelje na Twitteru koristite Microsoft Edge ili instalirajte aplikaciju Twitter iz trgovine Microsoft Store.

  • Naslovnica Naslovnica Naslovnica, trenutna stranica.
  • O Twitteru

Spremljena pretraživanja

  • obriši
  • U ovom razgovoru
    Ovjeren akauntZaštićeni tweetovi @
Predloženi korisnici
  • Ovjeren akauntZaštićeni tweetovi @
  • Ovjeren akauntZaštićeni tweetovi @
  • Jezik: Hrvatski
    • Bahasa Indonesia
    • Bahasa Melayu
    • Català
    • Čeština
    • Dansk
    • Deutsch
    • English
    • English UK
    • Español
    • Filipino
    • Français
    • Italiano
    • Magyar
    • Nederlands
    • Norsk
    • Polski
    • Português
    • Română
    • Slovenčina
    • Suomi
    • Svenska
    • Tiếng Việt
    • Türkçe
    • Български език
    • Русский
    • Српски
    • Українська мова
    • Ελληνικά
    • עִבְרִית
    • العربية
    • فارسی
    • मराठी
    • हिन्दी
    • বাংলা
    • ગુજરાતી
    • தமிழ்
    • ಕನ್ನಡ
    • ภาษาไทย
    • 한국어
    • 日本語
    • 简体中文
    • 繁體中文
  • Imate račun? Prijava
    Imate račun?
    · Zaboravili ste lozinku?

    Novi ste na Twitteru?
    Registrirajte se
Profil korisnika/ce IanOsband
Ian Osband
Ian Osband
Ian Osband
@IanOsband

Tweets

Ian Osband

@IanOsband

Research scientist at DeepMind working on decision making under uncertainty. All tweets and views are mine alone.

iosband.github.io
Vrijeme pridruživanja: srpanj 2012.

Tweets

  • © 2020 Twitter
  • O Twitteru
  • Centar za pomoć
  • Uvjeti
  • Pravila o privatnosti
  • Imprint
  • Kolačići
  • Informacije o oglasima
Odbaci
Prethodni
Sljedeće

Idite na profil osobe

Spremljena pretraživanja

  • obriši
  • U ovom razgovoru
    Ovjeren akauntZaštićeni tweetovi @
Predloženi korisnici
  • Ovjeren akauntZaštićeni tweetovi @
  • Ovjeren akauntZaštićeni tweetovi @

Odjava

Blokiraj

  • Objavi Tweet s lokacijom

    U tweetove putem weba ili aplikacija drugih proizvođača možete dodati podatke o lokaciji, kao što su grad ili točna lokacija. Povijest lokacija tweetova uvijek možete izbrisati. Saznajte više

    Vaši popisi

    Izradi novi popis


    Manje od 100 znakova, neobavezno

    Privatnost

    Kopiraj vezu u tweet

    Ugradi ovaj Tweet

    Embed this Video

    Dodajte ovaj Tweet na svoje web-mjesto kopiranjem koda u nastavku. Saznajte više

    Dodajte ovaj videozapis na svoje web-mjesto kopiranjem koda u nastavku. Saznajte više

    Hm, došlo je do problema prilikom povezivanja s poslužiteljem.

    Integracijom Twitterova sadržaja u svoje web-mjesto ili aplikaciju prihvaćate Twitterov Ugovor za programere i Pravila za programere.

    Pregled

    Razlog prikaza oglasa

    Prijavi se na Twitter

    · Zaboravili ste lozinku?
    Nemate račun? Registrirajte se »

    Prijavite se na Twitter

    Niste na Twitteru? Registrirajte se, uključite se u stvari koje vas zanimaju, i dobivajte promjene čim se dogode.

    Registrirajte se
    Imate račun? Prijava »

    Dvosmjerni (slanje i primanje) kratki kodovi:

    Država Kod Samo za korisnike
    Sjedinjene Američke Države 40404 (bilo koje)
    Kanada 21212 (bilo koje)
    Ujedinjeno Kraljevstvo 86444 Vodafone, Orange, 3, O2
    Brazil 40404 Nextel, TIM
    Haiti 40404 Digicel, Voila
    Irska 51210 Vodafone, O2
    Indija 53000 Bharti Airtel, Videocon, Reliance
    Indonezija 89887 AXIS, 3, Telkomsel, Indosat, XL Axiata
    Italija 4880804 Wind
    3424486444 Vodafone
    » Pogledajte SMS kratke šifre za druge zemlje

    Potvrda

     

    Dobro došli kući!

    Vremenska crta mjesto je na kojem ćete provesti najviše vremena i bez odgode dobivati novosti o svemu što vam je važno.

    Tweetovi vam ne valjaju?

    Prijeđite pokazivačem preko slike profila pa kliknite gumb Pratim da biste prestali pratiti neki račun.

    Kažite mnogo uz malo riječi

    Kada vidite Tweet koji volite, dodirnite srce – to osobi koja ga je napisala daje do znanja da vam se sviđa.

    Proširite glas

    Najbolji je način da podijelite nečiji Tweet s osobama koje vas prate prosljeđivanje. Dodirnite ikonu da biste smjesta poslali.

    Pridruži se razgovoru

    Pomoću odgovora dodajte sve što mislite o nekom tweetu. Pronađite temu koja vam je važna i uključite se.

    Saznajte najnovije vijesti

    Bez odgode pogledajte o čemu ljudi razgovaraju.

    Pratite više onoga što vam se sviđa

    Pratite više računa da biste dobivali novosti o temama do kojih vam je stalo.

    Saznajte što se događa

    Bez odgode pogledajte najnovije razgovore o bilo kojoj temi.

    Ne propustite nijedan aktualni događaj

    Bez odgode pratite kako se razvijaju događaji koje pratite.

    Ian Osband‏ @IanOsband 21. pro 2019.
    • Prijavi Tweet

    Have you heard of "RL as Inference"? https://arxiv.org/pdf/1805.00909.pdf … ... you might be surprised that this framing completely ignores the role of uncertainty! (confusing, since it talks a lot about "posteriors") Our #ICLR spotlight tries to make sense of this: https://openreview.net/forum?id=S1xitgHtvS …pic.twitter.com/tOxMnBiRvO

    06:29 - 21. pro 2019.
    • 73 proslijeđena tweeta
    • 334 oznake „sviđa mi se”
    • Jorge C Takato Horii Ed Henry TMats yoichi_t MoneySense Collective Christina Ji Yuta Tsuboi ANSHUK UPPAL
    7 replies 73 proslijeđena tweeta 334 korisnika označavaju da im se sviđa
      1. Novi razgovor
      2. andrea panizza‏ @unsorsodicorda 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @IanOsband

        Interesting! Is this related to BAMDP? cc @luisa_zintgraf @shimon8282 @yaringal

        1 reply 1 proslijeđeni tweet 2 korisnika označavaju da im se sviđa
      3. Ian Osband‏ @IanOsband 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisnicima @unsorsodicorda @luisa_zintgraf i sljedećem broju korisnika:

        Yes! I think this paper will be very helpful to read if you typically think of "Bayesian" RL as something separate from the "usual" problem... On some level, it's just choosing between an average-case or worst-case loss!pic.twitter.com/QsM9qUQGYr

        1 reply 1 proslijeđeni tweet 9 korisnika označava da im se sviđa
      4. Još 4 druga odgovora
      1. Novi razgovor
      2. Csaba Szepesvari‏ @CsabaSzepesvari 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @IanOsband

        You mean that the way probabilistic inference is described in prior works, the inference is used for planning and not learning? I'd think one can fix this. My bigger complaint for this literature is that they do not even try to address compute cost, not even in simple cases.

        0 proslijeđenih tweetova 4 korisnika označavaju da im se sviđa
      3. Ian Osband‏ @IanOsband 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @CsabaSzepesvari

        @bodonoghue85 may have some more thoughts, but I don't think we've worked through this yet! I got into this because of a genuine confusion at conferences where people would talk about "sampling from the posterior" in RL.. But their algorithm didn't seem like Thompson sampling!

        1 proslijeđeni tweet 5 korisnika označava da im se sviđa
      4. Još 12 drugih odgovora
      1. Novi razgovor
      2. David Barber‏ @davidobarber 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @IanOsband

        Separately, in a non-Bayesian approach, there are fast ways to perform probabilstic RL inference here https://arxiv.org/abs/1202.3720 . Futhermore, how probabilistic inference RL relates to policy gradients is explored in https://papers.nips.cc/paper/4576-a-unifying-perspective-of-parametric-policy-search-methods-for-markov-decision-processes … and http://www.jmlr.org/papers/volume17/15-414/15-414.pdf …

        1 reply 2 proslijeđena tweeta 15 korisnika označava da im se sviđa
      3. Marc Deisenroth  🏳️‍🌈‏ @mpd37 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisnicima @davidobarber @IanOsband

        I also like the work by Marc Toussaint https://dl.acm.org/citation.cfm?id=1553508 …

        1 reply 1 proslijeđeni tweet 8 korisnika označava da im se sviđa
      4. Još 2 druga odgovora
      1. Novi razgovor
      2. euge ~  🔥 🧙‍♂️ 🦠 🍍 🌿‏ @battagliaem 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisnicima @IanOsband @Aelkus

        Is it related to probability collectives?

        1 reply 0 proslijeđenih tweetova 1 korisnik označava da mu se sviđa
      3. Ian Osband‏ @IanOsband 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisnicima @battagliaem @Aelkus

        Maybe... But I don't know what that is!

        0 replies 0 proslijeđenih tweetova 0 korisnika označava da im se sviđa
      4. Kraj razgovora
      1. Novi razgovor
      2. David Krueger‏ @DavidSKrueger 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @IanOsband

        Does this basically come down to aleatoric vs. epistemic uncertainty? (with RL as Inference ignoring the distinction?)

        1 reply 0 proslijeđenih tweetova 1 korisnik označava da mu se sviđa
      3. Ian Osband‏ @IanOsband 21. pro 2019.
        • Prijavi Tweet
        Odgovor korisniku/ci @DavidSKrueger

        It's slightly to do with that... But I would say the issue is "RL as Inference" introduces this auxiliary notion of "probability of optimal" that has nothing to do with *either* aleatoric or epistemic uncertainty. It's more like a "dummy variable" that reframes policy gradient

        1 reply 0 proslijeđenih tweetova 2 korisnika označavaju da im se sviđa
      4. Još 1 odgovor

    Čini se da učitavanje traje već neko vrijeme.

    Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.

      Sponzorirani tweet

      false

      • © 2020 Twitter
      • O Twitteru
      • Centar za pomoć
      • Uvjeti
      • Pravila o privatnosti
      • Imprint
      • Kolačići
      • Informacije o oglasima