Tweetovi
- Tweetovi, trenutna stranica.
- Tweetovi i odgovori
- Medijski sadržaj
Blokirali ste korisnika/cu @kngwyu
Jeste li sigurni da želite vidjeti te tweetove? Time nećete deblokirati korisnika/cu @kngwyu
-
実験でやらかしてICMLの投稿を取り下げることになったので、わりと落ちこんでいたのだけれど...... いま考えると、あんな惨状でよくもまあ、論文をまとめられると思っていたなあ、と思う... もっと余裕を持って実験スケジュールを立てないと...
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
大学、研究に真面目に取り組んでいても何一ついいことがないしむしろ単位を落としやすくなるのが厳しい(落とした)
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
Implemented Termination Critic
https://github.com/kngwyu/Rainy/pull/57 …pic.twitter.com/Qz3LDcVAt4Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
DQNはバッチ大きくすると性能落ちるけど TD3とかSACは大丈夫なのか... https://github.com/kngwyu/Rainy/pull/54 …pic.twitter.com/3H4F0u9PFo
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
信じられん...
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
Yuji Kanagawa proslijedio/la je Tweet
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model https://arxiv.org/abs/1911.08265
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
報酬がベルヌーイ分布のGridWorld Q学習というかSingle pathメソッドだと、εを大きくしないとうまく値が伝播していかない...ように見えるけどpic.twitter.com/nyU4RifRet
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
https://github.com/kngwyu/rlpy3/pull/32 … DeepSeaを自分のコードベースに追加してみた bsuiteにもあるから、まあビジュアライザがついてるだけなんだけど...pic.twitter.com/QihEwwuhs5
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi
-
https://github.com/openai/gym/pull/1455 … グレー画像の取得が速そうだから使いたいけど、使い方が... baselinesはNoopReset+FireReset+MaxAndSkip +TimeLimit+Monitor+EpisodicLife +WarpFrame+ClipReward+FrameStack(多分)だけど、これは NoopReset+FireReset+MaxAndSkip +EpisodicLife+WarpFrameに相当するのかな
Prikaži ovu nitHvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
https://github.com/kngwyu/Rainy/pull/37 … (自分の研究と関係ないけど)SAC実装した なんかQ(s, a) - αlogπって何回見ても違和感があるな... あとActorが正規分布+tanhなのでlogπの計算が面倒
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi -
Randomized Prior Functions for Deep Reinforcement Learning に付属するコードのPyTorch版を公開しました https://github.com/kngwyu/rpf-pytorch … なんかなんでうまくいくかとか正直よくわかってないですけど...pic.twitter.com/PwYA0gZfQL
Hvala. Twitter će to iskoristiti za poboljšanje vaše vremenske crte. PoništiPoništi
Čini se da učitavanje traje već neko vrijeme.
Twitter je možda preopterećen ili ima kratkotrajnih poteškoća u radu. Pokušajte ponovno ili potražite dodatne informacije u odjeljku Status Twittera.
・
・