Reminds me of work of Poggio as well!https://arxiv.org/abs/1508.01084
-
-
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
I think this is excellent work. It shouldn’t come as big surprise though, given the quite obvious relationship between kernel machines (local optimization) and coordinate descent.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
I guess this is the best article I read this year.
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
Pedro, any opinion on this paper? It seems to be at odds with your conclusion somewhat:https://arxiv.org/abs/2011.14522
-
My results are for finite width, and the path kernel and the NTK are different things.
Keskustelun loppu
Uusi keskustelu -
-
-
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
-
-
You argue that this shows that nothing is "learned," but isn't the "path kernel" itself learned? It depends (highly non-trivially) on the training data...
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.