Gradient descent is just a convex optimizer. By definition, it can't solve hard problems. (Fitting the data means nothing; memorization is enough for that.) If GD is part of an AI system, the intelligence must be somewhere else.
-
-
Certainly. Huge search space: dataset, architecture, layers, parameters
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.