Gradient descent is just a convex optimizer. By definition, it can't solve hard problems. (Fitting the data means nothing; memorization is enough for that.) If GD is part of an AI system, the intelligence must be somewhere else.
-
Näytä lisää vastauksia, myös mahdollisesti häiritsevää aineistoa sisältäviä
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.