"Can Language Models be Too Big?"https://twitter.com/pmddomingos/status/1473394178474209282 …
-
-
Vastauksena käyttäjälle @yoavgo
Why? Who cares about nr of parameters. Power consumption seems a more reasonable metric to cut down on.
8 vastausta 1 uudelleentwiittaus 52 tykkäystä
Vastauksena käyttäjille @wellingmax ja @yoavgo
Cut both. Fewer parameters means less memory and processing time, both of which are important regardless of power consumption.
13.14 - 26. jouluk. 2021
0 vastausta
0 uudelleentwiittausta
1 tykkäys
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.