The entire if (e etc.) bit becomes a single PSHUFB outside the loop (not that you're looping in the first place with SSE), with the shuffle indices indexed by e. When you're targeting SSE4.1 as you are, you can fight dirty. :-)
Keep in mind what you can optimize out of the branch path. The majority of the if (sign) contents are the same for the low 16 bits of the result.
-
-
Kiitos. Käytämme tätä aikajanasi parantamiseen. KumoaKumoa
-
Lataaminen näyttää kestävän hetken.
Twitter saattaa olla ruuhkautunut tai ongelma on muuten hetkellinen. Yritä uudelleen tai käy Twitterin tilasivulla saadaksesi lisätietoja.