gcc(少なくとも4.7まで それ以降は未確認)のベクタエクステンションはコードが要求した要素数とプロセッサのSIMDレジスタの幅が一致していると確かに速いんだけど、そうでない場合1要素づつ計算した方が速いような酷いコードを吐くんだよな…
-
-
@enogu ARMでSIMD命令とだけ言った場合、32bitレジスタを8bit 4つとみなす命令セットのことで、それとは別にIntelが関わってた時代にIWMMXっていう拡張命令セットがあって、 - 2 more replies
New conversation
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.