gcc(少なくとも4.7まで それ以降は未確認)のベクタエクステンションはコードが要求した要素数とプロセッサのSIMDレジスタの幅が一致していると確かに速いんだけど、そうでない場合1要素づつ計算した方が速いような酷いコードを吐くんだよな…
-
-
@fadis_ あれにはSIMDは実装されていなかったような。逆にThumbがあるけどw -
@enogu ARMはむしろ中途半端なSIMD(およびSIMDもどき)が乱立しててx86よりカオス - 4 more replies
New conversation -
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.