@kmt_t x86_64なのでデフォルトの浮動小数演算器はSSEのはずなんですよ。単純なループの場合コンパイラが積和命令を使うバイナリを吐かなかった可能性も含めて、アセンブリで見ないと原因はわからんですね ._.
2コアのさくらVPS上でViennaCLの内積ベンチマークをシングルスレッドのループで安直に計算した場合(A)と、ViennaCL→Portable OpenCL経由で計算した場合(B)のパフォーマンスの差がB/A≒4.16かー
-
-
This Tweet is unavailable.
-
- 1 more reply
-
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.