昨日のCUDAの続報。900万要素の配列の平均とSDを求める。CPUで53msec, GPUの場合、CUDAの初期化とメモリ確保に35msec, 転送に20msec, 計算に 4.5msecとかえって遅い。しかし二回ループさせると、初期化が不要になるので大逆転である。
-
-
@fadis_ どうやらそのようです。初期化時間がもったいないので、1プロセスで複数のデータセットを連続的に処理できるように変更して対処します。ありがとうございました。Thanks. Twitter will use this to make your timeline better. UndoUndo
-
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.