Torchのt7形式をJSONに変換するコードを含めておけば移植は楽になりそうです。ただやはりCUDAでないと遅いと思います。公開前にOpenBLAS+OpenMP版も作ってみたのですが、cuDNN版の20倍くらい時間かかります。
-
-
Replying to @ultraistter
@ultraistter もちろん、GPU処理の方がCPUより高速ですね。OpenCL版を作りたいと思って、アルゴリズムを分かるために先にnumpyとscipyだけに変更してみました。waifu2xのアルゴリズムは本当に単純で見事です。1 reply 0 retweets 0 likes
Replying to @ultraistter
@ultraistter 色々なプラットホームでも同じモデルデータを使いたいと思うけど、まだPython版の画質は少し低いです。floatの丸めや演算の順番が違うかもしれません。それをもっと調べます。
10:27 PM - 21 May 2015
0 replies
0 retweets
0 likes
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.