herumi

@herumi

光成滋生 MITSUNARI Shigeo/目指せ生涯ランニングプログラマ/x86最適化と数学と暗号が好き/サイボウズ・ラボ/日本応用数理学会JANT幹事/C++WG委員/ISEC専門委員/クラウドを支えるこれからの暗号技術

Joined December 2008

Tweets

You blocked @herumi

Are you sure you want to view these Tweets? Viewing Tweets won't unblock @herumi

  1. Aug 30

    Xbyakでデータアクセスするための方法をいくつか紹介しました。 Xbyakのノウハウ

    Undo
  2. Aug 25

    『耐量子計算機暗号』(縫田光司)面白い。4章同種写像暗号を紙と鉛筆持ちながら(たまに数式処理ソフトも使って)ちまちま読み始めてる。解説がとても詳細で文献もすごい。 p.136の(∂_Y E)(P)=-2β-a1 C' Z - a3の式は(Z=1)だから文脈的にZは無い方がよいかも。

    Undo
  3. Aug 20

    今月号(2020/9)の数学セミナーp.50の画像、最近は使わないようにしましょうという動きがあります。

    Undo
  4. Aug 19

    とある暗号系研究室のゼミで『クラウドを支えるこれからの暗号技術』()を最後まで輪講してくださった。途中から私も参加させていただき学生がつまると質問がこちらに飛んでくる、本の中で紹介してる論文の著者にツッコミをいただくというなかなかレアな経験をした。多謝。

    Undo
  5. Aug 13

    よくわからんが、でなくなった。

    Show this thread
    Undo
  6. Aug 13

    自分のアカウントが「注意: このアカウントは一時的に制限されています / このアカウントは不振な行為が確認されています」と表示されていた。なんでだろう。

    Show this thread
    Undo
  7. Aug 8

    Intro to SVE 富岳のA64FXを触ってみた の資料を公開しました。

    Undo
  8. Jul 6
    Undo
  9. Jun 27

    Intel AMXをざっくりと読んでみた。AVXを置き換えるものではない。現状bfloat16かint8の大きな行列の積のタイリング専用演算TMUL。TMMはタイルを表すレジスタ。tileloaddで部分行列読み込み、tdpbf16psなどで行列積の足し込みをする。行列パラメータはldtilecfgで設定

    Undo
  10. Jun 26

    XbyakにIntel AMX命令の追加pull reqが来たのだけど、TMMレジスタって何? 全然知らなかった。というか仕様が公開されたの昨日? え?

    Undo
  11. Jun 5

    Microsoft de:code 2020のMVPパーソナルスポンサーに採用していただけました(一番下)。ありがとうございます。

    Undo
  12. May 29

    AVX-512用の指数関数expをSVEに移植していて気がついたのだけどvscalefpsがとても便利だ。今まで(n + 127) << 23で2巾のビットパターンを作っていたのを1命令でできる。1割ほど速くなった。 SVEのfcaleは入力がint型なのでround()した結果を一度変換しないといけないのに注意。

    Undo
  13. May 29

    結果としてC++の中でAVX-512とSVEとが混在したコードを書ける(速度優先なら直接SVE、そうじゃないところは既存のAVX-512のまま)。まだ制約は多そうですがなんともアクロバティック。ほんの少しだけアドバイスで関わったので謝辞に入れて下さいました。ありがとうございます。

    Show this thread
    Undo
  14. May 29

    富士通がIntelの深層学習ライブラリをスパコンの富岳向けに移植しているのだけど、その過程で開発されてるXbyak_translator_aarch64が面白い。Xbyakで書かれたAVX-512用ソースが生成したx64バイトコードからArmv8-A SVE用バイトコードへの変換を全てJITで行う。

    Show this thread
    Undo
  15. May 23

    似たような問題としては2018年にLinuxのkernelのバージョンをあげたらJenkinsが5倍遅くなったり特定条件下で暗号ライブラリが2.7倍遅くなる現象に遭遇。当時はkernelオプションのptiやspectre_v2をoffにするかVMwareのバージョンをあげれば解決したのだけど結構悩んだ。

    Undo
  16. May 13

    My BLS signature library() supports the hash-to-curve function defined at . BLS署名ライブラリblsがEthereum 2.0 Phase 0で対応予定のdraft-irtf-cfrg-hash-to-curve-07のhash-to-curve関数をサポートしました。

    Undo
  17. May 11

    Cooper Lakeで利用可能なbfloat16の積和命令vdpbf16psの紹介記事を書いた。

    Undo
  18. May 7

    みなさん、いろいろ情報ありがとうございます。 Intelの最適化マニュアル3.4やB.5.7章にフロントエンドのストールの細かい話や調査方法が載ってるのですが、複雑です。元の問題はさんが解決されてるので時間を見て調べてみようと思います。

    Undo
  19. May 6

    N 16 char str[N]; memset(str, 0, N + 1); この例のコードならcppcheck, Visual Studioの/analyze, pvs-studioなどの静的解析ツールやclang-9で警告出ますね。

    Undo
  20. May 5

    先週と今週のゆるバグの資料です。 発表者集まればまた開催しましょう。

    Undo

Loading seems to be taking a while.

Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.

    You may also like

    ·