nvidiaのGPUで6日間職人のカンを鍛えたFM音源職人さん(ResNet-36による逆FM音源の回帰)が、作ったピアノの音色がこちらになります http://www41050u.sakura.ne.jp/temp/8op_300000iter_piano.m4a …
-
-
-
Replying to @suzuki_ith
スペクトルを見る限り、鳴り初めの周波数はほぼ合ってるんだけど、倍音の減衰(上の方のオペレータのエンベロープ)が豪快に間違ってて、その結果押しっぱなしにしても柔らかい音に変化していかないトゲトゲしたピアノになってる。結局最後まで周波数変調が鬼門だった
2 replies 2 retweets 4 likes -
Replying to @fadis_
莫大な計算量を持ってしても難しいんですね... 教師信号って実際のピアノの音を音程の数だけ用意しているんですか?
1 reply 0 retweets 0 likes -
Replying to @suzuki_ith
FM音源のパラメータをランダムに生成したものとそれを鳴らしたスペクトル画像のペアを大量に生成して、後者を突っ込んだら前者が出てくるように学習して、出来上がったモデルに実際のピアノ音を突っ込んで、出てきたパラメータをFM音源に設定して演奏してる
1 reply 0 retweets 0 likes -
Replying to @fadis_
ああ、そうでした。ニューラルネット自体はピアノに特化しているわけではないんでしたね。ピアノに特化すればもっと近づけられるかもしれませんね。
1 reply 0 retweets 0 likes -
Replying to @suzuki_ith
それはありそう。あとこれだけの答えを3秒で出してくれるなら、少なくとも遺伝的FM音源を収束させるまでの世代数を劇的に減らせる初期値を作る用途では使えるんじゃないかなーと思ってる
1 reply 0 retweets 0 likes -
Replying to @fadis_
3秒!速いですね。 今は、現実には存在しない音色(ホワイトノイズのようなものも含む)まで学習しようとして無理が出ているという可能性がありますね。
1 reply 0 retweets 0 likes
Replying to @suzuki_ith
ある程度ノイズしか出てこない事が分かりきっている範囲は出ないように乱数の範囲と分布を制限はしたんだけど、多分に含まれてはいそう
4:27 AM - 16 Nov 2017
0 replies
0 retweets
1 like
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.