From: AAM: a dataset of Artificial Audio Multitracks for diverse music information retrieval tasks
CNN-GrillSchlüter |
C(8,6)[16]Â p(3,6) |
C(6,3)[32] |
FÂ DÂ \(\mathrm {R_s}\)[128]Â DÂ \(\mathrm {R_s}[1]\) |
CNN-AlexNet |
C(11,11)[32]Â P(1,2)Â d |
C(5,5)[64]Â P(1,2)Â d |
C(3,3)[128]Â C(3,3)[128]Â C(3,3)[128]Â GÂ d |
\(\mathrm {R_r}\)[1024]Â DÂ \(\mathrm {R_s}\)[9] |
CNN-Han |
C(3,3)[32]Â C(3,3)[32]Â P(1,2)Â d |
C(3,3)[64]Â C(3,3)[64]Â P(1,2)Â d |
C(3,3)[128]Â C(3,3)[128]Â P(2,2)Â d |
C(3,3)[256]Â C(3,3)[256]Â G |
\(\mathrm {R_r}\)[1024]Â DÂ \(\mathrm {R_s}\)[9] |
CNN-VGG16 |
C(3,3)[32]Â C(3,3)[32]Â P(1,2)Â d |
C(3,3)[64]Â C(3,3)[64]Â P(1,2)Â d |
C(3,3)[128]Â C(3,3)[128]Â C(3,3)[128]Â P(2,4)Â d |
C(3,3)[256]Â C(3,3)[256]Â C(3,3)[256]Â GÂ d |
\(\mathrm {R_r}\)[1024]Â DÂ \(\mathrm {R_s}\)[9] |