EURASIP Journal on Audio, Speech, and Music Processing

Fig. 2 | EURASIP Journal on Audio, Speech, and Music Processing

Fig. 2

From: Multi-encoder attention-based architectures for sound recognition with partial visual assistance

Fig. 2