EURASIP Journal on Audio, Speech, and Music Processing

Fig. 4 | EURASIP Journal on Audio, Speech, and Music Processing

Fig. 4

From: Multi-encoder attention-based architectures for sound recognition with partial visual assistance

Fig. 4