Detail publikace

Convolutional Neural Networks and X-Vector Embedding for DCASE2018 Acoustic Scene Classification Challenge

ZEINALI Hossein, BURGET Lukáš a ČERNOCKÝ Jan. Convolutional Neural Networks and X-Vector Embedding for DCASE2018 Acoustic Scene Classification Challenge. In: Proceedings of DCASE 2018 Workshop. Surrey: Tampere University of Technology, 2018, s. 1-5. ISBN 978-952-15-4262-6. Dostupné z: http://dcase.community/documents/workshop2018/proceedings/DCASE2018Workshop_Zeinali_149.pdf
Název česky
Konvoluční neuronová síť a X-vektor embedding pro DCASE2018 soutěž v klasifikaci akustického prostředí
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

V tomto příspěvku jsou popsána podání týmu Vysokého učení technického v Brně (VUT) k úkolu 1 (Klasifikace akustické scény, ASC) výzvy DCASE-2018. Rovněž je poskytována analýza různých metod v sadě žebříčků. Navrhovaný přístup je fúzí dvou různých topologií konvoluční neurální sítě (CNN). První z nich je společný dvourozměrný CNN, který se používá hlavně při klasifikaci obrázků. Druhým z nich je jednorozměrný CNN pro extrakci vložení audio segmentu pevné délky, tzv. X-vektory, který se také používá při zpracování řeči, zejména pro rozpoznávání mluvčích. Kromě různých topologií byly testovány dva typy funkcí: log mel-spectrogram a funkce CQT. Nakonec jsou výstupy různých systémů sloučeny pomocí jednoduchého výstupu zprůměrovaného v nejvýkonnějším systému. Naše příspěvky se umístily na třetím místě mezi 24 týmy v dílčím úkolu ASC A (task-1a).

Rok
2018
Strany
1-5
Sborník
Proceedings of DCASE 2018 Workshop
Konference
Detection and Classification of Acoustic Scenes and Events, Surrey, GB
ISBN
978-952-15-4262-6
Vydavatel
Tampere University of Technology
Místo
Surrey, GB
BibTeX
@INPROCEEDINGS{FITPUB11882,
   author = "Hossein Zeinali and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Convolutional Neural Networks and X-Vector Embedding for DCASE2018 Acoustic Scene Classification Challenge",
   pages = "1--5",
   booktitle = "Proceedings of DCASE 2018 Workshop",
   year = 2018,
   location = "Surrey, GB",
   publisher = "Tampere University of Technology",
   ISBN = "978-952-15-4262-6",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11882"
}
Nahoru